一个pdf关键字所在文段提取器
Primary LanguagePythonApache License 2.0Apache-2.0
一个pdf关键字所在文段提取器,不过得先用pdf2htmlEX把pdf转成html再分析