/pdfkp

一个pdf关键字所在文段提取器

Primary LanguagePythonApache License 2.0Apache-2.0

pdfkp

一个pdf关键字所在文段提取器,不过得先用pdf2htmlEX把pdf转成html再分析