将国家标准全文公开系统公布的 GB/T 文档保存为 mhtml 文件,使用此工具可转换为 pdf。
使用 python3 编译安装。
python3 setup.py bdist_wheel
pip3 install dist/mhtml_to_pdf_converter-0.1-py3-none-any.whl
mhtml-to-pdf -m /path/to/gbt-mhtml.mhtml -o /path/to/gbt-mhtml.pdf
mhtml-to-pdf -m /path/to/gbt-mhtml.mhtml -d /path/to/ # 输出 /path/to/gbt-mhtml.pdf
mhtml-to-pdf -m /path/to/gbt-mhtml.mhtml -d /path/to/ -n newfile.pdf # 输出 /path/to/newfile.pdf
因为 GB/T 文档原型是这样的: