用 Python 和 ChatGPT API 实现的 HTML 网页翻译工具,可以将本地 HTML 网页批量翻译成中文双语对照。
A HTML webpage translation tool implemented with Python and ChatGPT API, which can translate local HTML webpages in batch into bilingual versions in Chinese and English.
参考 Minja 的将外文电子书翻译成双语对照版本,并在任何设备上阅读 和 Github 上的 ChatGPT bilingual_book_maker 项目,我实现了通过 Python 使用 chatGPT API 来制作双语网页/电子书。
- 中断后可以继续翻译(图3)
- 显示翻译进度、花费时间和预计时间(图4)
结合 Minja 介绍的保存网页、拆 epub 电子书、在 Kindle 阅读网页等(见 UNTAG 网站),我们阅读的脚步再一次向前迈进🚀
- 双语电子书项目功能太复杂了
- 市面上还没有 chatGPT 翻译网页
- 参考 Minja 的方案网页/电子书翻译兼得
- 学习使用 ChatGPT API
使用这个脚本需要电脑上可以运行 Python 脚本,并安装 BeautifulSoup 包,剩下的交给 ChatGPT。
- 保存我编写的 Python 脚本到任意目录,例如 test
- 在这个 test 目录下,创建 2 个文本文件
api_key.txt
里面保存你的 api_key(只输入 api_key 的内容即可)chatGPT_prompt.txt
里面保存你的 prompt(可以在我的基础上根据自己的需要微调)
- 创建一个名为
translatable
的文件夹,将要翻译的 HTML 文件放进去(可以包含子文件夹,在子文件夹中放 HTML 文件,用来区分不同的项目一起制作) - 运行 Python 脚本,即可开始翻译并制作双语对照 HTML
- 翻译结果会暂存在
test/translated.json
。单个 HTML 文件翻译完成后,会创建一个 HTML文件名_cn.html 文件并将翻译结果一起写入。 - 翻译进度会暂存在
test/index.json
,用来记录翻译到哪一个文件。 - 翻译时所有输出保存在
test/log.txt
文件中,作为调试的参考 - 翻译中断时再次运行脚本即可。
- 翻译结束后暂存文件都会删除(
log.txt
除外,不需要的话需手动删除)。
- 翻译结果会暂存在
Translate the HTML webpage into simplified Chinese, and return the translated HTML code. Translate in the style of Python programming books. Do not translate the text wrapped in
<code>
tags. If the text cannot be translated, return the original text as is. Do not add any additional text to the translation. Do not translate person's name. The HTML webpage to be translated is:
- token 的使用情况
- 时间花费情况
- 工作原理