TranslateGLM

TranslateGLM 是一个基于 ChatGLM2-6B 模型微调的中英文翻译器，可以实现高质量的双向翻译。

使用265万个样本进行了 P-Tuning v2 的微调，微调的样本的例子可以参考 validation_file.txt 中的内容。

微调过后的模型，在可以很好的充当翻译器的同时仍然可以正常的进行聊天对话。

ChatGLM2-6B 是一个开源的、支持中英问答的对话语言模型，基于 General Language Model (GLM) 架构，具有约 60 亿参数。

功能

要运行本项目，你需要安装以下软件依赖：

yarn
cd ./glm
pip install -r requirements.txt
pip install rouge_chinese nltk jieba datasets

你可以通过如下命令启动翻译器的OpenAI格式的API：

python ./glm/openai_api.py

你可以通过如下命令启动翻译器的前端UI： 启动UI前必须先启动上面的API

yarn start

在浏览器中访问 http://localhost:3000/ ，然后输入你想要翻译的文本即可自动翻译。

你可以通过如下命令启动传统的web demo对话，但只能进行普通对话：

python ./glm/web_demo.py

你可以通过如上面的“OpenAI格式的API”进行正常对话，使用方式和普通的调用方法无异：

python ./glm/openai_api.py

翻译UI暂时不支持指定输入语言，输入的语言的自动判断是中文还是英文，然后自动翻译成另一种语言。

翻译UI可以指定翻译结果的随机性，分为保守、平衡、灵活和发散。

分别代表着temperature从低(保守)到高(创意)，对于较复杂的语法，更高的temperature更能准确的翻译，但也可能导致他误解某些含义。

把鼠标悬停在翻译结果上，可以查看翻译的原文以及原文在输入中的位置。

2023-8-2 (alpha-2)