/TextCleaner

异常文本处理,移除异常空格、换行,英文标点符号替换成中文标点,去除乱码,全角字符转半角等

Primary LanguagePython

TextCleaner

异常文本(中文)处理,实现剪切板读取文本,处理后再写入剪切板。

v 1.0:移除异常空格、换行,英文标点符号替换成中文标点,去除乱码字符,全角字符转半角。

介绍

在阅读PDF时,尤其是年代久远的PDF,容易出现类似如下情况,数字和英文成了全角字符,莫名空格和换行,非常抓狂。

2001年9月17日,世 贸 组 织 中 国 工 作 组 第18次 会 议 通 过 了 中 国 入 世 议 定 书 及 附 件 和 中 国 工 作 组 报 告 书,标 志 着 我 国 加 入 世 贸 组 织 的 谈 判 全 部 结 束; 2001年11月10日,在 卡 塔 尔 首 都 多 哈 举 行 的 世 界 贸 易 组 织(WTO)第 四 届 部 长 级 会 议 审 议 并 通 过 了 中 国 加 入 世 界 贸 易 组 织 的 决 定。同 年12月11日,中 国 正 式 加 入 WTO, 成 为其第143个成员.

尝试用 python 脚本结合 mac 的 automator 应用, 实现快捷键,一键处理文本。

macbook使用automator实现文文本自动化处理_chengzic1999的博客-CSDN博客

环境

Python 3.9.10

pip install -r requirements.txt