Moved to https://github.com/wenerme/tools
English | 中文 |
---|
Sougou scel dict - 搜狗 scel 词库工具
- Scel to Protobuf
- Easy to use in web
- Easy to use in other language
- No need to parse
- Useful
scel
commandinfo
- Info about dictconv
- Conversion between format- Optional remove ext data
- 10 b/word
- Optional optimized ext data
- Trime zero
- 10 b/word -> 2-4 b/word
- Optional remove common pinyin table
- Optional remove ext data
- Provide typescript scel reader
Opt. | 全国省市区县地名.scel | 76K |
---|---|---|
N/A | out.pb | 73K |
-oe | out.pb | 53K |
-ee | out.pb | 43K |
-eP | out.pb | 71K |
-oe -eP | out.pb | 50K |
- 将 Scel 转换为 Protobuf 文件格式
- 简化 web 使用
- 简化其它语言使用
- 不需要解析
- 非常有用的
scel
命令行工具info
- 词库信息conv
- 格式转换- 可移除扩展数据
- 每个词有 10 byte 的扩展数据
- 可优化扩展数据
- 移除尾 0
- 10 b/word -> 2-4 b/word
- 可移除常用的拼音表
- 可移除扩展数据
- 提供 typescript 的 scel 解析器
# Install
go get github.com/wenerme/scel/cmd/scel
# Info
scel info 全国省市区县地名.scel
# file: 全国省市区县地名.scel
# name: 全国省市区县地名
# type: 单位机构名
# desc: 比搜狗自带的还全!!!
# e.g.: 澳门 重庆 福建 河北 黑龙江 江西
# Conversion
# Convert scel to pb without `ext` data
scel conv -E 全国省市区县地名.scel city.pb
# Build js
yarn build
# Generate pb
protoc --go_out=plugins=grpc,import_path=telattr:$HOME/go/src/ *.proto