Pinned Repositories
addrseg
中文地址切分,及地址补全
ansj_seg
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
autospider
自动化爬虫
bigram
N-gram --bigram 二元分词 (附人民日报语料库)
brpc-java
Java implementation for Baidu RPC, multi-protocol & high performance RPC.
LLM_case
GPT模型, langchain, prompt engineering, langchain, GPT工程化
me
最大熵模型
ml_bayes
朴素贝叶斯---文本分类
perceptron
感知机
simpleseg
分词基本算法:逆向最大长度匹配
tidalmelon's Repositories
tidalmelon/addrseg
中文地址切分,及地址补全
tidalmelon/bigram
N-gram --bigram 二元分词 (附人民日报语料库)
tidalmelon/LLM_case
GPT模型, langchain, prompt engineering, langchain, GPT工程化
tidalmelon/perceptron
感知机
tidalmelon/autospider
自动化爬虫
tidalmelon/brpc-java
Java implementation for Baidu RPC, multi-protocol & high performance RPC.
tidalmelon/me
最大熵模型
tidalmelon/ml_bayes
朴素贝叶斯---文本分类
tidalmelon/simpleseg
分词基本算法:逆向最大长度匹配
tidalmelon/ansj_seg
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
tidalmelon/ChineseSTS
中文文本语义相似度(Chinese Semantic Text Similarity)语料库建设
tidalmelon/decision_tree
tidalmelon/exoskeleton_armor
chains: organize work flow
tidalmelon/FinGLM
tidalmelon/fnlp
中文自然语言处理工具包 Toolkit for Chinese natural language processing (formerly FudanNLP)
tidalmelon/HanLP
汉语言处理包 分词 词性标注 命名实体识别 依存句法分析 关键词提取 自动摘要 短语提取 拼音 简繁 Lucene插件
tidalmelon/incubator-brpc
Industrial-grade RPC framework used throughout Baidu, with 1,000,000+ instances and thousands kinds of services, called "baidu-rpc" inside Baidu.
tidalmelon/Llama2-Chinese
Llama中文社区,最好的中文Llama大模型,完全开源可商用
tidalmelon/lr
线性回归, 逻辑回归
tidalmelon/miniseg
A Chinese Words Segmentation Tool Based on Bayes Model
tidalmelon/ml_hmm
隐马尔科夫模型---中文分词
tidalmelon/nlp-lang
这个项目是一个基本包.封装了大多数nlp项目中常用工具
tidalmelon/simhash
A Python Implementation of Simhash Algorithm
tidalmelon/similarity
similarity:相似度计算工具包,java编写。用于词语、短语、句子、词法分析、情感分析、语义分析等相关的相似度计算。
tidalmelon/vim
a simple clone of ma6174/vim
tidalmelon/wordnet
语义词典
tidalmelon/zkpython_example
A simple example using zkpython