Pinned Repositories
2020-KBQA
知识图谱问答系统
471417367x
微调bert相关模型,进行命名实体识别、意图分析(文本多分类)、相似句判断、同义句生成,构建智能问答
addressparser
中文地址提取工具,支持**三级区划地址(省、市、区)提取和映射,支持地址热力图绘制。
AI_Pappers
AI Paper阅读记录与收藏:机器学习/深度学习/自然语言处理/计算机视觉/智能语音/推荐系统/知识图谱
Autochecker4Chinese
中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese
Bert-1
简单高效的Bert中文文本分类模型开发和部署
BERT-train2deploy
BERT模型从训练到部署
bert4keras
keras implement of transformers for humans
Chatbot_CN
基于金融-司法领域(兼有闲聊性质)的聊天机器人,其中的主要模块有信息抽取、NLU、NLG、知识图谱等,并且利用Django整合了前端展示,目前已经封装了nlp和kg的restful接口
ChatRobot
keras+python3下的seq2seq+attention中文对话系统
tantailong's Repositories
tantailong/addressparser
中文地址提取工具,支持**三级区划地址(省、市、区)提取和映射,支持地址热力图绘制。
tantailong/AI_Pappers
AI Paper阅读记录与收藏:机器学习/深度学习/自然语言处理/计算机视觉/智能语音/推荐系统/知识图谱
tantailong/Chinese-Keyphrase-Extraction
无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!
tantailong/chinese-knowledge-graph
政务公文知识图谱构建
tantailong/datax-web
DataX集成可视化页面,选择数据源即可一键生成数据同步任务,支持RDBMS、Hive、HBase、ClickHouse、MongoDB等数据源,批量创建RDBMS数据同步任务,集成开源调度系统,支持分布式、增量同步数据、实时查看运行日志、监控执行器资源、KILL运行进程、数据源信息加密等。
tantailong/dbsyncer
DBSyncer(简称dbs)是一款开源的数据同步中间件,提供MySQL、Oracle、SqlServer、PostgreSQL、Elasticsearch(ES)、Kafka、File、SQL等同步场景。支持上传插件自定义同步转换业务,提供监控全量和增量数据统计图、应用性能预警等。
tantailong/kg-bert
KG-BERT: BERT for Knowledge Graph Completion
tantailong/kkFileView
基于 Spring Boot 的文件在线预览项目
tantailong/marqo
Tensor search for humans.
tantailong/MiniMeta
数字人开源项目 (Digital human project)
tantailong/nerpy
🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertCrf、BertSpan等模型,开箱即用。
tantailong/nlp-notebook
NLP 领域常见任务的实现,包括新词发现、以及基于pytorch的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断、三元组抽取、预训练模型等。
tantailong/nlp-tutorial
自然语言处理(NLP)教程,包括:词向量,词法分析,预训练语言模型,文本分类,文本语义匹配,信息抽取,翻译,对话。
tantailong/oasys
办公自动化(OA)是面向组织的日常运作和管理,员工及管理者使用频率最高的应用系统,极大提高公司的办公效率。oasys是一个OA办公自动化系统,使用Maven进行项目管理,基于springboot框架开发的项目,mysql底层数据库,前端采用freemarker模板引擎,Bootstrap作为前端UI框架,集成了jpa、mybatis等框架。
tantailong/PaddleBoBo
基于飞桨开发的虚拟主播
tantailong/parrots
Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine for Chinese. 中文语音识别、文字转语音,基于语音库实现,易扩展。
tantailong/paul-graham-gpt
AI search & chat for all of Paul Graham’s essays.
tantailong/profilePlatform
用户画像平台,涵盖标签管理,用户画像报告,用户分群,用户360视角,oneId服务
tantailong/Prompt-Engineering-Guide
:octopus: Guides, papers, lecture, and resources for prompt engineering
tantailong/pycorrector-1
pycorrector is a toolkit for text error correction. 文本纠错,Kenlm,ConvSeq2Seq,BERT,MacBERT,ELECTRA,ERNIE,Transformer等模型实现,开箱即用。
tantailong/Recommendation-Algorithm-KG
基于知识图谱的推荐算法实现
tantailong/relext
RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。
tantailong/science_technology_policy_integration_service
基于知识图谱的科技政策管理系统
tantailong/similarities
Similarities: a toolkit for similarity calculation and semantic search. 语义相似度计算、匹配搜索工具包,支持文本和图像,开箱即用。
tantailong/spark-profile-tags
基于Spark企业级用户画像项目
tantailong/spo_extract_platform
本项目是利用深度学习技术来构建知识图谱方向上的一次尝试,作为开放领域的关系抽取,算是笔者的一次创新,目前在这方面的文章和项目都很少。
tantailong/text2vec
text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似度计算模型,开箱即用。
tantailong/Text_Mining
文本挖掘实践
tantailong/textgen
textgen, Text Generation models. 文本生成,包括:UDA,Seq2Seq,ERNIE-GEN,BERT,XLNet,GPT-2等模型实现,开箱即用。
tantailong/think
云策文档是一款开源知识管理工具。通过独立的知识库空间,结构化地组织在线协作文档,实现知识的积累与沉淀,促进知识的复用与流通。