Pinned Repositories
100-Days-Of-ML-Code
100-Days-Of-ML-Code中文版
area_sql
全国城市+四级城市地址+邮编+区号+经纬度sql数据表
baike_triples
爬取百度百科词条,抽取三元组,构建知识图谱
berkeley-stat-157
Homepage for STAT 157 at UC Berkeley
BERT-AttributeExtraction
USING BERT FOR Attribute Extraction in KnowledgeGraph. fine-tuning and feature extraction. 使用基于bert的微调和特征提取方法来进行知识图谱百度百科人物词条属性抽取。
bert-utils
一行代码使用BERT生成句向量,BERT做文本分类、文本相似度计算
bert4keras
keras implement of transformers for humans
CAIL
cail2019-1
法研杯2019相似案例匹配第二名解决方案(附数据集和文档)
ner_entity_linking
百度中文实体识别和实体消歧数据集,比赛网址
15236626983's Repositories
15236626983/cail2019-1
法研杯2019相似案例匹配第二名解决方案(附数据集和文档)
15236626983/ner_entity_linking
百度中文实体识别和实体消歧数据集,比赛网址
15236626983/bert-utils
一行代码使用BERT生成句向量,BERT做文本分类、文本相似度计算
15236626983/bert4keras
keras implement of transformers for humans
15236626983/CAIL2019
**法研杯司法人工智能挑战赛之相似案例匹配第一名解决方案
15236626983/Chatbot_CN
基于金融-司法领域(兼有闲聊性质)的聊天机器人,其中的主要模块有信息抽取、NLU、NLG、知识图谱等,并且利用Django整合了前端展示,目前已经封装了nlp和kg的restful接口
15236626983/china_area
2020年**全国5级行政区划(省、市、县、镇、村)
15236626983/ChineseNLPCorpus
中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。
15236626983/CoreNLP
Stanford CoreNLP: A Java suite of core NLP tools.
15236626983/CPM-1-Generate
Chinese Pre-Trained Language Models (CPM-LM) Version-I
15236626983/csb-sdk
The CSB-SDK is a client-side invocation SDK for HTTP or Web Service API opened by the CSB (Cloud Service Bus) product. It is responsible for invoking the open API and signing the request information.
15236626983/docs
ADBSQL documents.
15236626983/ElasticCTR
ElasticCTR是基于Kubernetes的企业级推荐系统解决方案,该方案融合了百度业务场景下经过不断验证打磨的CTR模型、基于飞桨框架的大规模分布式训练、工业级稀疏参数Serving组件,帮助用户在Kubernetes环境中一键完成推荐系统架构部署,快速搭建和验证CTR模型训练和预测效果,具备高性能、工业级部署、端到端体验及二次深度开发的特性。
15236626983/gpt-2
Code for the paper "Language Models are Unsupervised Multitask Learners"
15236626983/GPT2-Chinese
Chinese version of GPT2 training code, using BERT tokenizer.
15236626983/HanLP
中文分词 词性标注 命名实体识别 依存句法分析 语义依存分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
15236626983/ik-analyzer
support Lucene5/6/7/8/9+ version, LTS
15236626983/jeecg-boot-activiti
jeecg-boot开源版整合 activiti 5.22.0 版本 jeecg-boot activiti springboot,在线流程设计、通用流程操作,模块化可插拔,不影响主干代码版本升级。功能齐备,使用方法自己研究,正常开发者看看代码就应该会,看不会我解释起来也费劲。主维护国内码云,github换个地方就要维护一下地址才顺畅,麻烦
15236626983/Keras-TextClassification
中文长文本分类、短句子分类、多标签分类、两句子相似度(Chinese Text Classification of Keras NLP, multi-label classify, or sentence classify, long or short),字词句向量嵌入层(embeddings)和网络层(graph)构建基类,FastText,TextCNN,CharCNN,TextRNN, RCNN, DCNN, DPCNN, VDCNN, CRNN, Bert, Xlnet, Albert, Attention, DeepMoji, HAN, 胶囊网络-CapsuleNet, Transformer-encode, Seq2seq, SWEM, LEAM, TextGCN
15236626983/kg-baseline-pytorch
2019百度的关系抽取比赛,使用Pytorch实现苏神的模型,F1在dev集可达到0.75,联合关系抽取,Joint Relation Extraction.
15236626983/knowledge-graph
Neo4j Data Visualization
15236626983/KnowledgeGraphData
史上最大规模1.4亿中文知识图谱开源下载
15236626983/ner_tag
命名实体识别标注数据集
15236626983/nlp_xiaojiang
自然语言处理(nlp),小姜机器人(闲聊检索式chatbot),BERT句向量-相似度(Sentence Similarity),XLNET句向量-相似度(text xlnet embedding),文本分类(Text classification), 实体提取(ner,bert+bilstm+crf),数据增强(text augment, data enhance),同义句同义词生成,句子主干提取(mainpart),中文汉语短文本相似度,文本特征工程,keras-http-service调用
15236626983/PaddleOCR
Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
15236626983/RapidOCR
A cross platform OCR Library based on PaddleOCR & OnnxRuntime
15236626983/text_matching
常用文本匹配模型tf版本,数据集为QA_corpus,持续更新中
15236626983/WEB_KG
爬取百度百科中文页面,抽取三元组信息,构建中文知识图谱
15236626983/wvp-GB28181-pro
WEB VIDEO PLATFORM是一个基于GB28181-2016标准实现的网络视频平台,支持NAT穿透,支持海康、大华、宇视等品牌的IPC、NVR、DVR接入。支持国标级联,支持rtsp/rtmp等视频流转发到国标平台,支持rtsp/rtmp等推流转发到国标平台。
15236626983/ZLMediaKit
WebRTC/RTSP/RTMP/HTTP/HLS/HTTP-FLV/WebSocket-FLV/HTTP-TS/HTTP-fMP4/WebSocket-TS/WebSocket-fMP4/GB28181 server and client framework based on C++11