Pinned Repositories
ALBERT_4_Time_Recognition
使用ALBERT预训练模型,用于识别文本中的时间,同时验证模型的预测耗时是否有显著提升。
ALBERT_text_classification
利用ALBERT实现文本二分类,判别是否属于政治上的出访类事件,提升模型训练和预测速度。
bert_doc_binary_classification
文本二分类任务,是否文档是否属于政治上的出访类事件,利用BERT提取特征,模型采用简单的DNN。
ccks_triple_extract
限定领域的三元组抽取的一次尝试,本文将会介绍笔者在2019语言与智能技术竞赛的三元组抽取比赛方面的一次尝试。
embedding_rerank_retrieval
本项目是针对RAG中的Retrieve阶段的召回技术及算法效果所做评估实验。使用主体框架为LlamaIndex.
keras_bert_multi_label_cls
本项目采用Keras和Keras-bert实现文本多标签分类任务,对BERT进行微调。
knowledge_graph_demo
本项目用于展示三元组抽取后形成的知识图谱,包括几本小说的实体关系,以及README.md,介绍这方面的一篇文章。
multi-label-classification-4-event-type
multi-label-classification-4-event-type
people_relation_extract
结合BERT+GRU+ATT模型,对自己收集的人物关系数据进行模型训练,用于人物关系抽取。
spo_extract_platform
本项目是利用深度学习技术来构建知识图谱方向上的一次尝试,作为开放领域的关系抽取,算是笔者的一次创新,目前在这方面的文章和项目都很少。
percent4's Repositories
percent4/people_relation_extract
结合BERT+GRU+ATT模型,对自己收集的人物关系数据进行模型训练,用于人物关系抽取。
percent4/spo_extract_platform
本项目是利用深度学习技术来构建知识图谱方向上的一次尝试,作为开放领域的关系抽取,算是笔者的一次创新,目前在这方面的文章和项目都很少。
percent4/embedding_rerank_retrieval
本项目是针对RAG中的Retrieve阶段的召回技术及算法效果所做评估实验。使用主体框架为LlamaIndex.
percent4/ccks_triple_extract
限定领域的三元组抽取的一次尝试,本文将会介绍笔者在2019语言与智能技术竞赛的三元组抽取比赛方面的一次尝试。
percent4/multi-label-classification-4-event-type
multi-label-classification-4-event-type
percent4/llm_math_solver
本项目用于大模型数学解题能力方面的数据集合成,模型训练及评测,相关文章记录。
percent4/UniLM_Chinese_DEMO
本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。
percent4/embedding_model_exp
本项目用于Embedding模型的相关实验,包括Embedding模型评估、Embedding模型微调、Embedding模型量化等。
percent4/PyTorch_Learning
learning pytorch step by step
percent4/R-BERT_for_people_relation_extraction
使用R-BERT模型对人物关系模型进行分类,效果有显著提升。
percent4/llm_4_doc_qa
本项目用于文档问答,使用向量嵌入 + ES 做召回,使用Rerank模型作为精排,再使用LLM做文档问答,Web框架使用Flask。
percent4/llm_open_triplet_extraction
本项目使用大语言模型(LLM)进行开放领域三元组抽取。
percent4/llm_evaluation_4_mmlu
Using LLM to evaluate MMLU dataset.
percent4/multi-modal-image-search
本项目使用LLaVA 1.6多模态模型实现以文搜图和以图搜图功能。
percent4/yi_vl_experiment
本项目是关于Yi的多模态系列模型,如Yi-VL-6B/34B等的实验与应用。
percent4/llama-2-multiple-choice-mrc
本项目采用Firefly模型训练框架,使用LLAMA-2模型对多项选择阅读理解任务(Multiple Choice MRC)进行微调,取得了显著的进步。
percent4/pdf-llm_series
The project is for PDF Python learning with Large Language Model.
percent4/ES_Learning
Example codes for Elasticsearch learning with Python.
percent4/text_corrector_corpus_auto_generation
该项目致力于从中文文字版PDF文档中,自动化构建出高质量的中文文本纠错语料。
percent4/dynamic_quantization_on_bert
本项目使用动态量化(Dynamic Quantization)技术对BERT模型进行量化,并实验量化后的模型在推理性能和效果上的表现。
percent4/vllm_learning
本项目用于大模型部署工具vLLM的研究与学习。
percent4/Chinese_Captcha_Recognizition
本项目会自己训练OCR模型,来模型汉字验证码,包含1-n个汉字的验证码。
percent4/clip_learning
The project is for openai clip learning.
percent4/llm_relation_classification
使用LLM对人物关系进行分类,记录模型训练、部署及评估结果。
percent4/percent4.github.io
my personal blog with github + hexo
percent4/Python_docker
封装带有SSH服务的Docker的Python开发环境。
percent4/package_python_project
本项目用于Python自定义第三方模块的打包。
percent4/git_test
Git学习测试项目
percent4/percent4
个人首页
percent4/TimeTeller_in_Android
TimeTeller, the Android App, code in Python.