zzhjim02's Stars
Project-Gutenberg/nCovMemory
2020新冠肺炎记忆:报道、非虚构与个人叙述(持续更新) Memory of 2020 nCov: Media Coverage, Non-fiction Writings, and Individual Narratives (Continuously updating)
risshun/Chinese_Laws
本项目旨在收集中华人民共和国的各类法律条文;项目重启中,期望PR
junchaoIU/xiangshanKnowledge
香山文化知识图谱V1.0后台
junchaoIU/CMRH-KG
📚**近代革命历史知识图谱系统 🌈提供了知识图谱可视化、知识检索、关系检索、时空检索、时空演化、语料检索、知识抽取、知识问答等丰富而有效的**近代革命历史知识服务。
LingDong-/grand-timeline
Interactive grand unified timeline of 30,800 ancient Chinese people / 古人全表
liujiawm/php-calendar
chinese calendar,通过天文计算和民间推算方法,准确计算出公历-1000年至3000年的农历、干支、节气等,同时支持多配置、多语言、多时区。日历、**农历、阴历、节气、干支、生肖、星座、日曆、中國農曆、陰曆、節氣
ruyut/TaiwanCalendar
紀錄中華民國政府行政機關辦公日曆表的 JSON 資料,內容包含日期、星期、是否放假、說明。
ephialtes-t/shenbao-metadata
moss-on-stone/shenbao-metadata
ownthink/KnowledgeGraphData
史上最大规模1.4亿中文知识图谱开源下载
ProletRevDicta/Prolet
Historical documents (in Chinese) about the GPCR (Thanks Comrade RC MR HR etc.)
china-ai-law-challenge/CAIL2019
Virus-V/qinhui
此小程序抓取秦晖教授的文集并整理归类txt文件
PaddlePaddle/PaddleNLP
👑 Easy-to-use and powerful NLP and LLM library with 🤗 Awesome model zoo, supporting wide-range of NLP tasks from research to industrial applications, including 🗂Text Classification, 🔍 Neural Search, ❓ Question Answering, ℹ️ Information Extraction, 📄 Document Intelligence, 💌 Sentiment Analysis etc.
banned-historical-archives/CCRD
CCRD **当代政治运动史数据库
esbatmop/MNBVC
MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。
datasets/covid-19
Novel Coronavirus 2019 time series data on cases
ymcui/Chinese-LLaMA-Alpaca
中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs)
yescallop/areacodes
中华人民共和国县级以上历史行政区划代码及新旧代码对应关系数据集
banned-historical-archives/banned-historical-archives.github.io
和谐历史档案馆