Pinned Repositories
-2020_University_Scholar_Discovery-system
利用网络爬虫技术,从国内外各大高校公开的网站和资源上,搜寻并下载各个高校专家,教授等学者信息,并为这些学者研究方向建立画像系统。用户可以按学校,专业,学科,论文,研究方向等各个维度去查看和对比各位学者的研究领域信息。 基本模块:专家数据爬取模块,论文信息爬取模块,基于专家画像的信息抽取,专家搜索引擎,研究方向提取,专家自我网络中主题圈发现,数据可视化
Chinese
Tools and resources for Chinese texts preprocessing. Validated in two papers, one CCF C, EI indexing and one CCF B, SCI indexing.
CookiesPool
CookiesPool Based on Redis
Final_word_Similarity
根据2016年7月论文,综合了词林扩展版与知网Hownet的相似度计算方法,达到了更大的词汇覆盖、更优的效果。
gpt-crawler
Crawl a site to generate knowledge files to create your own custom GPT from a URL
patent
专利信息及全文下载
Patent-1
使用pyautogui抓取CNIPA专利信息(抓取,下载,邮件提醒)
patent-analysis
使用python训练模型,并最终发布在web上的专利分析系统。实现了以下两个功能:1、预测侵权专利赔偿金额;2、根据产品特征和权利要求说明书文本判断产品是否侵权
PatentsDownloader
python, 中文专利下载
pymindmap
pymindmap是一个由python控制的脑图编辑工具
seekertrue's Repositories
seekertrue/gpt-crawler
Crawl a site to generate knowledge files to create your own custom GPT from a URL
seekertrue/patent
专利信息及全文下载
seekertrue/Patent-1
使用pyautogui抓取CNIPA专利信息(抓取,下载,邮件提醒)
seekertrue/patent-analysis
使用python训练模型,并最终发布在web上的专利分析系统。实现了以下两个功能:1、预测侵权专利赔偿金额;2、根据产品特征和权利要求说明书文本判断产品是否侵权
seekertrue/PatentsDownloader
python, 中文专利下载
seekertrue/pymindmap
pymindmap是一个由python控制的脑图编辑工具
seekertrue/-2020_University_Scholar_Discovery-system
利用网络爬虫技术,从国内外各大高校公开的网站和资源上,搜寻并下载各个高校专家,教授等学者信息,并为这些学者研究方向建立画像系统。用户可以按学校,专业,学科,论文,研究方向等各个维度去查看和对比各位学者的研究领域信息。 基本模块:专家数据爬取模块,论文信息爬取模块,基于专家画像的信息抽取,专家搜索引擎,研究方向提取,专家自我网络中主题圈发现,数据可视化
seekertrue/awesome-free-chatgpt
🆓免费的 ChatGPT 镜像网站列表,持续更新。List of free ChatGPT mirror sites, continuously updated.
seekertrue/carrot
这儿收集了一些免费好用的ChatGPT镜像站 当前:55个站点
seekertrue/ChatGLM-6B
ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型
seekertrue/ChatGPT
🔮 ChatGPT Desktop Application (Mac, Windows and Linux)
seekertrue/chatgpt-on-wechat
基于大模型搭建的微信聊天机器人,同时支持微信、企业微信、公众号、飞书接入,可选择GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/LinkAI,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库进行定制企业智能客服。
seekertrue/ComplexEventExtraction
A concept and obvious expression pattern collection of Chinese compound event extraction which then be evolved into ComplexEventGraph,本项目提出了中文复合事件的概念与显式模式,包括条件事件、因果事件、顺承事件、反转事件等事件抽取,并形成事理图谱。
seekertrue/DisruptiveTechnologyIdentification
基于专利术语的颠覆性技术识别
seekertrue/expert_insights
对论文、专利等文件资料,分词,提取关键词,构建专家和文本的画像
seekertrue/FewRel
A Large-Scale Few-Shot Relation Extraction Dataset
seekertrue/GitHub-Chinese-Top-Charts
:cn: GitHub中文排行榜,各语言分设「软件 | 资料」榜单,精准定位中文好项目。各取所需,高效学习。
seekertrue/gpt-tutorial-101
ChatGPT从0到1学习资料汇总,入门/原理/应用/场景/实操,最好的GPT学习中文文档
seekertrue/HanLP
中文分词 词性标注 命名实体识别 依存句法分析 语义依存分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁 自然语言处理
seekertrue/Jiagu
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要 文本聚类
seekertrue/langchain-ChatGLM
langchain-ChatGLM, local knowledge based ChatGLM with langchain | 基于本地知识库的 ChatGLM 问答
seekertrue/LOR_Reptiles
爬虫——**各省专利开放许可
seekertrue/MaxKB
🚀 基于大语言模型和 RAG 的知识库问答系统。开箱即用、模型中立、灵活编排,支持快速嵌入到第三方业务系统。
seekertrue/Military-Equipment-Knowledge-Graph-Based-on-Deep-Learning-and-Neo4j
基于深度学习与Neo4j的军事装备知识图谱网页应用构建。本项目是一个军事武器知识图谱网页应用软件原型系统。该系统由数据爬虫、数据管理、数据处理、知识问答、新闻热点、词条查询和图谱展示七个功能模块组成。系统从互联网上爬取数据,并基于百度文心ERNIE 3.0模型对数据进行实体识别和关系抽取,将数据处理为三元组形式并存储到图数据库Neo4j中。通过数据管理和数据标注,并通过对Neo4j中的三元组数据进行自动处理和分析,实现知识问答、新闻热点、词条查询和图谱展示的功能。
seekertrue/New_NJUPT_PatentTransform
南京邮电大学专利转让系统(新版)
seekertrue/patent-2
实现对专利数据从采集到处理到搜索到展示的自动化流程
seekertrue/patent_data
用于专利数据分析的一些程序
seekertrue/patent_query
http://cpquery.sipo.gov.cn/ 专利查询批量全自动导出
seekertrue/TV
📺IPTV电视直播源更新工具🚀:包含💰央视、📡卫视、☘️广东及各省份地方台、🌊港·澳·台、🎬电影、🎥咪咕、🏀体育、🪁动画、🎮游戏、🎵音乐、🏛经典剧场;支持自定义增加频道;支持组播源、酒店源、订阅源、关键字搜索;每天自动更新两次,结果可用于TVBox等播放软件;支持工作流、Docker(amd64/arm64)、命令行、GUI运行方式 | IPTV live TV source update tool
seekertrue/web-crawler
Web crawlers of Amazon, Google Patents and Weibo.