Pinned Repositories
kindergarten
幼儿园管理系统提供了“后台管理系统”,后台管理是系统的后台部分,实现幼儿园管理系统的教材,生病、喂药记录,幼儿园周会管理,公告,教师外出学习的管理,和对注册用户的管理
ClassWeb
分类(类别、标签)可视化网站
Text-Generate-RNN
中国古诗生成(文本生成)
Arraytomatrix
记录键盘输入的值转化为数组记录然后又将其以矩阵形式输出
Big-Data-Resources
大数据/数据挖掘/推荐系统/机器学习相关资源
bootout
基于bootstrap实现可视化布局的layoutit.com离线中文版
ChineseTextAnalysisResouce
中文文本分析相关资源汇总
CNKI_Chinese_paper_dataset
中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析
CNKI_Patent_SVM
文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取前3000个词语形成语义词典,然后根据观察设置停用词。然后再用TF-IDF的方式对每个摘要进行词频选取,通过布尔模型,对比语义词典生成文本向量。然后对标签进行数字化转换。取90%的文本为训练集,10%的文本为测试集。用有监督学习的SVM算法对文本进行分类,(人类生活必需品、作业运输、化学冶金、纺织造纸、固定建筑物、机械工程、物理学、电学)分成8类
CODE
wysheng's Repositories
wysheng/WBCrawler
selenium 爬取微博热门话题
wysheng/HanLP
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
wysheng/CNKI_Chinese_paper_dataset
**知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析
wysheng/ChineseTextAnalysisResouce
中文文本分析相关资源汇总
wysheng/text_analysis_tools
中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词)
wysheng/KnowledgeGraph_Agriculture
农业领域知识图谱的构建,包括数据爬取(百度百科)、数据分类、利用结构化数据生成三元组、非结构化数据的分句(LTP),分词(jieba),命名实体识别(LTP)、基于依存句法分析(主谓关系等)的关系抽取和利用neo4j生成可视化知识图谱
wysheng/wysheng.github.io
欢迎访问我的个人技术博客
wysheng/images
photos source
wysheng/KnowledgeGraphData
史上最大规模1.4亿中文知识图谱开源下载
wysheng/intellij-idea-tutorial
🌻 This is a tutorial of IntelliJ IDEA, you can know how to use IntelliJ IDEA better and better.
wysheng/KGQA_HLM
基于知识图谱的《红楼梦》人物关系可视化及问答系统
wysheng/springboot-ssm
springboot整合mybatis(SSM项目整合)
wysheng/springboot
ssm+springboot
wysheng/PublicOpinion
與情分析系统,包括爬虫、数据清洗、文本摘要、主题分类、情感倾向性识别以及分析结果数据可视化
wysheng/VisualDM
数据挖掘可视化系统
wysheng/VisualDM-
数据挖掘可视化系统
wysheng/Text-Generate-RNN
**古诗生成(文本生成)
wysheng/CNKI_Patent_SVM
文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据**知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取前3000个词语形成语义词典,然后根据观察设置停用词。然后再用TF-IDF的方式对每个摘要进行词频选取,通过布尔模型,对比语义词典生成文本向量。然后对标签进行数字化转换。取90%的文本为训练集,10%的文本为测试集。用有监督学习的SVM算法对文本进行分类,(人类生活必需品、作业运输、化学冶金、纺织造纸、固定建筑物、机械工程、物理学、电学)分成8类
wysheng/KnowledgeGraph
知识图谱车音工作项目
wysheng/springbootSSMDemo
用SpringBoot+SpringMVC+MyBatis+MySQL搭建的基本框架
wysheng/SSM-Springboot
使用springboot整合SSM框架
wysheng/WSDM
Web Service of Data Mining with Weka Algorithms
wysheng/Weka
WEKA POC
wysheng/lantern
🔴Lantern Latest Download https://github.com/getlantern/lantern/releases/tag/latest 🔴蓝灯最新版本下载 https://github.com/getlantern/forum/issues/833 🔴
wysheng/ClassWeb
分类(类别、标签)可视化网站
wysheng/Machine_Learning_Spring_Weka
Weka with spring example
wysheng/shenjing
spring boot框架实现神经网络预测,调用R语言相关模型,使用Thymeleaf模板引擎,结合Echart和Easyui进行可视化
wysheng/Weka-Cluster-and-Visualization
K-means clustering using Weka and visualize the clusters on a web page based on the user desired number of clusters along with other metrics as centroid, distances etc
wysheng/Data-Mining-Algorithms
Data Mining Algorithms implemented in Java using Eclipse
wysheng/Arraytomatrix
记录键盘输入的值转化为数组记录然后又将其以矩阵形式输出