lj0103's Stars
1061700625/WeChat_Article
爬取微信公众号文章
llzhi001/Python-spider-1
爬虫+数据分析可视化。爬取的网站有:知乎,淘宝,新浪微博,微信公众号,猫途鹰,今日头条,虎嗅网,人人都是产品经理,猫眼电影
songluyi/crawl_wechat
用于批量爬取微信公众号所有文章
citation-style-language/styles
Official repository for Citation Style Language (CSL) citation styles.
ZhaoYis/Berry.Spider
基于Selenium自动化框架实现的爬虫程序(目前主要有百度、头条、搜狗)
CarryChang/Customer_Satisfaction_Analysis
基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致,实时对在线民宿的满意度评测,包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询 POI 信息的功能;构建了基于在线民宿语料的 LDA 自动主题聚类模型,利用主题中心词能找出对应的主题属性字典;以用户打分作为标注,然后 litNlp 自带的字符级 TextCNN 进行情感分析,将情感分类概率分布作为情感趋势,最后通过 POI 热力图的方式对不同地域的民宿满意度进行展示。软件版本请见链接。
moxiu2012/PJ_NLP
该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等
DinghaoXi/chinese-sentiment-datasets
中文文本情感分类数据集分享 chinese sentiment datasets
Roshanson/TextInfoExp
自然语言处理实验(sougou数据集),TF-IDF,文本分类、聚类、词向量、情感识别、关系抽取等
haiker2011/awesome-nlp-sentiment-analysis
:book: 收集NLP领域相关的数据集、论文、开源实现,尤其是情感分析、情绪原因识别、评价对象和评价词抽取方面。
CLUEbenchmark/CLUEDatasetSearch
搜索所有中文NLP数据集,附常用英文NLP数据集
frank330/Emotion_analysis
goto456/stopwords
中文常用停用词表(哈工大停用词表、百度停用词表等)
HIT-SCIR/ltp
Language Technology Platform
thunlp/THULAC
An Efficient Lexical Analyzer for Chinese
fxsjy/jieba
结巴中文分词
tsroten/pynlpir
A Python wrapper around the NLPIR/ICTCLAS Chinese segmentation software.
NLPIR-team/NLPIR
crownpku/Awesome-Chinese-NLP
A curated list of resources for Chinese NLP 中文自然语言处理相关资料
baidu/lac
百度NLP:分词,词性标注,命名实体识别,词重要性
baidu/Senta
Baidu's open-source Sentiment Analysis System.
binary-husky/gpt_academic
为GPT/GLM等LLM大语言模型提供实用化交互接口,特别优化论文阅读/润色/写作体验,模块化设计,支持自定义快捷按钮&函数插件,支持Python和C++等项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, moss等。
wuxingsanren/wildcat-vip-account
野猫 - 每天分享最新的百度网盘SVIP、迅雷超级会员、手机话费折扣充值、霸王餐免费吃VIP(美团、饿了么、大众点评、肯德基、麦当劳、星巴克)、饿了么超级会员、美团外卖会员&红包券、爱奇艺VIP会员、腾讯视频VIP、优酷VIP会员、哔哩哔哩大会员、百度文库VIP、QQ音乐VIP、网易云黑胶VIP、喜马拉雅VIP、樊登读书会VIP、千图网VIP、包图网VIP、摄图网VIP、CSDN下载VIP、天眼查VIP、苹果ID等等各类VIP帐号,随取随用,完全免费,绝无套路,同时提供:百度文库VIP下载、图库素材VIP下载、学术文献VIP下载(知网维普万方读秀龙源超星、英文数据库、法律数据库、医学数据库、金融数据库)、全网视频VIP解析、全网音乐MP3免费听及下载、微信域名拦截检测API ,欢迎推荐分享给
63can/xiaohongshu-spider
小红书内容自动爬取,selenium+fiddler+微信小程序
whisky-rye/LittleRedBook
小红书爬虫简单版,能爬取笔记,标签,用户信息,专辑等等。
OrangeySeven/RedbookSpider
小红书笔记爬虫
SmileSmith/tiny-red-book
小红书数据抓取
wanqqq29/cuddly-meme
毕业设计,旅游景点评论情感分析。包含携程,马蜂窝爬虫,Adaboost+bayes分类
MaxwellJack/pinglun_spyder
关于百度旅游、大众点评、驴妈妈、猫途鹰、携程的评论爬虫
Python3Spiders/WeiboSuperSpider
微博爬虫及配套工具箱,微博用户、话题、评论采集一网打尽。图片下载、情感分析,地理位置、关系网络、spammer 机器人识别等功能应有尽有。Docs:https://buyixiao.github.io/blog/weibo-super-spider.html 配套可视化网站:https://buyixiao.github.io/blog/one-stop-weibo-visualization.html