实习实训大作业:基于python的电商产品评论数据情感分析
streamlit run ./Comment_analysis/Streamlit/streamlitEXP.py
分工:
挑选合适的商品(好差评都多,并且评论多) GitHub class 参数(类型啥的,命名方式) 统一规范(代码格式,数据库,完善注释,log) 结合到谁的电脑上谁演示,何种形式ppt/代码 文件夹框架 数据测试集训练集划分 不同的产品(不同特点的卖点,特有的关键词),不同品牌的产品(用来比较售后服务优劣等卖点) 评论分数和评论内容的不吻合问题 评论的具体关键词(外形外观等) 开发文档开发文档: 需求文档 明确产品功能 分析某一功能点的流程 整合各个功能点--明确分工 接口文档 变更文件 流程图(可以单独作为一份文件可以作为附件附在文档中) 情感分数(情感倾向分析,结合score) 装饰器(计时、log)@注解 可视化结果,图形化界面(见4) config decorator
同一个热水器的评论内容随时间变化 算法优化与提升(比如用不同的包,还可以用多种方法来处理,进行比较分析) 判断优劣coherence/主观判断/通过数据可视化来大致判断,参数优化(主题数/) 找到一个网站据说可以 wordcloud可视化词云 bert情感分类
texthero可视化 pyLDAvis可视化,通过网页来展示 streamlit+heroku 不用snownlp 机器学习/深度学习 eda 注释掉的代码最后删掉,或者说写明什么时候开启调用