GiveHenanAHand/henan-rescue-viz-website

[Suggestion]或许训练一个文本分类器?

Closed this issue · 3 comments

感谢学长学姐们的工作!非常有意义!

看了一下,可能是数据源的问题,很多都是无关求助的信息。或许可以考虑训练一个文本分类模型,把信息分类成“求助“、”援助”、“其它”。出于效率考量,“其它”类可以不显示。

此外,可以考虑和这份共享文档合作一下,扩充数据信息?https://shimo.im/docs/RkDdqJtqrdkg9xT8/read

或者如果信息结构化太麻烦,不如直接对接开发出来的救援小程序,收集更干净、结构化了的信息,做可视化处理。

以上是个人的一点拙见。

虽然我不是开发者,但是我想冒昧说下我的想法~
对于这种紧急情况,腾讯官方其实自己也会推出对应的小程序,所以这个对于微博信息的可视化非常独到且实用,因为它可以很及时地整理起微博上的信息
然后文本分类我也试了一下,用了百度demo用的情感NLP接口,那些加油的信息是积极的,求助信息是中性和负面的,个人觉得也许会有用

我们正在测试一个nlp的分类器,可能会在之后用到~ 有了进展会更新的

初步实现了一个关键词来过滤无用信息的工具