Dans ce projet, nous abordons l'étude de certaines méthodes de plongement de documents (document embedding) et expérimentons une nouvelle méthode afin d'améliorer les performances des modèles de plongement de document sur des tâches de classification. Plus précisément, nous voulons calculer des embeddings de documents en pondérant des embeddings de mots. Ce travail a été réalisé par Bich-Ngoc Hoang et Pierre Prablanc.
pprablanc/doc_embedding_topic_mod
Improving document embedding with weighted average of word embedding through topic modeling
RMIT