- LDA
- Kmeans
- EM
El caso de entrenamiento supervisado es poco común, dado que el problema de clasificar manualmente las muestras, o mismo generarlas, puede ser muy dificultoso aunque de disponer de dichas muestras, el entrenamiento es muy bueno.
Comúnmente en machine learning se tiene un gran volumen de información pero la misma no se encuentra clasificada. Por lo tanto las técnicas de kmeans y EM son de gran importancia.
En particular el algoritmo EM está respaldado por una teoría mientras que kmeans tiene un enfoque iterativo dado que es un método no paramétrico de hacer clustering.
En conclusión si los clusters están bien separados, cualquier método funciona. Sin embargo ante la aparición de outliers y clusters cercanos, el método de kmeans es el mejor dado que se genera una decisión tipo hard asignandole un cluster a los outliers mientras que en EM con el tipo de decisión soft no se le asignaría ningun cluster dado que las responsabilidades serán nulas de todas las clases.