Contexto:
- La era digital ha transformado la importancia de la opinión de los usuarios.
- Plataformas de reseñas en constante crecimiento impulsan esta tendencia.
- Las opiniones de los usuarios son cruciales en la planificación estratégica de negocios.
Ejemplos destacados:
-
Yelp
- Ofrece reseñas de una amplia gama de establecimientos.
- Los usuarios comparten sus experiencias y opiniones.
-
Google Maps
- Integra reseñas en su servicio de localización.
- Los usuarios comparten sus experiencias vividas.
Valor para las empresas:
- Evaluar la percepción de sus locales.
- Medir el rendimiento y utilidad de sus servicios.
- Identificar áreas de mejora en sus operaciones.
Importancia estratégica:
- Las decisiones de compra y consumo se basan cada vez más en las reseñas.
- Estas plataformas se han vuelto esenciales para las estrategias comerciales y de servicio en la actualidad.
Objetivos:
- Analizar en detalle la opinión de los usuarios en Yelp y Google Maps.
- Predecir el crecimiento o declive de rubros de negocios.
- Recomendar ubicaciones para nuevos locales.
- Implementar un sistema de recomendación personalizado.
Alcances:
- El análisis se enfoca en reseñas de usuarios sobre restaurantes y negocios afines en el mercado estadounidense.
- El análisis se realizará solo para los estados de Florida, California y Pennsylvania.
- Se utilizarán técnicas de análisis de sentimientos para comprender las opiniones de los usuarios.
- Se utilizarán modelos de Machine Learning para predecir cambios en negocios y crear sistemas de recomendación.
Stack Tecnologico
Kpis
EDA
Modelos de Recomendacion
NLTK para el análisis de sentimiento:
-
Acceso a herramientas de procesamiento de texto: NLTK proporciona una amplia gama de herramientas de procesamiento de texto esenciales para el análisis de sentimientos, como tokenización, lematización y etiquetado POS.
-
Facilidad de uso: NLTK ofrece una interfaz fácil de usar para desarrolladores y científicos de datos que facilita la implementación de modelos de análisis de sentimientos.
-
Recursos lingüísticos: NLTK incluye una variedad de corpus y recursos léxicos en varios idiomas, lo que mejora la precisión de los modelos de análisis de sentimientos.
-
Flexibilidad: Permite la personalización de modelos de análisis de sentimientos, lo que es crucial para adaptarlos a datos específicos del dominio.
Distancia del coseno para medir similitud:
-
Robustez a la longitud de los documentos: La distancia del coseno permite comparar textos de diferentes longitudes de manera equitativa, lo que es esencial para la similitud de documentos.
-
Interpretabilidad: Produce valores en un rango de -1 a 1, lo que hace que los resultados sean fácilmente interpretables en aplicaciones como la recuperación de información y la agrupación de documentos.
-
Amplia aplicación en NLP: Utilizada en diversas aplicaciones de procesamiento de lenguaje natural, como la recuperación de información, la búsqueda de documentos similares y la agrupación de temas.
-
Eficiencia computacional: Es computacionalmente eficiente y escalable, lo que facilita el procesamiento rápido de grandes cantidades de texto en aplicaciones a gran escala.
Link del Producto https://mainpy-bxwrzicy85lxappaf4n3vze.streamlit.app/
Desarrolladores
- Adrián Szklar: Data Engineer, Data Scientist
- Danniela Rodriguez: Data Engineer, Data Scientist
- Nilda Pérez: Data Engineer, Data Scientist
- Samuel Belapatiño: Data Analist, Data Scientist
- Rodrigo Bogado: Data Analist, Data Scientist