/Proyecto-BigData

Proyecto Final para la materia Seminario de Ciencias de la Computación en donde se usarán técnicas de Machine Learning y Big Data usando PySpark para la predicción de años de lanzamiento de canciones.

Primary LanguageJupyter Notebook

Proyecto Final - Big Data

Integrantes

  • Báez Camacho Jesús Armando
  • Leyva Contreras José Alberto
  • Monge Tinoco Manuel Crisólogo

Problemática

Se predecirá el año de lanzamiento de una canción a partir de las características del audio; específicamente: el timbre.

Conjunto de Datos

El conjunto de Datos se llama YearPredictionMCD, un subconjunto de datos del Million Song Dataset.


Algunas características que tiene son:

  • Tamaño: 460 MB
  • Formato: Archivo .txt
  • Número de Instancias: 515345
  • Número de Atributos: 90

Liga al Dataset: Puedes descargar el conjunto de datos AQUÍ