/DataScienceDCI

Curso Analisis de Datos DCI-UG

Primary LanguageJupyter Notebook

Data Science DCI-UG 2023-I

Curso optativo para estudiantes de licenciatura en la División de Ciencias e Ingenierías de la Universidad de Guanajuato.

Programa


  • GitHub

  • Fundamentos de Python

    • Tipos de variables
    • Operadores (aritméticos y lógicos)
    • While/For loops
    • Funciones
    • Descarga/Lectura de datos (dat, txt, csv)
    • listas / arrays / dictionaries
    • map/filter/lambda
  • Numpy

    • clase array
      • atributos
      • funciones generadoras
      • manupulación
        • operaciones
        • filtros y máscaras
        • opreracines matriciales
      • lectura y escritura de documentos
  • Matplotlib

    • scatter
    • histograms
    • boxplots
    • multiple subplots
    • custom axes ...
  • Pandas

    • Series

      • crear serie
      • acceder a los elementos por índice
      • atributos
      • operaciones
      • filtros
    • DataFrames

      • crear DataFrame
      • acceder a los elementos por índice (DateTime)
      • exploración de los datos
      • añadir y eliminar filas/columnas
      • operaciones y manipulación
      • filtros
      • lectura/escritura de archivos csv, JSON
    • Manipulación avanzada de DataFrames

      • eliminación de NaNs
      • apply
      • group by / agregaciones
      • merge/join
      • índices múltiples
    • Visualización de datos

    • Time series

  • Seaborn_Folium

    • Seaborn
      • displot
      • jointplot
      • paiplot
    • Folium
      • mapa coroplético
  • Bases de datos

    • relacionales (SQL)
    • no relacionales (formato JSON)
  • Búsqueda en la web (documentación, blogs, stackoverflow)

  • Exploración de datos

  • Limpieza de los datos (acción sobre valores faltantes/incorrectos, recastear, eliminar/renombrar columnas, reshape, nueva indexacion, merging/joining)

  • Aplicación de Modelos de aprendizaje automatizado

    • Scikit-learn

      • Regresion lineal
      • Regresion logistica
      • Decision Trees and Random Forests
      • Support Vector Machine
      • K-Means Clustering
      • Redes neuronales artificiales
    • Natural Language Processing