/CaribeApp

A streamlit application to automate the t-shirt distribution process at the Juegos Caribe at the Havana University. The python PuLP library is used to solve the optimization problem.

Primary LanguagePython

Distribución de pullovers en los Juegos Caribe

Modelos Matemáticos Aplicados

Juegos Caribe

Autores:

Índice

Introducción

El problema de la distribución de pullovers en el contexto de un evento deportivo universitario involucra diversas restricciones y objetivos que lo convierten en un desafío complejo de optimización. Existen múltiples enfoques para abordar problemas de esta naturaleza, entre los cuales destacan la Programación Lineal Entera Mixta (MILP), los Algoritmos Genéticos (GA), el Simulated Annealing (SA), y los Algoritmos de Búsqueda Local como el hill climbing y tabu search. Este informe tiene como objetivo comparar estos métodos, argumentando por qué MILP representa una solución más robusta y adecuada para el problema en cuestión. El problema a resolver consiste en distribuir un número limitado de pullovers entre varias facultades, de modo que se respeten diversas restricciones, que tienen que ver con la cantidad disponible de colores, la cantidad de atletas inscritos en cada facultad, y la asignación equitativa basada en rankings y preferencias de color. Además, se busca maximizar el cumplimiento de restricciones de prioridad y minimizar las diferencias entre las razones de asignación de pullovers y atletas inscritos.

Algoritmos Heurísticos y de Búsqueda Local

Los algoritmos heurísticos como los Algoritmos Genéticos (GA) y Simulated Annealing (SA), así como los métodos de búsqueda local como hill climbing y tabu search, son técnicas populares para resolver problemas de optimización complejos, especialmente cuando el espacio de soluciones es grande y la solución óptima no puede ser calculada de manera eficiente. Estas técnicas tienen la ventaja de ser más rápidas y menos exigentes en términos de recursos computacionales en comparación con MILP, especialmente en problemas de gran escala.

Sin embargo, estos métodos presentan varias limitaciones significativas cuando se comparan con MILP en el contexto del problema en cuestión:

  1. Soluciones Aproximadas y No Óptimas: Los algoritmos heurísticos y de búsqueda local, por su naturaleza, tienden a encontrar soluciones aproximadas que no garantizan la optimalidad. En un problema donde cumplir con todas las restricciones es crítico, la capacidad de encontrar la solución óptima es esencial, y MILP garantiza esto siempre que el problema sea resoluble en tiempo razonable.
  2. Dificultad para Manejar Múltiples Restricciones Complejas: Aunque los algoritmos heurísticos pueden ser adaptados para manejar múltiples restricciones, la combinación de restricciones estrictas y prioritarias, como en este problema, es difícil de implementar de manera eficiente. Por ejemplo, en GA o SA, diseñar una función de aptitud que maneje adecuadamente todas las restricciones y prioridades puede ser complejo y a menudo requiere afinaciones finas específicas para cada problema, lo cual reduce la generalidad del método.
  3. Control Limitado sobre la Prioridad de Restricciones: En MILP, es posible definir de manera precisa la prioridad entre las restricciones utilizando técnicas como el método de weighted sum o lexicographic optimization. Por otro lado, en métodos como GA o SA, la priorización de restricciones puede no ser tan directa y puede depender de penalizaciones en la función objetivo, lo que introduce un elemento de incertidumbre en la calidad de las soluciones obtenidas.
  4. Riesgo de Estancamiento en Óptimos Locales: Los métodos de búsqueda local como hill climbing y tabu search son susceptibles a quedar atrapados en óptimos locales, especialmente en problemas de alta complejidad como el presente. Aunque existen técnicas para mitigar este riesgo, como la diversificación en tabu search o el uso de operadores de mutación en GA, estas no garantizan la escapatoria de un óptimo local y pueden requerir tiempos de ejecución significativamente mayores para lograr soluciones de calidad.

Programación Lineal Entera Mixta (MILP)

MILP es un enfoque de optimización exacto que permite modelar problemas con restricciones lineales y variables de decisión enteras. La fortaleza de MILP radica en su capacidad para encontrar soluciones óptimas garantizadas, siempre y cuando el problema sea formulado adecuadamente y los recursos computacionales lo permitan. La naturaleza combinatoria del problema de distribución de pullovers, que involucra múltiples restricciones y variables discretas, hace que MILP sea especialmente apropiado, ya que puede manejar la complejidad del problema y proporcionar soluciones óptimas que satisfacen todas las restricciones impuestas.

Además, MILP permite la incorporación explícita de prioridades entre restricciones, lo que es crucial en este caso, dado que algunas restricciones son innegociables mientras que otras pueden ser relajadas si es necesario. Este control granular sobre las restricciones es difícil de replicar en enfoques heurísticos.

Metodología y Formulación del Problema de Optimización.

Datos de Entrada

El algoritmo recibe los siguientes datos de entrada:

  1. Facultades: Lista de facultades participantes.
  2. Atletas: Diccionario que mapea cada facultad con la cantidad de atletas inscritos.
  3. Ranking: Diccionario que asigna un ranking a cada facultad.
  4. Pullovers Disponibles: Diccionario con la cantidad total de pullovers disponibles por color.
  5. Pullovers para Árbitros y Profesores: Cantidad fija de pullovers destinados a árbitros y profesores.
  6. Pullovers para AAAC: Cantidad fija de pullovers destinados a la Asociación de Antiguos Atletas Caribe (AAAC).
  7. Preferencias: Diccionario opcional que indica la preferencia de color de cada facultad.

Pasos del Algoritmo

  1. Asignación a Árbitros, Profesores y AAAC:

    • El algoritmo selecciona aleatoriamente un color para los árbitros, profesores y AAAC.
    • Se distribuye una cantidad fija de pullovers a estos grupos, reduciendo el total disponible para las facultades.
  2. Asignación Inicial para Facultades con Menos de 10 Atletas:

    • Las facultades con menos de 10 atletas reciben sus pullovers de forma directa, asignándoles un color (preferido o aleatorio) y reduciendo el total disponible.
  3. Optimización Principal:

    • Se modela un problema de optimización lineal para asignar los pullovers restantes a las facultades con más de 10 atletas.

    • Variables de Decisión:

      $x_i$ : Cantidad de pullovers asignados a la facultad $i$.

      $y_{ij}$ : Variable binaria que indica si la facultad $i$ recibe el color $j$.

      $z_{ij}$ : Cantidad de pullovers asignados a la facultad $i$ del color $j$.

      $proporciones_i$ : Proporción de pullovers asignados respecto al número de atletas de la facultad $i$.

      $diferencia_i$ : Diferencia absoluta entre la proporción asignada y la media.

    • Restricciones:

      • La suma total de pullovers asignados debe ser igual al total disponible. (1)
      • Cada facultad recibe exactamente un color. (2)
      • Ninguna facultad recibe más pullovers de los que hay disponibles de un color. (3)
      • Ninguna facultad se queda con $0$ pullovers. (4)
    • Otras restricciones en orden de prioridad (El algoritmo tratará de cumplir la mayor cantidad de restricciones respentando la prioridad asignada):

      1. La cantidad de pullovers que recibe una facultad es menor o igual a la cantidad de atletas inscritos en dicha facultad. (5)
      2. Una facultad no tendrá menos pullovers que otra que esté por debajo de ella en el ranking actual de los juegos. (6)
      3. Si una facultad tiene menos de 10 atletas inscritos, recibe todos los pullovers para sus atletas. (7)
      4. Si $A$ es una facultad que tiene más atletas inscritos que otra facultad $B$, entonces $A$ recibe más pullovers que $B$. (8)
      5. Si a una facultad $A$ se le van a asignar $n$ pullovers, y existen al menos $n$ pullovers disponibles del color favorito de $A$, se le deben asignar dichos pullovers a $A$. (9)
    • Función Objetivo:

      • Minimizar la suma de las diferencias absolutas entre la proporción de pullovers asignados y la media. (10)
  4. Resolución:

    • El problema de optimización se resuelve utilizando el solver PuLP con un límite de tiempo para garantizar la eficiencia en la solución.
  5. Salida:

    • El algoritmo imprime la cantidad de pullovers asignados a cada facultad, junto con el color asignado. También proporciona un resumen de la distribución total por color.

Formulación matemática

  • Restricciones:
    • (1) $\sum_{i \in \text{facultades}}x_i = T$ donde $T$ es el total de pullovers.
    • (2) $\sum_{j \in \text{colores}} y_{i,j} = 1$
    • (3) $\text{Si } y_{i,j} = 1 \text{(es decir, la facultad } i \text{ recibe el color } j\text{)} \rightarrow x_i \leq \text{pulóveresDisponibles}_j$
    • (3) $\sum_{i \in \text{facultades}} z_{i,j} \leq \text{pulóveresDisponibles}_j$
    • (4) $x_i \geq 10$ para todo $i$
    • (5) $x_i \leq \text{atletas}_i \quad \text{(si hay datos de atletas para } i \text{)}$
    • (6) $x_a \geq x_b \quad \text{si el ranking de } a \text{ es mejor que el de } b$
    • (7) $x_i = \text{atletas}_i \quad \text{si la facultad } i \text{ tiene menos de 10 atletas}$
    • (8) $x_a \geq x_b \quad \text{si } \text{atletas}_a > \text{atletas}_b$
    • (9) $y_{i, \text{colorPreferido}} = 1$
  • Relación entre $z_{i,j}, x_i $ y $ y_{i,j}$. Para cada facultad $i$ y color $j$:
    • $z_{i,j} \leq x_i$
    • $z_{i,j} \leq y_{i,j} \times \text{total}$
    • $z_{i,j} \geq x_i - (1 - y_{i,j}) \times \text{total}$
  • Proporciones de atletas. Se define una proporción promedio:
    • $\text{proporcionesMedia} = \frac{\text{total}}{\sum_{k \in \text{atletas}} \text{atletas}_k}$
    • $\text{proporciones}_i \times \text{atletas}_i = x_i$ para cada facultad $i$ que tiene datos de atletas
    • La diferencia absoluta entre la proporción de la facultad $i$ y la proporción media es:
      • $ \text{diferencia}_i \geq \text{proporciones}_i - \text{proporcionesMedia}$
      • $\text{diferencia}_i \geq \text{proporcionesMedia} - \text{proporciones}_i $
  • Función Objetivo: Minimizar la suma de diferencias absolutas
    • (10) $mín \left(\sum_{i \in \text{facultades}} \text{diferencia}_i\right)$

PuLP: Biblioteca de Optimización Lineal en Python

PuLP es una biblioteca de código abierto para Python diseñada específicamente para modelar y resolver problemas de optimización lineal y entera. Proporciona una interfaz sencilla y flexible que permite a los usuarios definir variables de decisión, funciones objetivo y restricciones de manera intuitiva, utilizando una sintaxis similar al lenguaje matemático convencional.

Características Principales

  1. Modelado Intuitivo: PuLP facilita la formulación de problemas de optimización mediante la creación de variables, la definición de la función objetivo y la incorporación de restricciones de manera clara y estructurada.
  2. Compatibilidad con Múltiples Solvers: La biblioteca puede integrarse con diversos solvers de optimización, tanto de código abierto como comerciales, como CBC, CPLEX, Gurobi y GLPK, lo que brinda flexibilidad para elegir la herramienta más adecuada según las necesidades del problema.
  3. Soporte para Optimización Entera y Lineal: Además de resolver problemas de programación lineal, PuLP también permite manejar variables enteras, lo que es esencial para aplicaciones que requieren soluciones discretas.
  4. Documentación y Comunidad Activa: PuLP cuenta con una amplia documentación y una comunidad activa que facilita el aprendizaje y la resolución de dudas, lo que la convierte en una opción accesible tanto para principiantes como para usuarios avanzados. [1][2]

Modo de Uso

Link para abrir la aplicación.

Para correr la aplicación se puede ejecutar el siguiente código desde una terminal en la carpeta raíz del repositorio:

streamlit run src/main.py

Maual de Usuario

Main Screen Dark

Pantalla principal de la aplicación

Introducing Colors Data

Primeramente se introducen los datos relacionados a las cantidades de pullovers fijas para Árbitros, Profesores y Antiguos Atletas. Luego se selecciona la cantidad de colores moviendo el slider con el mouse o con las flechas del teclado. Se introducen los nombres y la cantidad de pullovers disponibles de cada color.

Introducing Faculties Data

De manera similar se selecciona la cantidad de facultades a las que se les va a repartir pullovers y se rellenan los datos pertinentes. La aplicación le avisará si le faltan datos por brindar al ejecutar la solución. Se recomienda siempre rellenar el dato de la Cantidad de Atletas, y en el caso de no tener la exactitud del dato, brindar un aproximado basado en años anteriores para que la solución sea lo mejor posible.

Execution

Al completar los datos necesarios, se puede pulsar el botón Ejecutar. Luego imprimirá los resultados.

Execution

También se puede descargar el conjunto de datos introducido en formato .json para tener la posibilidad de guardarlos y subirlos en próximas ejecuciones. También se puede iniciar un chat con el bot @el_indio_de_los_caribe_bot y poner un Username para recibir los resultados de la ejecución.

Settings

En la esquina superior derecha se podrá encontrar un menú desplegable.

Change Theme

Una de las opciones disponibles al entrar a Settings es la de cambiar el Tema de la aplicación.

Light Theme

Print Screen

En ese mismo menú, al entrar a Print se podrá obtener una versión en PDF de la ejecución de la aplicación, pudiendo guardar de esta manera los resultados y los datos de entrada que los generaron.

README

Además se incorporó la descripción de la aplicación para ser consultada durante su uso.

Bitácora del Proyecto

  1. Elegir Proyecto.
  2. Comunicarse con el cliente vía digital.
  3. Encuentro presencial con el cliente.
  4. Estudiar las tecnologías
  5. Mostrar plantilla de figma con el primer diseño de la aplicación al cliente.
  6. Cambio de diseño de la aplicación.
  7. Estudio de los métodos de solución del problema a resolver.
  8. En paralelo: Desarrollo de la aplicación y exploración de métodos de soluciones al problema.
  9. Elección del método de solución, iteraciones de prueba para mejorar la solución. Avance en el desarrollo de la aplicación.
  10. Consultas al cliente sobre los requerimientos y la prioridad de las restricciones del problema. Cambio de tecnología en el desarrollo de la aplicación por incompatibilidad con paquetes de python (Flutter a Flet).
  11. Modificaciones al código y aproximación a la solución definitiva. En paralelo continúa el desarrollo de la aplicación con la nueva tecnología.
  12. Encontrada solución al problema, arreglando detalles. Aplicación casi terminada.
  13. Problemas con los paquetes de python al integrar ambas partes (Permisos de la app al ser ejecutada en android debido al uso de la consola). Nueva incompatibilidad de las tecnologías. Búsqueda de posibles soluciones.
  14. Consulta al cliente sobre posible cambio de tecnología al no encontrar solución al problema.
  15. Finalmente cambio de tecnología (streamlit) y de concepción de la aplicación. Nuevo proceso de desarrollo e investigación de la nueva tecnología.
  16. Producto funcional.
  17. Presentación al cliente. Solicitud de incorporación de funcionalidades.
  18. Incorporación de funcionalidades solicitadas y otras nuevas.

Reporte Técnico. Tiempo computacional

Para garantizar una solución en un tiempo razonable para datos de entrada muy grandes se decidió establecer un tiempo límite de 30 segundos. La biblioteca PuLP tiene la facilidad de incorporar ese tiempo límite y ofrecer la mejor solución encontrada hasta alcanzarlo. En las pruebas del producto se llegó a la conclusión de que el sover mostraba un buen rendimiento para conjuntos de datos del tamaño máximo esperado en el ambiente de los Juegos Caribe (18 facultades que reciben pullovers). A continuación una muestra de los tiempos alcanzados para distintos tamaños de entrada de datos:

Facultades Colores Pullovers Tiempo (s)
2 2 100 0.070997
4 2 250 0.328346
7 3 350 1.620945
11 3 600 7.829477
16 4 1350 30.328623

Conclusiones

El estudio y resolución del problema de distribución de pullovers en los Juegos Caribe demuestra la aplicabilidad y eficacia de la Programación Lineal Entera Mixta (MILP) para abordar problemas de optimización complejos con restricciones múltiples. A lo largo del informe se destaca cómo MILP ofrece una ventaja significativa en comparación con métodos heurísticos y de búsqueda local, debido a su capacidad para garantizar soluciones óptimas y cumplir con todas las restricciones de forma rigurosa.

El uso de MILP permitió gestionar de manera eficiente la asignación de pullovers a diferentes facultades, respetando las prioridades definidas y optimizando la distribución de acuerdo a las preferencias y limitaciones establecidas. Este enfoque no solo asegura la equidad en la asignación de recursos limitados, sino que también minimiza las diferencias en las proporciones de asignación, logrando un balance entre las facultades que participan en los juegos.

Además, la implementación de la biblioteca PuLP en Python facilitó el modelado y la solución del problema, permitiendo un enfoque claro y estructurado para definir variables de decisión, restricciones y la función objetivo. PuLP resultó ser una herramienta versátil y accesible, proporcionando compatibilidad con múltiples solvers y flexibilidad en la integración de diversas restricciones del problema.

En conclusión, la solución presentada no solo es robusta desde el punto de vista matemático y computacional, sino que también es práctica y escalable, lo que la convierte en una opción adecuada para problemas similares de asignación de recursos en eventos deportivos u otros contextos de logística compleja.

Referencias

  1. COIN-OR Foundation. (n.d.). PuLP: A Python linear programming API. Recuperado de https://coin-or.github.io/pulp/
  2. Python Package Index (PyPI). (n.d.). PuLP: A Python linear programming API. Recuperado de https://pypi.org/project/PuLP/