minigpt_n-grams_python

Este proyecto incluye un cuaderno Jupyter que muestra cómo podemos construir nuestro propio sistema modelo de lenguaje (miniLLM) a partir de un conjunto de textos.

El cuaderno se puede usar de dos formas:

  • Por un lado, se puede leer con las celdas de código escondidas, pensando en estudiantes que no sepan programar, simplemente para entender el proceso de la creación del modelo en base a conjuntos de palabras (o n-gramas).
  • Pero con estudiantes que sí sepan programar, se pueden mostrar las celdas de código e ir viendo cómo se ha programado el sistema, e incluso realizar modificaciones si se conoce el lenguaje Python.

El cuaderno anterior está inspirado en el trabajo de Jens Mönig, específicamente en su proyecto Snap!GPT programado con el lenguaje Snap!