/NNForTextClassification

Repositorio de pruebas en ML y DL. El objetivo de este repositorio en concreto es ir implementando publicaciones sobre modelos de redes neuronales para la clasificación de textos o frases en Tensorflow.

Primary LanguagePythonMIT LicenseMIT

Repositorio de pruebas en ML y DL para clasificación de texto

/data

  • data.pickle: Datos del TREC-6 guardados en el formato pickle. (Xtrain, ytrain), (Xtest, ytest)
  • word2vec.npz: Un embedding creado con word2vec. Es una matriz numpy.
  • Xavier.npz: Un embedding inicializado aleatoriamente con la distribución xavier. Es una matriz numpy.

/fen

Modelos implementados usando exclusivamente tensorflow. Existe una clase 'Classifier', que engloba un modelo, es capaz de entrenarlo y sacar estadísticas.

Actualmente hay 5 modelos implementados

/tests

Ejemplos de uso de esta biblioteca, además de pequeños tests.