Comparison of classification methods of protein classes
Colab notebook чтоб удобней смотреть, однако там не видна часть графиков
- ProtLearn - либа базовых фичь и индексов. Используем ее для генерации признаков для классификации
- embedding - есть модель, но непонятно
- tape embedding - - что-то шикарное, берт на белках. Удобная либа - работает. Используем эмбеддинги для сравнения
- bio_embeddings - тоже что-то хорошее с интерфейсом. не устанавливается в колаб
- подход с LSTM, точнее они придумали лучшее решение на CNN
- shap - оценщик бустинга. оцениваем им значимость индексов для классов белков