Türkiye Açık Kaynak Platformunun organizasyonluğunda düzenlenen Açık Seminer (https://www.acikseminer.com/) serisinin Doğal Dil İşleme haftasında Açık Seminer 14. Gün: NLP 101: Doğal Dil İşlemeye Giriş konulu sunuma ait kaynaklar.
14:00 - 15:50 - NLP 101: Doğal Dil İşlemeye Giriş - Başak Buluz (Gebze Teknik Üniversitesi), Yavuz Kömeçoğlu (Kodiks Bilişim)
📎 Sunum dosyasına buradan erişebilirsiniz.
Sunum içerisinde bir çok kaynağa yönlendirme linkleri mevcuttur.
- Zemberek'in Python entegrasyonu olan pyZemberek'den yararlanılmıştır.
- Dr. Deniz Kılınç hocanın ön işlem örneklerinden yararlanılarak oluşturulan çalışma dosyası
- Önceden eğitilmiş Türkçe word2vec modelinin kullanımı ve modelin yapısını anlamak için kelime vektörleri örneklerini içeren çalışma dosyası
NOT: Word2vec çalışma dosyasını başlatmadan önce 2019.03.20 tarihli Türkçe Wikipedia korpusu ile eğitilmiş word2vec model dosyasını indirerek
models/tr_word2vec
klasörü altına yükleyiniz.
Türkçe Stop Words
- https://github.com/ahmetax/trstop/blob/master/dosyalar/turkce-stop-words
- https://github.com/hakkiyagiz/turkish-stopwords
Önceden Eğitilmiş Türkçe Word2vecler ve Word2Vec eğitme kaynakları
- http://vectors.nlpl.eu/repository/#
- https://github.com/hakkiyagiz/SIU2019
- https://github.com/akoksal/Turkish-Word2Vec/wiki
- https://dumps.wikimedia.org/trwiki/
Türkçe NER ve PoS tagging