/acikseminer2020

Türkiye Açık Kaynak Platformunun organizasyonluğunda düzenlenen Açık Seminer (https://www.acikseminer.com/) serisinin doğal dil işleme haftasındaki sunumumuza ait dosyalar

Açık Kaynak Seminer Programı - 2020

Türkiye Açık Kaynak Platformunun organizasyonluğunda düzenlenen Açık Seminer (https://www.acikseminer.com/) serisinin Doğal Dil İşleme haftasında Açık Seminer 14. Gün: NLP 101: Doğal Dil İşlemeye Giriş konulu sunuma ait kaynaklar.

Açık Seminer 14. Gün: NLP 101: Doğal Dil İşlemeye Giriş

14:00 - 15:50 - NLP 101: Doğal Dil İşlemeye Giriş - Başak Buluz (Gebze Teknik Üniversitesi), Yavuz Kömeçoğlu (Kodiks Bilişim)

📎 Sunum dosyasına buradan erişebilirsiniz.

Sunum içerisinde bir çok kaynağa yönlendirme linkleri mevcuttur.

Örnekler

Metin Ön İşlemleri

  • Zemberek'in Python entegrasyonu olan pyZemberek'den yararlanılmıştır.

Metin Öznitelikleri Çıkartma

TF-IDF ve CountVector Örneği

  • Dr. Deniz Kılınç hocanın ön işlem örneklerinden yararlanılarak oluşturulan çalışma dosyası

Open In Colab

Word2vec Örneği

  • Önceden eğitilmiş Türkçe word2vec modelinin kullanımı ve modelin yapısını anlamak için kelime vektörleri örneklerini içeren çalışma dosyası

Open In Colab

NOT: Word2vec çalışma dosyasını başlatmadan önce 2019.03.20 tarihli Türkçe Wikipedia korpusu ile eğitilmiş word2vec model dosyasını indirerek models/tr_word2vec klasörü altına yükleyiniz.

Sunumda yer alan diğer kaynaklar

Türkçe Stop Words

Önceden Eğitilmiş Türkçe Word2vecler ve Word2Vec eğitme kaynakları

Türkçe NER ve PoS tagging