Bu proje, TÜBİTAK'tan İsmail Güzel hocamın yönlendirdiği Veri Yoğun Uygulamalar Modül Projesi içinde Milli Teknoloji Akademisi Yapay Zeka Uzmanlık Programı kapsamında tamamlanmıştır. Proje, farklı sektörlerden elde edilen zaman serileri üzerinde gerçekleştirilen feature engineering işlemlerini içermektedir. Aşağıda proje adımları ve kullanılan teknikler hakkında detaylı bilgiler bulunmaktadır.
-
Veri Toplama:
- Sektörlerin listesine web scraping yöntemiyle erişildi.
- Veriler yfinance kütüphanesi ile toplandı.
-
Zaman Serileri Elde Etme:
- 2005-01-01 tarihinden itibaren haftalık getirilerden oluşan kapanış mometum serileri elde edildi.
-
Faktör Hesaplama:
- 3 büyük sektör (Finans, Sağlık, Teknoloji) üzerinden getirilerin faktörleri hesaplandı, örneğin momentum.
-
Feature Engineering:
- Tsfresh kütüphanesi kullanılarak feature extraction işlemleri gerçekleştirildi.
- İmputing, encoding, transformation, scaling, outliers gibi feature engineering işlemleri ColumnTransformer ve Pipeline ile uygulandı.
-
Model Kurma:
- Yeni elde edilen feature ve sektör sınıfları üzerinden bir classification modeli kuruldu.
- En iyi model seçimi yapıldı.
-
Sektör Benzerliklerinin Belirlenmesi:
- Diğer sektörlerden örnekler alınarak aynı feature engineering yöntemleri uygulandı.
- Hangi sektöre (Finans, Sağlık, Teknoloji) benzediğine karar verildi.
- Python
- Pandas
- Numpy
- Sklearn
- Tsfresh
- Beautiful Soup
- Matplotlib, Seaborn
- feature_engine