Polars kütüphanesinin kullanımına dair öğrendiklerimi ve tercüme çalışmalarımı paylaştığım repo.
Rust ve Python için Işık Hızında VeriÇerçevesi (DataFrame) Kütüphanesi.
Polars
, Rust
programlama dilinde yazılmış ve temel olarak Apache Arrow
’u kullanan bir DataFrame kütüphanesidir. Veri düzenleme alışkanlıklarını bilen Polars
, okunabilir ve yüksek performanslı kod oluşturmanızı sağlayacak bir ifade dili kullanarak DataFrame'leri işlemek için tüm özellikleri içeren eksiksiz bir Python API
'ı sunar.
Apache Arrow
, sütunlu verileri işleyen veri analitiği uygulamaları geliştirmek için dilden bağımsız bir yazılım çerçevesidir.
Verimiz Pandas
için çok büyük, Spark
için çok küçük olduğunda Polars
kütüphanesi iyi bir çözüm olacaktır.
Python
programlama diline aşina olduğum için, bu repoda paylaştığım örnekler, polar
kütüphanesinin python
kodları içine dahil edildiği örnekler olacaktır.
-
Kavramlar
- Veri Tipleri
- Veri Yapıları
- Bağlamlar
- İfadeler
- Tembel / İstekli API
- Akış API'sı
-
İfadeler
- Temel Operatörler
- Fonksiyonlar
- Çevrim (Casting)
- Diziler (Strings)
- Kümeleme (# Aggregation)
- Kayıp Veri
- Pencere Fonksiyonları
- Katlamalar / Kıvrımlar (Folds)
- Listeler ve Diziler
- Kullanıcı Tanımlı Fonksiyonlar
- Numpy
-
Dönüşümler
-
Birleştirmeler (Joins)
-
Birleştirmeler (Concatenation)
-
Özet Tablolar (Pivots)
-
Eritmeler (Melts)
-
Zaman Serileri
-
Ayrıştırma (Parsing)
-
Filtreleme
-
Gruplama
-
Yeniden Örnekleme
-
Zaman dilimleri
-
-
-
Tembel API
-
Kullanım
-
Optimizasyon
-
Şema
-
Sorgu Planı
-
Sorgu yürütme
-
-
IO (Girdi / Çıktı)
-
CSV
-
Parquet
-
JSON dosyaları
-
Çoklu
-
Veritabanları
-
AWS
-
Google BigQuery
-
-
SQL
- Giriş
- SHOW TABLES (TABLOLARI GÖSTER)
- SELECT (SEÇİM / SEÇMEK)
- CREATE (OLUŞTUR)
- Ortak Tablo İfadeleri
-
Taşıma / Göç
- Pandas'tan Gelenler
- Apache Spark'tan Gelenler
-
Çeşitli
-
Çoklu İşlem (Multiprocessing)
-
Alternatifler
-
Başvuru Kılavuzları
-
Katkı
-