MongoDB Dökümantasyon

Mongodb üzerinde geliştirme yapmak isteyenler için türkçe dökümantasyon.

Önemli Notlar

Şu anlık sadece aggregation ile ilgili notlar barındırmaktadır.
Bazı yerler yakın zamanda çevrilecektir.
Buradaki notlar 0'dan hiçbir şey anlatmamaktadır. Ders notu gibi bir dökümantasyon çıkartmaya çalıştım. Mongodb ve aggregation kullanmayan herhangi bir kimse notları okuyarak pek bir şey kazanamayabilir.

🎀 İçindekiler

Aggregation

Aggregation Niçin Yapılır?

Real-time analytics
Report generation with roll-ups, sums & averages
Real-time dashboards
Redacting data to present via views
Joining data together from different collections on the "server-side"
Data science, including data discovery and data wrangling
Mass data analysis at scale (a la "big data")
Real-time queries where deeper "server-side" data post-processing is required than provided by the MongoDB Query Language (MQL)
Copying and transforming subsets of data from one collection to another
Navigating relationships between records, looking for patterns
Data masking to obfuscate sensitive data
Performing the Transform (T) part of an Extract-Load-Transform (ELT) workload
Data quality reporting and cleansing
Updating a materialised view with the results of the most recent source data changes
Representing data ready to be exposed via SQL/ODBC/JDBC (using MongoDB's BI Connector)
Supporting machine learning frameworks for efficient data analysis (e.g. via MongoDB's Spark Connector)
...and many more

Aggregation Stageler

Bütün Stageler dökümantasyon: https://docs.mongodb.com/manual/meta/aggregation-quick-reference/

$match filtreleme yapar. sqldeki where sorgusuna denktir. (Filter)

$project spesific olarak istediğimiz fieldları getirmeye yarar. (Projection)

$addFields sorgudan dönen sonuç dökümanına yeni fieldlar eklemeye veya var olanı değiştirmeye yarar.

$group SQL sorgusunda GROUP BY işlevinin yapıldığı stage'dir.

$lookup (join)

$unwind

$sort belirlenen field veya fieldlarda sıralama işlemi yapar.

$limit result'taki max document sayısını belirler.

$count adı üstünde gösterilen dökümanları sayar.,

$merge Writes the results of the aggregation pipeline to a specified collection. The $merge operator must be the last stage in the pipeline. Mongo 4.2

$out merge işleminin daha basit halidir Mongo 2.6 sürümünden sonra kullanılabilir.

$skip belirtilen miktar kadar resulttaki document'ı atlar

$replaceRoot resultı specify edilen şekilde değiştirir. Burada önemli olan kısım veritabanı dökümanını değil aggregation ile dönen dökümanı değiştirdiğidir.

Match

$match filtreleme yapar. sqldeki where sorgusuna denktir.

{$match: {<query>}}

! query find sorgusu ile eşdeğerdir.

<query>

basit bir field için <query>:

$eq
- field o değere eş mi buna bakar.
- ```
{ "$match": { "name": "ahmet" } }
```

$lt $gt $lte $gte

büyüktür küçüktür karşılaştırması yapmak için.
örn-1:
```
{ "$match": { "qty": { "$gt": 5 } } }
```

örn-2:

{ $match: { birth: { $gt: new Date('1940-01-01'), $lt: new Date('1960-01-01') } }

$in ve $all
- string veya number içerisinde var mı diye kontrol eder
- array içerisinde yazılır ve belirtilen stringlerden herhangi biri var mı diye kontrol edilir.
- örn:
```
{ "$match": { "name": { "$in": ["ahmet", "mehmet"] } } }
```
- $in'e benzer bir başka kullanım da $all'dur. In'de içerisinde bunlardan herhangi biri var mı diye bakarız. All da ise bunların tamamı var mı diye bakarız yoksa kabul etmeyiz.
- ! Bir nevi; in => or dur, all => and dir.
- Ayrıca string filtrelemede örneğin in kullanırken içerisinde a barındıran isimleri getir diye mesela regex kullanabiliriz.

birden çok field için <query>:

örn:

{ "$match": { "qty": { "$gt": 5 }, "name": "ahmet" } }

böyle bir kullanım mevcuttur.

nested field(object içinde field , embedded document) için <query>:

iki kullanım mevcuttur:

// Örnek 1
{ $match: { "address.city" : "bitlis" }}
// Örnek 2
{ $match: { "address" : { "city": "bitlis" }}}

Array içinde field için <query>:

iki kullanım mevcuttur:

// Örnek 1
{ $match: {"credit_cards" : { "number": "2333-2333-2333-2333" }}}
// Örnek 2
{ $match: {"credit_cards.number": "2333-2333-2333-2333" }}

Array içinde böyle bir field var mı kontrolü

{ "$match": { "contribs": "UNIX" } } // Contribs arrayinde UNIX field'ı var mı?

Array içinde bu fieldlardan herhangi biri var mı kontrolü
```
{$match { contribs: { $in: [ "ALGOL", "Lisp" ]} }}
```

Array içinde bu fieldların tamamı var mı kontrolü

{$match { contribs: { $all: [ "ALGOL", "Lisp" ] } }}

Array in size'ının (kaç elemanlı olduğunun) kontrolü
```
{$match { contribs: { $size: 4 } }}
```

Array içindeki objelerin elemanlarını AND operatörü ile filtreleme($elemMatch)

{$match { awards: { $elemMatch: { award: "Turing Award", year: { $gt: 1980 } } } }}

Match için dökümantasyonlar:

Project

spesific olarak istediğimiz fieldları getirmeye yarar.

{ $project: { "<field1>": 0, "<field2>": 0, ... } } // Return all but the specified fields

Örnek:

{$project:{ \_id: 0, 'name.last': 1, contribs: { $slice: 2 } } }
// Contribs arrayinden ilk 2 fieldı ve name embedded dökümanından (obje içi obje nested document yani) last field'ını döner.

! concating (Eklenecek.)

$addFields

Sorgudan dönen sonuç dökümanına yeni fieldlar eklemeye veya var olanı değiştirmeye yarar.

Burada çok iyi anlatılmış: https://docs.mongodb.com/manual/reference/operator/aggregation/addFields/#mongodb-pipeline-pipe.-addFields

$group

SQL sorgusunda GROUP BY işlevinin yapıldığı stage'dir. Syntax

{
  $group:
  {
  \_id: <expression>, // Group By Expression
  <field1>: { <accumulator1> : <expression1> },
  ...
  }
}

accumulatorler ve daha fazlası için: https://docs.mongodb.com/manual/reference/operator/aggregation/group/

$lookup

kısaca sql deki natural join e tekabül etmektedir başka bir documentteki field'ı eşleştirmeye yarar.

{
  $lookup: {
    from: <collection to join>,
    localField: <field from the input documents>,
    foreignField: <field from the documents of the "from" collection>,
    let: { <var_1>: <expression>, …, <var_n>: <expression> },
    pipeline: [ <pipeline to execute on the joined collection> ], // Cannot include $out or $merge
    as: <output array field>
  }
}

Örnek:

db.orders.aggregate([
  {
    $lookup: {
      from: "items",
      localField: "item", // field in the orders collection
      foreignField: "item", // field in the items collection
      as: "fromItems",
    },
  },
  {
    $replaceRoot: {
      newRoot: {
        $mergeObjects: [{ $arrayElemAt: ["$fromItems", 0] }, "$$ROOT"],
      },
    },
  },
  { $project: { fromItems: 0 } },
]);

$lookup array içinde kullanımı

Örnek:

Classes'da şöyle bir döküman yapısı olsun.

{ \_id: 1, title: "Reading is ...", enrollmentlist: [ "giraffe2", "pandabear", "artie" ], days: ["M", "W", "F"] }

Aynı şekilde direkt aradığımız fieldı belirler yazarız.

db.classes.aggregate([
  {
    $lookup: {
      from: "members",
      localField: "enrollmentlist",
      foreignField: "name",
      as: "enrollee_info",
    },
  },
]);

lookup dökümantasyon: https://docs.mongodb.com/manual/reference/operator/aggregation/lookup/

$unwind

Bu kaynağa bakabilirsiniz: https://studio3t.com/knowledge-base/articles/mongodb-aggregation-framework/#mongodb-unwind

$sort

belirlenen field veya fieldlarda sıralama işlemi yapar. Kullanım:

{ $sort: { <field1>: <sort order>, <field2>: <sort order> ... } }

<sort order> kullanımı:
- kullanım-1: 1 Ascending artan sıralama
- kullanım-2: -1 Descending azalan sıralama
- kullanım-3: { $meta: "textScore" } Sort by the computed textScore metadata in descending order.
  - computed textscore metadata için kaynak: https://docs.mongodb.com/manual/reference/operator/aggregation/sort/#std-label-sort-pipeline-metadata
Örnek:

{
  $sort: {
    borough: 1;
  }
}

$limit

result'taki max document sayısını belirler.

! limit mutlaka sorttan sonra gelmelidir. sıralandıktan sonra limiti gerçekleştirmelidir. Yoksa sıralanılmamış verinin ilk 20 elemanını sıralardı çok saçma olur. Kullanım:

{ $limit: <positive 64-bit integer> }

Örnek:
```
{
  $limit: 20;
}
```
! Burada önemli olan husus; aggregation da result, bir arraydir ve o array içerisinde o arrayin 20 elemanlı olması gerektiğini söylediğimizdir. Yanlış bir anlaşılma olmasın.

count

adı üstünde gösterilen dökümanları sayar.

! The $count stage is equivalent to the following $group + $project sequence:

db.collection.aggregate( [
{ $group: { \_id: null, myCount: { $sum: 1 } } },
{ $project: { \_id: 0 } } ] )

$replaceRoot

resultı specify edilen şekilde değiştirir.

! Burada önemli olan kısım veritabanı dökümanını değil aggregation ile dönen dökümanı değiştirdiğidir.

Aggregation Örnekleri

👨‍💻 Kurulum

! Bu repostory'de; mongodb'ye node.js(Mongoose Framework) ile bağlantı sağlanmıştır. Bütün işlemler çok benzerdir isterseniz kodlara erişip kendiniz mongo işlemlerini düzenleyip mongodb bash aracılığıyla da kullanabilirsiniz.

! Bu kurulum için mongodb bağlantısı, npm ve node.js'e ihtiyacınız vardır.

Clone repository

$ git clone https://github.com/femresirvan/MongoDB-Dokumantasyon.git
$ cd MongoDB-Dokumantasyon

Npm paketleri kurulumu

$ npm i

➥ ~./app.js

mongoose.connect("mongodb://localhost:27017/samples");
// Bu alanı kendi mongodb conn stringiniz ile değiştirin.

Aggregation Best Practices

Her stage arasını boşluk bırakarak yazın ve stagelerin başına comment "//" kullanın çünkü stage'lerin karışması muhtemeldir.
Her stage ayrı bir aggregate kullanılarak yazılabilir dolayısıyla debugging için o stage'i boş bir aggregation'da çalıştırabiliriz.

Aggregation SQL ile Benzerlikleri

SQL	AGGREGATION
WHERE	$match
GROUP BY	$group
HAVING	$match
SELECT	$project
LIMIT	$limit
sum()	$sum
count()	$sum : 1
join	$lookup
select into new table	$out
merge into table	$merge
union all	$unionWith

Yardımcı Kaynaklar

Mongodb Aggregation Docs

🤝 Teşekkür

Tamamlanacak.