LSMTree

LSM树技术研究

这个需要和BTree一起来讲，我们都知道BTree是Balance Tree，为了维持Balancing的特性，每次读入的时
候需要对树进行调整，是一笔不小的时间损耗。在一些使用场景下（例如google爬取网页），需要高性能写入，
而对读的要求并不是那么高。因此，LSM树是基于这样的背景下发展出来的，针对类似的场景LSM提出了很多优化
措施。

应用场景

举几个比较常见的例子：HBase、LevelDB、RocksDB

LSM树(Log-Structured Merge Tree)树存储引擎和B树存储引擎一样，同样支持增，删，读，改，
顺序扫描操作。而且通过批量存储技术规避磁盘随机写入问题。当然凡事有利有弊，LSM树和B+树相比，
LSM树牺牲了部分读性能，用来大幅提高写性能。

内存和磁盘中的数据merge操作

LSM树的设计**：
      LSM树的设计**非常朴素：将对数据的修改增量保存在内存中，达到指定的大小限制后将这些
   修改操作批量写入磁盘，不过读取的时候稍微麻烦些，需要合并磁盘中历史数据和内存中最近修改
   操作，所以写入性能大大提升，读取时可能需要先看是否命中内存，否则需要访问较多的磁盘空间。
   极端情况下，基于LSM树实现的HBASE的写性能比MySQL高一个数量级，读性能则低了一个数量级。

   LSM树原理把一棵大树拆分成N棵小树，它首先写入内存中，随着小树越来越大，内存中的小树会
   flush到磁盘上，磁盘上的树定期可以做merge操作，合并成一棵大树，以优化读性能。

   以上这些大概就是HBase存储的设计主要**，这里分别对应说明下：

   因为小树先写到内存中，为了防止内存数据丢失，写内存的同时需要暂时持久化到磁盘，对应
   了HBase的MemStore和HLogMemStore上的树达到一定大小之后，需要flush到HRegion磁盘中
  （一般是Hadoop DataNode），这样MemStore就变成了DataNode上的磁盘文件StoreFile，定
   期HRegionServer对DataNode的数据做merge操作，彻底删除无效空间，多棵小树在这个时机
   合并成大树，来增强读性能。

Minor compaction
      Minor compaction 的目的是当内存中的memtable大小到了一定值时，将内容保存到磁盘文件中

Major compaction
      当某个level下的SSTable文件数目超过一定设置值后，levelDb会从这个level的SSTable中选
      择一个文件（level>0），将其和高一层级的level+1的SSTable文件合并，这就是major 
      compaction

写流程
    LevelDB的写操作包括设置key-value和删除key两种。需要指出的是这两种情况在LevelDB的处理
     上是一致的，删除操作其实是向LevelDB插入一条标识为删除的数据。 
      Memtable并不存在真正的删除操作，删除某个Key的Value在Memtable内是作为插入一条记录实施
      的，但是会打上一个Key的删除标记，真正的删除操作是Lazy的，会在以后的Compaction过程中去
      掉这个KV。

读流程
      首先，生成内部查询所用的Key，用生成的Key，依次尝试从 Memtable，Immtable以及SST文件中读
      取，直到找到（或者查到最高level，查找失败，说明整个系统中不存在这个Key)。

qiuqiuxiaomaomi/LSMTree

LSMTree