简介

QingMR 将 Hadoop 生态圈重要组件包括 Hadoop , Spark Hive 和 Flink 集成到一起，以云端应用的形式交付给用户使用。当前支持的组件及版本如下：

	Hadoop	Spark	Hive	Flink
QingMR - Core 1.2.1	2.7.3	2.2.0	1.2.2	-
QingMR - Core 1.3.0	2.7.3	2.2.0	2.3.4	-
QingMR - Core 2.5.2	2.9.2	2.2.3	2.3.5	1.9.0

备注：Kyligence Enterprise 作为 Kylin 的企业版也是构建在 QingMR 之上，如需使用可以点击这里获取。

更多组件，敬请期待

QingMR 的主要功能

Hadoop 的 MapReduce、YARN、HDFS 等服务
Spark 的 Spark streaming、Spark SQL、DataFrame and DataSet、Structed Streaming、MLlib、GraphX、SparkR 等功能
Flink 的 DataStream and DataSet、CEP、Table、FlinkML、Gelly 等功能
Hive 的以 SQL 语法读、写和管理分布式大规模数据集的 SQL on Hadoop 数据仓库功能
Kyligence Analytics Platformn 基于 Kylin 的企业级大数据智能分析平台
同时支持 Spark Standalone 和 Spark on YARN 两种模式
支持 Flink on YARN 模式
同时支持 Hive on MapReduce 和 Hive on Spark 两种模式
为了方便用户提交 Python Spark 应用，提供了 Anaconda 发行版的 Python 2.7.13 和 Python 3.6.1 。用户可以选择 Python Spark 应用的运行环境，支持在 Python2 和 Python3 之间进行切换
为了方便用户开发 Python Spark 机器学习类的应用，分别在 Anaconda 发行版的 Python2 和 Python3 内提供了 Anaconda 发行版的数据科学包 numpy, scikit-learn, scipy, Pandas, NLTK and Matplotlib
为了方便用户开发 Spark R 应用，提供了R语言运行时。
支持上传自定义的 Spark 应用内调度器 Fair Schudeler，并支持 spark 应用内调度模式在 FIFO 和 FAIR 切换
支持用户自定义 Hadoop 代理用户及其能够代理哪些 hosts 和这些 hosts 中的哪些 groups
支持上传自定义的 YARN 调度器 CapacityScheduler 和 FairScheduler，并支持在 CapacityScheduler 和 FairScheduler 之间进行切换
支持基于 Spark 的分布式深度学习框架 BigDL
配置参数增加到70多个，定制服务更方便
针对 HDFS、YARN 和 Spark 服务级别的监控告警、健康检查与服务自动恢复
Hadoop, Spark 和 Hive 与 QingStor 集成
指定依赖服务，自动添加依赖服务中的所有节点到 QingMR 所有节点的 hosts 文件中
支持水平与垂直扩容
可选 Client 节点（为了使用上述全部功能，建议 Client 节点为必选），全自动配置无需任何手动操作

更多介绍详见用户指南

QingMR试用

QingCloudAppcenter/QingMR

简介

QingMR 的主要功能