cfmcgrady

Apache Kyuubi PMC Member / Apache Celeborn PMC Member / Apache Spark Contributor / Delta Contributor

@apacheHangzhou, China

Pinned Repositories

akka-zk-cluster-seed
Language:Scala0 3 00
almond
A scala kernel for Jupyter
Language:Scala0 2 00
ammonite-spark
Run spark calculations from Ammonite
Language:Scala0 2 00
analytics-zoo
Analytics + AI Platform for Apache Spark and BigDL
Language:Jupyter Notebook00
calcite
Mirror of Apache Calcite
Language:Java0 2 00
delta
An open-source storage layer that brings scalable, ACID transactions to Apache Spark™ and big data workloads.
Language:Scala1 3 02
kungfu-panda
Kungfu Panda is a library for register python pandas UDFs in Spark SQL.
Language:Scala1 3 00
spark-adaptive
Language:Scala1 2 00
spark-rest-source
A Rest Api Structured Streaming DataSource
Language:Scala2 3 02
SparkStreamingKafkaDemo
Language:Scala6 3 00

cfmcgrady's Repositories

cfmcgrady/spark-rest-source
A Rest Api Structured Streaming DataSource
Language:Scala2 3 02
cfmcgrady/delta
An open-source storage layer that brings scalable, ACID transactions to Apache Spark™ and big data workloads.
Language:Scala1 3 02
cfmcgrady/kungfu-panda
Kungfu Panda is a library for register python pandas UDFs in Spark SQL.
Language:Scala1 3 00
cfmcgrady/spark-adaptive
Language:Scala1 2 00
cfmcgrady/akka-zk-cluster-seed
Language:Scala0 3 00
cfmcgrady/almond
A scala kernel for Jupyter
Language:Scala0 2 00
cfmcgrady/ammonite-spark
Run spark calculations from Ammonite
Language:Scala0 2 00
cfmcgrady/calcite
Mirror of Apache Calcite
Language:Java0 2 00
cfmcgrady/canal
阿里巴巴mysql数据库binlog的增量订阅&消费组件。阿里云DRDS( https://www.aliyun.com/product/drds )、阿里巴巴TDDL 二级索引、小表复制powerd by canal. Aliyun Data Lake Analytics https://www.aliyun.com/product/datalakeanalytics powered by canal
Language:Java2 0
cfmcgrady/davinci
Davinci is a DVaaS (Data Visualization as a Service) Platform
Language:TypeScript3 01
cfmcgrady/documents-zh
Language:CSS3 0
cfmcgrady/gluten
Gluten: Plugin to Double SparkSQL's Performance
Language:Scala1 0
cfmcgrady/incubator-celeborn
Apache Celeborn is an elastic and high-performance service for shuffle and spilled data.
Language:Java1 0
cfmcgrady/incubator-celeborn-website
Apache Celeborn Site
1 0
cfmcgrady/incubator-hudi
Upserts And Incremental Processing on Big Data
Language:Java3 0
cfmcgrady/incubator-kyuubi
Apache Kyuubi is a distributed multi-tenant JDBC server for large-scale data processing and analytics, built on top of Apache Spark
Language:Scala2 0
cfmcgrady/incubator-kyuubi-website
Apache Kyuubi Site
Language:HTML2 0
cfmcgrady/koalas
Koalas: Pandas API on Apache Spark
Language:Python
cfmcgrady/kyuubi-docker
Apache Kyuubi is a distributed and multi-tenant gateway to provide serverless SQL on data warehouses and lakehouses.
cfmcgrady/mlflow
Open source platform for the machine learning lifecycle
Language:Python2 0
cfmcgrady/mlflow-in-action
3 0
cfmcgrady/raydp
RayDP: Distributed data processing library that provides simple APIs for running Spark on Ray and integrating Spark with distributed deep learning and machine learning frameworks.
Language:Python2 0
cfmcgrady/spark
Mirror of Apache Spark
Language:Scala3 0
cfmcgrady/spark-extensions
Language:Scala2 0
cfmcgrady/spark-sql-perf
Language:Scala2 0
cfmcgrady/SparkCube
SparkCube is an open-source project for extremely fast OLAP data analysis. SparkCube is an extension of Apache Spark.
Language:Scala2 0
cfmcgrady/sqlflow
Brings SQL and AI together.
Language:Go3 0
cfmcgrady/streamingpro
Build Spark Streaming Application by SQL
Language:JavaScript3 0
cfmcgrady/unitycatalog
Open, Multi-modal Catalog for Data & AI
Language:Java0 0
cfmcgrady/velox
A new C++ vectorized database acceleration library aimed to optimizing query engines and data processing systems.
Language:C++2 0