huaxingao

Apache Spark PMC / committer, Apache DataFusion committer

@apple @apacheSan Jose, CA

Pinned Repositories

spark
Apache Spark - A unified analytics engine for large-scale data processing
Language:Scala40.2k 2k 028.4k
arrow-datafusion
Apache Arrow DataFusion SQL Query Engine
Language:Rust0 1 00
arrow-datafusion-comet
Apache Arrow DataFusion Comet Spark Accelerator
Language:Rust0 1 00
arrow-rs
Official Rust implementation of Apache Arrow
Language:Rust0 1 00
delta
An open-source storage layer that brings scalable, ACID transactions to Apache Spark™ and big data workloads.
Language:Scala0 1 00
hudi
Upserts, Deletes And Incremental Processing on Big Data.
Language:Java0 1 00
hyperspace
An open source indexing subsystem that brings index-based query acceleration to Apache Spark™ and big data workloads.
Language:Scala0 1 00
iceberg
Apache Iceberg
Language:Java1 1 00
jvm-profiler
JVM Profiler Sending Metrics to Kafka, Console Output or Custom Reporter
Language:Java0 1 00
parquet-mr
Apache Parquet
Language:Java0 1 00

huaxingao's Repositories

huaxingao/iceberg
Apache Iceberg
Language:Java1 1 00
huaxingao/arrow-datafusion
Apache Arrow DataFusion SQL Query Engine
Language:Rust0 1 00
huaxingao/arrow-datafusion-comet
Apache Arrow DataFusion Comet Spark Accelerator
Language:Rust0 1 00
huaxingao/arrow-rs
Official Rust implementation of Apache Arrow
Language:Rust0 1 00
huaxingao/delta
An open-source storage layer that brings scalable, ACID transactions to Apache Spark™ and big data workloads.
Language:Scala0 1 00
huaxingao/hudi
Upserts, Deletes And Incremental Processing on Big Data.
Language:Java0 1 00
huaxingao/hyperspace
An open source indexing subsystem that brings index-based query acceleration to Apache Spark™ and big data workloads.
Language:Scala0 1 00
huaxingao/jvm-profiler
JVM Profiler Sending Metrics to Kafka, Console Output or Custom Reporter
Language:Java0 1 00
huaxingao/orc
Apache ORC - the smallest, fastest columnar storage for Hadoop workloads
Language:HTML0 1 00
huaxingao/parquet-format
Apache Parquet
Language:Java0 1 00
huaxingao/parquet-mr
Apache Parquet
Language:Java0 1 00
huaxingao/scikit-learn
scikit-learn: machine learning in Python
Language:Python0 1 00
huaxingao/presto
Distributed SQL query engine for big data
Language:Java2 0
huaxingao/pytorch
Tensors and Dynamic neural networks in Python with strong GPU acceleration
Language:C++1 0
huaxingao/spark
Mirror of Apache Spark
Language:Scala2 01
huaxingao/spark-examples
official spark examples adapted for sbt
Language:Scala1 0
huaxingao/spark-redshift
Spark and Redshift integration
Language:Scala2 0
huaxingao/spark-website
Apache Spark Website
1 0
huaxingao/trino
Official repository of Trino, the distributed SQL query engine for big data, formerly known as PrestoSQL (https://trino.io)
Language:Java1 0

huaxingao

Pinned Repositories

spark

arrow-datafusion

arrow-datafusion-comet

arrow-rs

delta

hudi

hyperspace

iceberg

jvm-profiler

parquet-mr

huaxingao's Repositories

huaxingao/iceberg

huaxingao/arrow-datafusion

huaxingao/arrow-datafusion-comet

huaxingao/arrow-rs

huaxingao/delta

huaxingao/hudi

huaxingao/hyperspace

huaxingao/jvm-profiler

huaxingao/orc

huaxingao/parquet-format

huaxingao/parquet-mr

huaxingao/scikit-learn

huaxingao/presto

huaxingao/pytorch

huaxingao/spark

huaxingao/spark-examples

huaxingao/spark-redshift

huaxingao/spark-website

huaxingao/trino