PengleiShi

VipshopShanghai

Pinned Repositories

incubator-gluten
Gluten is a middle layer responsible for offloading JVM-based SQL engines' execution to native engines.
Language:Scala1.2k 41 2.3k434
orc
Apache ORC - the smallest, fastest columnar storage for Hadoop workloads
Language:Java688 47 179483
spark
Apache Spark - A unified analytics engine for large-scale data processing
Language:Scala39.8k 2k 028.3k
data-faker
Fake Data Generation in Scala
Language:Scala00
datafusion-comet
Apache DataFusion Comet Spark Accelerator
Language:Rust00
external-storage
External storage plugins, provisioners, and helper libraries
Language:Go00
gluten
Gluten: Plugin to Double SparkSQL's Performance
Language:Scala00
goofys
a high-performance, POSIX-ish Amazon S3 file system written in Go
Language:Go00
hadoop
Mirror of Apache Hadoop
Language:Java00
hello-world
my first rpository
00

PengleiShi's Repositories

PengleiShi/data-faker
Fake Data Generation in Scala
Language:Scala00
PengleiShi/datafusion-comet
Apache DataFusion Comet Spark Accelerator
Language:Rust00
PengleiShi/external-storage
External storage plugins, provisioners, and helper libraries
Language:Go00
PengleiShi/gluten
Gluten: Plugin to Double SparkSQL's Performance
Language:Scala00
PengleiShi/goofys
a high-performance, POSIX-ish Amazon S3 file system written in Go
Language:Go00
PengleiShi/hadoop
Mirror of Apache Hadoop
Language:Java00
PengleiShi/hello-world
my first rpository
00
PengleiShi/iceberg
Apache Iceberg
Language:Java00
PengleiShi/kubernetes
Production-Grade Container Scheduling and Management
Language:Go
PengleiShi/orc
Apache ORC - the smallest, fastest columnar storage for Hadoop workloads
PengleiShi/PengleiShi.github.io
Language:HTML
PengleiShi/spark
Apache Spark - A unified analytics engine for large-scale data processing
Language:Scala1 0