beryllw

Big Data.

IQIYI Inc.shanghai

Pinned Repositories

amoro
Amoro is a Lakehouse management system built on open data lake formats.
Language:Java0 0 00
arrow-datafusion
Apache Arrow DataFusion SQL Query Engine
Language:Rust0 0 00
arrow-datafusion-comet
Apache Arrow DataFusion Comet Spark Accelerator
Language:Rust0 0 00
arthas
Alibaba Java Diagnostic Tool Arthas/Alibaba Java诊断利器Arthas
Language:Java0 0 00
atlas
Apache Atlas
Language:Java0 0 00
duckdb-journey
10
flink
Apache Flink
Language:Java0 0 00
flink-cdc
Flink CDC is a streaming data integration tool
Language:Java0 0 00
incubator-kyuubi
Apache Kyuubi is a distributed multi-tenant JDBC server for large-scale data processing and analytics, built on top of Apache Spark
Language:Scala0 0 00
spark
Apache Spark - A unified analytics engine for large-scale data processing
Language:Scala0 0 00

beryllw's Repositories

beryllw/duckdb-journey
10
beryllw/amoro
Amoro is a Lakehouse management system built on open data lake formats.
Language:Java0 0 00
beryllw/arrow-datafusion
Apache Arrow DataFusion SQL Query Engine
Language:Rust0 0 00
beryllw/arrow-datafusion-comet
Apache Arrow DataFusion Comet Spark Accelerator
Language:Rust0 0 00
beryllw/beryllw.github.io
Language:Ruby0 1 00
beryllw/flink
Apache Flink
Language:Java0 0 00
beryllw/flink-cdc
Flink CDC is a streaming data integration tool
Language:Java0 0 00
beryllw/incubator-kyuubi
Apache Kyuubi is a distributed multi-tenant JDBC server for large-scale data processing and analytics, built on top of Apache Spark
Language:Scala0 0 00
beryllw/spark
Apache Spark - A unified analytics engine for large-scale data processing
Language:Scala0 0 00
beryllw/BigDataNotes
1 0
beryllw/chunjun
A data integration framework
beryllw/compass
Compass is a task diagnosis platform for bigdata
Language:Java0 0
beryllw/debezium
Change data capture for a variety of databases. Please log issues at https://issues.redhat.com/browse/DBZ.
beryllw/flink-cdc-playground
playground for flink-cdc
beryllw/fluss
Fluss is a streaming storage built for real-time analytics.
Language:Java0 0
beryllw/gitbook
The open source frontend for GitBook doc sites
beryllw/gluten
Language:Scala0 0
beryllw/gravitino
World's most powerful open data catalog for building a high-performance, geo-distributed and federated metadata lake.
Language:Java0 0
beryllw/gravitino-playground
A playground to experience Gravitino
Language:Jupyter Notebook
beryllw/incubator-paimon
Apache Paimon(incubating) is a streaming data lake platform that supports high-speed data ingestion, change data tracking and efficient real-time analytics.
Language:Java0 0
beryllw/kyuubi-shaded
Apache Kyuubi Shaded Dependencies.
Language:Java0 0
beryllw/rust-by-practice
Learning Rust By Practice, narrowing the gap between beginner and skilled-dev through challenging examples, exercises and projects.
beryllw/rust-study
Language:Rust1 0
beryllw/seatunnel
SeaTunnel is a next-generation super high-performance, distributed, massive data integration tool.
Language:Java0 0
beryllw/spark-benchmark
sql benchmark for test spark+gluten
1 0
beryllw/spark-eventlog-connector
Spark Eventlog Connector build on DataSourceV2 API
beryllw/starrocks-connector-for-apache-flink
beryllw/temporary-work
Language:Java1 0
beryllw/tugraph-analytics
TuGraph-analytics is a distribute streaming graph computing engine.
Language:Java0 0
beryllw/velox
A C++ vectorized database acceleration library aimed to optimizing query engines and data processing systems.
Language:C++0 0