xla

There are 49 repositories under xla topic.

elixir-nx/nx
Multi-dimensional arrays (tensors) and numerical definitions for Elixir
Language:Elixir2.8k 57 476213
pytorch/xla
Enabling PyTorch on XLA Devices (e.g. Google TPU)
Language:Python2.7k 53 2.7k563
zml/zml
Any model. Any hardware. Zero compromise. Built with @ziglang / @openxla / MLIR / @bazelbuild
Language:Zig2.6k 27 3497
n2cholas/awesome-jax
JAX - A curated list of resources https://github.com/google/jax
1.9k 51 10150
gomlx/gomlx
GoMLX: An Accelerated Machine Learning Framework For Go
Language:Go883 23 538
gordicaleksa/get-started-with-JAX
The purpose of this repo is to make it easy to get started with JAX, Flax, and Haiku. It contains my "Machine Learning with JAX" series of tutorials (YouTube videos and Jupyter Notebooks) as well as the content I found useful while learning about the JAX ecosystem.
Language:Jupyter Notebook750 9 0113
felafax/felafax
Felafax is building AI infra for non-NVIDIA GPUs
Language:Jupyter Notebook566 3 538
mpi4jax/mpi4jax
Zero-copy MPI communication of JAX arrays, for turbo-charged HPC applications in Python :zap:
Language:Python493 10 9332
dfm/extending-jax
Extending JAX with custom C++ and CUDA code
Language:Python398 9 623
JuliaGPU/XLA.jl
Julia on TPUs
Language:Julia222 18 3220
kamalkraj/ALBERT-TF2.0
ALBERT model Pretraining and Fine Tuning using TF2.0
Language:Python204 8 3844
HomebrewML/revlib
Simple and efficient RevNet-Library for PyTorch with XLA and DeepSpeed support and parameter offload
Language:Python129 4 56
inoryy/tensorflow-optimized-wheels
TensorFlow wheels built for latest CUDA/CuDNN and enabled performance flags: SSE, AVX, FMA; XLA
119 8 199
flaport/sax
S + Autograd + XLA :: S-parameter based frequency domain circuit simulations and optimizations using JAX.
Language:Python95 9 2422
HuiResearch/tfbert
基于tensorflow1.x的预训练模型调用，支持单机多卡、梯度累积，XLA加速，混合精度。可灵活训练、验证、预测。
Language:Python59 3 1011
AlibabaPAI/torchacc
PyTorch distributed training acceleration framework
Language:Python46 11 38
sayakpaul/keras-xla-benchmarks
Presents comprehensive benchmarks of XLA-compatible pre-trained models in Keras.
Language:Jupyter Notebook37 1 02
DifferentiableUniverseInitiative/jaxDecomp
JAX bindings for the NVIDIA cuDecomp library
Language:Python32 3 161
scala-network/scala-pool
Official scala pool repository
Language:JavaScript24 5 1613
bahremsd/tmmax
A fast transfer matrix method written in jax for modelling optical multilayer thin films
Language:Jupyter Notebook21 1 194
onnx/onnx-xla
XLA integration of Open Neural Network Exchange (ONNX)
Language:C++19 16 09
sseung0703/TF2-jit-compile-on-multi-gpu
Tensorflow2 training code with jit compiling on multi-GPU.
Language:Python17 2 12
gottingen/tf-reading
tensorflow code reading
Language:C++16 4 01
InikoPro/mineveruscoinonarm
Mine verus coin on ARM like Pi, Tablet, Mobile & Other.
13 1 22
AlibabaPAI/FlashModels
Fast and easy distributed model training examples.
Language:Python11 11 04
mzguntalan/neptune
[WIP] Neptune: JAX iterop-able library in Haskell.
Language:Haskell9 1 00
sayakpaul/you-dont-know-tensorflow
Contains materials for my talk "You don't know TensorFlow".
Language:Jupyter Notebook9 1 02
sayakpaul/xla-benchmark-sd
Provides code to serialize the different models involved in Stable Diffusion as SavedModels and to compile them with XLA.
Language:Python7 1 03
jhn-nt/data-snax
Versatile Data Ingestion Pipelines for Jax
Language:Python5 1 00
kmkolasinski/tensorflow-nanoGPT
Example how to train GPT-2 (XLA + AMP), export to SavedModel and serve with Tensorflow Serving
Language:Jupyter Notebook5 4 01
scala-network/StellitePay-API
DEPRECATED ⛔️
Language:PHP5 5 03
googleinterns/paksha
Compiling JAX to WebAssembly for exploring client-side machine learning
Language:WebAssembly4 3 10
mugithi/google-terraform-pytorch-tpu
Automated provisioner of a Google Cloud TPU environment for training in PyTorch
Language:HCL4 3 53
wcxve/xspex
Access Xspec models and corresponding JAX/XLA ops.
Language:Python4 1 21
jhashekhar/multilingual-clf
Classification of multilingual dataset trained only on English training data using pre-trained models. Model is trained on TPUs using PyTorch and torch_xla library.
Language:Python3 1 00
ReturnToFirst/FastTFWorkflow
Tutorial about How to change your slow tensorflow training faster
Language:Jupyter Notebook2 1 00

xla

elixir-nx/nx

pytorch/xla

zml/zml

n2cholas/awesome-jax

gomlx/gomlx

gordicaleksa/get-started-with-JAX

felafax/felafax

mpi4jax/mpi4jax

dfm/extending-jax

JuliaGPU/XLA.jl

kamalkraj/ALBERT-TF2.0

HomebrewML/revlib

inoryy/tensorflow-optimized-wheels

flaport/sax

HuiResearch/tfbert

AlibabaPAI/torchacc

sayakpaul/keras-xla-benchmarks

DifferentiableUniverseInitiative/jaxDecomp

scala-network/scala-pool

bahremsd/tmmax

onnx/onnx-xla

sseung0703/TF2-jit-compile-on-multi-gpu

gottingen/tf-reading

InikoPro/mineveruscoinonarm

AlibabaPAI/FlashModels

mzguntalan/neptune

sayakpaul/you-dont-know-tensorflow

sayakpaul/xla-benchmark-sd

jhn-nt/data-snax

kmkolasinski/tensorflow-nanoGPT

scala-network/StellitePay-API

googleinterns/paksha

mugithi/google-terraform-pytorch-tpu

wcxve/xspex

jhashekhar/multilingual-clf

ReturnToFirst/FastTFWorkflow