nikhil-sk

To define is to limit

Palo Alto, California

Pinned Repositories

deep-learning-containers
AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.
Language:Python1 1 00
sagemaker-benchmarks
Benchmark scripts on SageMaker for various frameworks
Language:Python1 2 02

nikhil-sk's Repositories

nikhil-sk/deep-learning-containers
AWS Deep Learning Containers (DLCs) are a set of Docker images for training and serving models in TensorFlow, TensorFlow 2, PyTorch, and MXNet.
Language:Python1 1 00
nikhil-sk/amazon-sagemaker-examples
Example notebooks that show how to apply machine learning, deep learning and reinforcement learning in Amazon SageMaker
Language:Jupyter Notebook
nikhil-sk/backend
Common source, scripts and utilities for creating Triton backends.
Language:C++0 0
nikhil-sk/checksum_repository_agent
The Triton repository agent that verifies model checksums.
Language:C++0 0
nikhil-sk/common
Common source, scripts and utilities shared across all Triton repositories.
Language:C++0 0
nikhil-sk/core
The core library and APIs implementing the Triton Inference Server.
Language:C++0 0
nikhil-sk/dali_backend
The Triton backend that allows running GPU-accelerated data pre-processing pipelines implemented in DALI's python API.
Language:C++0 0
nikhil-sk/djl
An Engine-Agnostic Deep Learning Framework in Java
Language:Java0 0
nikhil-sk/djl-demo
Demo applications showcasing DJL
nikhil-sk/djl-serving
A universal scalable machine learning model deployment solution
Language:Java
nikhil-sk/fastertransformer_backend
Language:Python0 0
nikhil-sk/fil_backend
FIL backend for the Triton Inference Server
Language:Jupyter Notebook0 0
nikhil-sk/identity_backend
Example Triton backend that demonstrates most of the Triton Backend API.
Language:C++0 0
nikhil-sk/onnxruntime_backend
The Triton backend for the ONNX Runtime.
Language:C++0 0
nikhil-sk/python_backend
Triton backend that enables pre-process, post-processing and other logic to be implemented in Python.
Language:C++0 0
nikhil-sk/pytorch_backend
The Triton backend for the PyTorch TorchScript models.
Language:C++0 0
nikhil-sk/repeat_backend
An example Triton backend that demonstrates sending zero, one, or multiple responses for each request.
Language:C++0 0
nikhil-sk/sagemaker-huggingface-inference-toolkit
Language:Python0 0
nikhil-sk/sagemaker-inference-toolkit
Serve machine learning models within a 🐳 Docker container using 🧠 Amazon SageMaker.
Language:Python
nikhil-sk/sagemaker-mxnet-inference-toolkit
Toolkit for allowing inference and serving with MXNet in SageMaker. Dockerfiles used for building SageMaker MXNet Containers are at https://github.com/aws/deep-learning-containers.
Language:Python0 0
nikhil-sk/sagemaker-python-sdk
A library for training and deploying machine learning models on Amazon SageMaker
Language:Python1 0
nikhil-sk/sagemaker-pytorch-inference-toolkit
Toolkit for allowing inference and serving with PyTorch on SageMaker. Dockerfiles used for building SageMaker Pytorch Containers are at https://github.com/aws/deep-learning-containers.
Language:Python1 0
nikhil-sk/serve
Model Serving on PyTorch
Language:Java1 0
nikhil-sk/server
The Triton Inference Server provides an optimized cloud and edge inferencing solution.
Language:Python0 0
nikhil-sk/square_backend
Simple Triton backend used for testing.
Language:C++
nikhil-sk/tensorflow_backend
The Triton backend for TensorFlow 1 and TensorFlow 2.
Language:C++0 0
nikhil-sk/TensorRT-LLM
TensorRT-LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and build TensorRT engines that contain state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT-LLM also contains components to create Python and C++ runtimes that execute those TensorRT engines.
nikhil-sk/tensorrt_backend
The Triton backend for TensorRT.
Language:C++0 0
nikhil-sk/tensorrtllm_backend
The Triton TensorRT-LLM Backend
Language:Python0 0
nikhil-sk/third_party
Third-party source packages that are modified for use in Triton.
Language:C0 0

nikhil-sk

Pinned Repositories

deep-learning-containers

sagemaker-benchmarks

nikhil-sk's Repositories

nikhil-sk/deep-learning-containers

nikhil-sk/amazon-sagemaker-examples

nikhil-sk/backend

nikhil-sk/checksum_repository_agent

nikhil-sk/common

nikhil-sk/core

nikhil-sk/dali_backend

nikhil-sk/djl

nikhil-sk/djl-demo

nikhil-sk/djl-serving

nikhil-sk/fastertransformer_backend

nikhil-sk/fil_backend

nikhil-sk/identity_backend

nikhil-sk/onnxruntime_backend

nikhil-sk/python_backend

nikhil-sk/pytorch_backend

nikhil-sk/repeat_backend

nikhil-sk/sagemaker-huggingface-inference-toolkit

nikhil-sk/sagemaker-inference-toolkit

nikhil-sk/sagemaker-mxnet-inference-toolkit

nikhil-sk/sagemaker-python-sdk

nikhil-sk/sagemaker-pytorch-inference-toolkit

nikhil-sk/serve

nikhil-sk/server

nikhil-sk/square_backend

nikhil-sk/tensorflow_backend

nikhil-sk/TensorRT-LLM

nikhil-sk/tensorrt_backend

nikhil-sk/tensorrtllm_backend

nikhil-sk/third_party