vgoklani

Vishal Goklani vgoklani

Interested in Deep Learning (self-supervised learning & LLMs), Astrophysics (exoplanets), and Cosmology (CMB).... I like to build things

Pinned Loading

pytorch/pytorch pytorch/pytorch Public

Tensors and Dynamic neural networks in Python with strong GPU acceleration

Python 84.7k 22.8k
NVIDIA/TransformerEngine NVIDIA/TransformerEngine Public

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilizatio…

Python 2k 332
RedisTimeSeries/RedisTimeSeries RedisTimeSeries/RedisTimeSeries Public

Time Series data structure for Redis

C 1k 144
IST-DASLab/gptq IST-DASLab/gptq Public

Code for the ICLR 2023 paper "GPTQ: Accurate Post-training Quantization of Generative Pretrained Transformers".

Python 2k 155
fpgaminer/GPTQ-triton fpgaminer/GPTQ-triton Public

GPTQ inference Triton kernel

Jupyter Notebook 285 23
Dao-AILab/flash-attention Dao-AILab/flash-attention Public

Fast and memory-efficient exact attention

Python 14.5k 1.4k