vgoklani

Vishal Goklani vgoklani

Interested in Deep Learning (self-supervised learning & LLMs), Astrophysics (exoplanets), and Cosmology (CMB).... I like to build things

Pinned Loading

pytorch/pytorch pytorch/pytorch Public

Tensors and Dynamic neural networks in Python with strong GPU acceleration

Python 81.6k 21.9k
NVIDIA/TransformerEngine NVIDIA/TransformerEngine Public

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilizatio…

Python 1.8k 288
RedisTimeSeries/RedisTimeSeries RedisTimeSeries/RedisTimeSeries Public

Time Series data structure for Redis

C 997 142
IST-DASLab/gptq IST-DASLab/gptq Public

Code for the ICLR 2023 paper "GPTQ: Accurate Post-training Quantization of Generative Pretrained Transformers".

Python 1.8k 149
fpgaminer/GPTQ-triton fpgaminer/GPTQ-triton Public

GPTQ inference Triton kernel

Jupyter Notebook 271 21
Dao-AILab/flash-attention Dao-AILab/flash-attention Public

Fast and memory-efficient exact attention

Python 13.1k 1.2k