masahi

masahi

Achievements

torchscript-to-tvm torchscript-to-tvm Public

Cuda 68 17
nnvm-vision-demo nnvm-vision-demo Public

Demos interesting image-in, image-out networks running on both NVIDIA and AMD GPUs, with NNVM

Python 49 1
tvm-winograd tvm-winograd Public

Test winograd convolution written in TVM for CUDA and AMDGPU

Python 41 2
tvm-cutlass-eval tvm-cutlass-eval Public

Python 41 7
libflash_attn libflash_attn Public

C++ 14
mxnet-cpp-inference mxnet-cpp-inference Public

Test MXNet C++ API for doing inference, given a trained model

C++ 6 1