Dependents of torch-c-dlpack-ext

13 dependents

Package	Description	Downloads/month
quack-kernels		3M
tilelang	A tile level programming language to generate high performance code.	475K
flash-attn-4	Fast and memory-efficient exact attention	406K
sgl-fa4	Fast and memory-efficient exact attention	25K
tensorrt-llm	TensorRT LLM provides users with an easy-to-use Python API to define Large Langu...	16K
kestrel-kernels	CUDA kernel library for Kestrel	13K
kestrel	a fast, efficient inference engine for moondream	11K
tokenspeed-fa4	Fast and memory-efficient exact attention	4K
fa4	Fast and memory-efficient exact attention	357
zsol-bench	NVIDIA SOL ExecBench - GPU kernel evaluation framework	294
pyligent	Diligent framework for python	293
kestrel-kernels-jetson-pt25	CUDA kernel library for Kestrel (Jetson PT25 backend)	64
kestrel-kernels-jetson-pt24	CUDA kernel library for Kestrel (Jetson PT24 backend)	55