Self Hosted Ai Python Packages

tightwad

Mixed-vendor GPU inference cluster manager with speculative decoding

3K 20 2

ollama-herd

Local AI load balancer for Ollama fleets — auto-discovery, smart routing, OpenAI-compatible API, zero config. Perfect for Mac Minis & Studios.

3K 7 0

artifex

Small Language Model Inference, Fine-Tuning and Observability.

2K 93 13

Search Packages