Agent Eval Python Packages

understudy

Scenario Testing for AI Agents

542 2 0

agent-convergence-scorer

Score how similar N agent outputs are — exact match, Jaccard token overlap, divergence point, composite 0-1 score. Stdlib-only.

411 0 0

Search Packages