Llm Evaluation Metrics Python Packages | PyPI Stats

deepeval

The LLM Evaluation Framework

3.5M 15K 1K

langfair

LangFair is a Python library for conducting use-case level LLM bias and fairness assessments

2K 257 43

evalsense

Tools for systematic large language model evaluations

724 4 1

llmevals

Eval

166 15K 1K

deepevals

The LLM Evaluation Framework

162 15K 1K

testllm

Deep eval provides evaluation platform to accelerate development of LLMs and Agents

81 15K 1K