Off Policy Evaluation Python Packages

obp

Open Bandit Pipeline: a python library for bandit algorithms and off-policy evaluation

3K 705 100

scope-rl

SCOPE-RL: A python library for offline reinforcement learning, off-policy evaluation, and selection

324 141 13

offline-evaluation

Implementations and examples of common offline policy evaluation methods in Python.

319 224 25

Search Packages