a Python library that uses Reinforcement Learning (RL) to train LLMs.
GitHubスター
32
ユーザー評価
未評価
フォーク
0
イシュー
閲覧数
お気に入り
フォロワー
リポジトリ
Gist
貢献数