T

teilomillet

@teilomillet
2 ツールスター: 48フォーク: 4
T
retrain
a Python library that uses Reinforcement Learning (RL) to train LLMs.
Python
32
2ヶ月前
T
jiki
説明なし
Python
16
3ヶ月前