返回列表
技术AI大模型机器学习

THUDM发布Slime:基于强化学习的LLM后训练框架

清华大学THUDM团队在GitHub Trending上发布了名为“Slime”的新项目。Slime是一个专为大型语言模型(LLM)设计的后训练框架,其核心功能是利用强化学习(RL)扩展LLM的能力。该项目旨在为LLM的进一步优化和应用提供工具。

GitHub Trending

THUDM团队在GitHub Trending上发布了一个名为“Slime”的新项目。Slime被定位为一个用于RL(强化学习)扩展的LLM(大型语言模型)后训练框架。该项目旨在为大型语言模型的进一步训练和能力扩展提供支持。目前,Slime项目已在GitHub上公开,并提供了中文版说明文档,方便用户了解和使用。

相关新闻