StableVicuna

来源:橙沐圈子:AI大模型 2024-05-31 19:12:49 562阅读 举报

StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习(RLHF)训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本,它是一个指令微调的 LLaMA 130亿模型。

StableVicuna官网

StableVicuna

第一个通过RLHF训练的大规模开源聊天机器人

访问官网> 攻略讨论>

合作联络微:vapehome
链接:https://www.aiddithome.com/p/e90899f3380e6.html
版权归原作者所有,未经允许请勿转载。若此文章存在违规行为,您可以点击 “举报”

登录 后发表评论
1条评论
JarodYv
1楼 · 2024-05-31 19:39:49

学习简单,上手快