StableVicuna

2025-12-23 12:06:47

第一个通过RLHF训练的大规模开源聊天机器人

收录时间：

2025-12-23 12:06:48

StableVicuna

StableVicuna网页截图,StableVicuna网页快照

StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习（RLHF）训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本，它是一个指令微调的 LLaMA 130亿模型。

StableVicuna相关导航

Evidently AI

开源的机器学习模型监测和测试工具

Replicate

在线运行开源机器学习模型

Scale AI

AI机器学习标注训练平台

Lobe

简单免费的机器学习模型训练工具

Watsonx.ai

IBM推出的企业级生成式人工智能和机器学习平台

StableVicuna

第一个通过RLHF训练的大规模开源聊天机器人

Imagen

Google AI文字到图像生成模型

HuggingFace

AI模型开发社区

StableVicuna 暂无评论