RLHF 相关智能AI资讯及 RLHF相关AI工具 | Weibo AI工具导航-AI导航新方向

首页
标签
RLHF
全部文章

RLHF

7篇

内容持续更新中

“天才少年”计划

2023年报告

2023排行榜

2023科技圈都在关注

3D人体建模

3D姿态跟踪

大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

ChatGPT的SFT+RLHF都不是必要的？？？梦晨发自凹非寺量子位 | 公众号 QbitAI 要搞大模型AI助手，像ChatGPT一样对齐微调已经是行业标准做法，通常分为SFT+RLHF两步…

一行代码提高大模型10%性能，开发者：免费午餐

一行代码提高大模型10%性能，开发者：免费午餐

资源消耗没有显著增加克雷西发自凹非寺量子位 | 公众号 QbitAI 大模型微调有“免费的午餐”了，只要一行代码就能让性能提升至少10%。在7B参数量的Llama 2上甚至出现了性能翻倍的结果…

大模型RLHF不必非得靠人，谷歌：AI反馈效果一样好

大模型RLHF不必非得靠人，谷歌：AI反馈效果一样好

但人力消耗更低克雷西发自凹非寺量子位 | 公众号 QbitAI 说起现如今训大模型的核心方法，RLHF是绕不开的话题。 RLHF，即基于人类反馈的强化学习，无论是ChatGPT还是开源的LLa…

RLHF缺陷完整揭示！MIT哈佛等32位学者联合发布

RLHF缺陷完整揭示！MIT哈佛等32位学者联合发布

报告正文18页克雷西发自凹非寺量子位 | 公众号 QbitAI MIT哈佛斯坦福等机构在内的32位科学家联合指出：被视作ChatGPT成功关键的RLHF，存在缺陷，而且分布在各个环节。他们…

最新RLHF拯救语言模型「胡说八道」！微调效果比ChatGPT更好，两名华人共同一作

最新RLHF拯救语言模型「胡说八道」！微调效果比ChatGPT更好，两名华人共同一作

RLHF的一大缺点，终于被解决了！西风发自凹非寺量子位 | 公众号 QbitAI RLHF（基于人类反馈的强化学习）的一大缺点，终于被解决了！没错，虽然RLHF是大语言模型“核心技巧”之一，然…

玩不起RLHF？港科大开源高效对齐算法RAFT「木筏」，GPT扩散模型都能用

玩不起RLHF？港科大开源高效对齐算法RAFT「木筏」，GPT扩散模型都能用

CV/NLP通用梦晨发自凹非寺量子位 | 公众号 QbitAI 开源大模型火爆，已有大小羊驼LLaMA、Vicuna等很多可选。但这些羊驼们玩起来经常没有ChatGPT效果好，比如总说自己只是…

轻量版ChatGPT训练方法开源！仅用3天围绕LLaMA打造，号称训练速度比OpenAI快15倍

轻量版ChatGPT训练方法开源！仅用3天围绕LLaMA打造，号称训练速度比OpenAI快15倍

支持个性化微调萧箫发自凹非寺量子位 | 公众号 QbitAI 基于Meta模型打造的轻量版ChatGPT，这就来啦？ Meta宣布推出LLaMA才三天，业界就出现了把它打造成ChatGPT的开源…

贡献榜

贡献文章数

阿力

帅气的我简直无法用语言描述！

阿力

帅气的我简直无法用语言描述！

阿强

帅气的我简直无法用语言描述！