内容持续更新中
包括代码权重流程 明敏 发自 凹非寺 量子位 公众号 | QbitAI 训练大模型,几千块就能实现了! 现在,15小时、几千块钱、85亿 token数据,即可训出中文LLaMA2。 综合性能达到开源社…
单机训练速度提升7.73倍 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 首个开源的ChatGPT低成本复现流程来了! 预训练、奖励模型训练、强化学习训练,一次性打通。 最小demo训练流程仅…
AIGC落地门槛又降低了 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 火爆全球的Stable Diffusion,预训练和微调成本,正式被打下来了! 现在,预训练的速度被提升到6.5倍,成本…
Colossal-AI又上新 深度推荐模型(DLRMs)已经成为深度学习在互联网公司应用的最重要技术场景,如视频推荐、购物搜索、广告推送等流量变现业务,极大改善了用户体验和业务商业价值。 但海量的用户…