内容持续更新中
把语言解码变成博弈过程 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 基于博弈论,MIT提出了一种新的大模型优化策略。 在其加持之下,7B参数的Llama在多个数据集上超越了540B的“谷歌…
“大模型也将成为新型操作系统” 丰色 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 特斯拉前AI总监Andrej Karpathy的新教程火了。 这次,他专门面向普通大众做了一个关于大语言模…
图像、点云和音视频都支持 腾讯&港中文团队 投稿 量子位 | 公众号 QbitAI 在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。 腾讯A…
主打一个规范 MetaGPT团队 投稿 发自 凹非寺 量子位 | 公众号 QbitAI 智能体也要有“规范手册”! 一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中…
LLM+教育AI=? 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 大模型的颠覆和变革,还只是开始。 ChatGPT一炮而红,重塑搜索、办公协同等多个场景和行业后,在线教育,被视为最重要的垂直…
万亿优质数据、4K上下文窗口 王小川的新创业公司百川智能,刚刚推出了70 亿参数量的中英文预训练大模型——baichuan-7B。 baichuan-7B不仅在C-Eval、AGIEval和Gaoka…
“数据其实不只是数字,更是业务流程的表征。” 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 算力吃紧、能耗报警,ChatGPT等AI大模型训练起来,消耗不小。 仅GPT-3训练时,单次训练耗电…
开发者狂喜 白交 发自 凹非寺 量子位 | 公众号 QbitAI 现在,GPT-3.5 Turbo支持自定义微调了! 只需上传自己的数据,就可以运行专属的定制大模型。 开发者狂喜!不少人惊呼:Awes…
孙正义英特尔三星都是股东 梦晨 衡宇 发自 凹非寺量子位 | 公众号 QbitAI 高端GPU持续缺货之下,一家要挑战英伟达的芯片初创公司成为行业热议焦点。 8枚芯片跑大模型,就能支持5万亿参数(GP…
攻击成功率新SOTA 西风 发自 凹非寺量子位 | 公众号 QbitAI 1分钟不到、20步以内“越狱”任意大模型,绕过安全限制! 而且不必知道模型内部细节—— 只需要两个黑盒模型互动,就能让AI全自…