内容持续更新中
量子位智库出品 量子位智库 发自 凹非寺 量子位 | 公众号 QbitAI 大模型,无疑是2023年上半年科技领域最瞩目的关键词。 产业链上个中进展亦或是包括投融资在内的行业聚焦讨论,已经从对技术本身…
FlashAttention时隔一年更新了 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 现有大语言模型的训练和推理速度,还能再快一点—— 快多少?2-4倍。 各种大模型都在用的FlashAt…
打破「不可能三角」 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 微软大模型新架构,正式向Transformer发起挑战! 论文标题明晃晃地写道: Retentive Network(RetN…
要搞懂这2篇顶会论文 Michael Liu 投稿量子位 | 公众号 QbitAI 最近和大模型一起爆火的,还有大模型的微调方法。 这类方法只用很少的数据,就能让大模型在原本表现没那么好的下游任务中“…
众多大模型该如何挑选? 西风 发自 凹非寺 量子位 | 公众号 QbitAI 最近Claude 2亮相、谷歌Bard支持中文、Open AI推出Code Interpreter(代码解释器)…… 大模…
现场直接开启挑战 金磊 发自 天府之国量子位 | 公众号 QbitAI 写网文,现在也要以大模型的“姿势”打开了。 这不,网络文学巨头阅文集团就打响了这么一枪: 正式发布国内首个网文大模型——阅文妙笔…
“数据其实不只是数字,更是业务流程的表征。” 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 算力吃紧、能耗报警,ChatGPT等AI大模型训练起来,消耗不小。 仅GPT-3训练时,单次训练耗电…
李银河李松蔚在内 杨净 发自 凹非寺 量子位 | 公众号 QbitAI 包括GPT-4在内等多个大模型惨遭人类攻击!还是大范围、多边形那种。 而且这个军团被爆个个来头不小。 包括社会学家李银河、心理学…
实测效果在此 明敏 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 想不到,有了AI加持,我也有在我司鲨疯的一天! 同事的压箱底黑照,被我3秒钟就翻了出来,光速做成表情包先发制人。 喏,只需要在…
同时上线13B对话模型 衡宇 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 就在刚刚,王小川的开源大模型又有了新动作—— 百川智能,正式发布130亿参数通用大语言模型(Baichuan-13B…