内容持续更新中
带动MoE再次成为开源社区最火议题 克雷西 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 一条神秘磁力链接引爆整个AI圈,现在,正式测评结果终于来了: 首个开源MoE大模型Mixtral 8x…
来自“道哥”吴翰清 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 大模型创业,“最安全”的人来了! 吴翰清,前阿里云首席安全科学家、P10级研究员在今年5月离职阿里后,现在被曝投身AI创业。 …
国产AI算力市场生变 明敏 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 没想到,在ChatGPT爆火后的一年里,竟然出现了一个隐藏“Boss”—— 量子位获悉,百度、360等互联网大厂均已开…
实时获取𝕏平台数据 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 大惊喜朋友们!马斯克突然宣布,Grok大模型向付费用户大批量开放了。 点开发现Grok默认就开启了搞怪的趣味模式。 让它讲一个马…
将陆续推出工作、学习场景AIGC创新应用 日前,记者获悉阿里智能信息事业群自研的夸克大模型已通过备案,将陆续在通识、健康、创作等领域升级内容产品与智能工具,并落地一系列AIGC创新应用,借助大模型能力…
梦晨 发自 凹非寺量子位 | 公众号 QbitAI “取消今晚所有计划!”,许多AI开发者决定不睡了。 只因首个开源MoE大模型刚刚由Mistral AI发布。 MoE架构全称专家混合(Mixture…
网友花式自救 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 对于越来越严重的GPT-4偷懒问题,OpenAI正式回应了。 还是用的ChatGPT账号。 我们已收到相关反馈!自11月11日以来没有…
来自FlashAttention作者 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制…
附带12个大模型112页“试题”分析 Pan Lu 投稿 量子位 | 公众号 QbitAI 大模型的“5年高考3年模拟”数学题来了,还是加强强强版! 微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(…
ChatGPT的SFT+RLHF都不是必要的??? 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 要搞大模型AI助手,像ChatGPT一样对齐微调已经是行业标准做法,通常分为SFT+RLHF两步…