内容持续更新中
重点打磨逻辑推理和强化学习 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 走月更路线的百川智能,在年前猛地加速,变成了半月更: 发布了超千亿参数的最新版本大模型Baichuan 3,是百川智能…
已开启内测 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 让大模型一口气处理35万个汉字,百川智能最新Baichuan2-192K大模型发布。 192K为目前全球最长的上下文窗口,是目前支持长上…
热闹是他们的 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 国内大模型,今天太热闹。 北京,百度开大会,李彦宏亲自展示文心大模型的升级,风头无两。 还是在北京,王小川大模型公司百川智能,毫无征…
下一枪打ChatGPT 衡宇 发自 凹非寺 量子位 |公众号QbitAI 我们现在可以获得比LLaMA更友好,且能力更强的开源模型。 这次在发布会现场表达出“遥遥领先”之意的,是百川智能CEO王小川。…
还得从位置编码算法原理说起 位置编码技术是一种能够让神经网络建模句子中Token位置信息的技术。 在Transformer大行其道的时代,由于Attention结构无法建模每个token的位置信息,位…