内容持续更新中
专门用于评估语言模型在中文语境下的知识和推理能力 11月16日,根据最新成绩,千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单,多项性能优于GPT-4。在国内大模型赛道火热的当下,夸…