内容持续更新中
模型越大效果越好 徐玉庄 投稿 量子位 | 公众号 QbitAI 对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。 不过,这个极限究竟有多大? 清华大学和哈工大的一项联合研究给出的答案是…