腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2 智源研究院与腾讯联手发布LongBench v2,专为大型语言模型打造的长文本理解基准测试平台。该平台支持超长文本处理,涵盖六大任务类别,评估严谨可靠。测试显示,引入控制变量后模型表现显著提升,特别是... AI资讯# AI大模型推理能力# AI技术发展# LongBench v2 1个月前33