首页 > 快讯 > 快讯详情

智源发布FlagEval“百模”评测结果,字节Doubao-pro-32k-preview位居语言模型主观评测第一

格隆汇12月19日|智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果,语言模型主观评测重点考察模型中文能力,结果显示,字节跳动Doubao-pro-32k-preview、百度ERNIE 4.0 Turbo位居第一、第二,OpenAI o1-preview-2024-09-12、Anthropic Claude-3-5-sonnet-20241022位列第三、第四,阿里巴巴Qwen-Max-0919排名第五。