大模型卷出白菜价!字节发布豆包大模型,一元钱能买125万Tokens

“卷”入新低

5月15日,在2024春季火山引擎Force原动力大会上,字节跳动自研豆包大模型正式亮相,这也是国内又一家互联网巨头发布的自研大语言模型。

豆包大模型,原名“云雀”,是国内首批通过算法备案的大模型之一,由字节跳动自研,具备多模态能力,涵盖通用模型、语音识别、语音合成、文生图等九款模型。

近期,国内外多家企业在大模型领域动作频频。OpenAI发布了GPT-4o,阿里云推出了通义千问2.5,谷歌在I/O开发者大会上推出了多款AI产品。这些进展表明,AI大模型正快速迭代,市场竞争日益激烈。


一元钱能买125万Tokens


据发布会,字节跳动的豆包系列模型,作为AI技术的个性化与多模态应用的典范,涵盖了语义、声音和图像处理的全方位能力。

豆包通用模型Pro,作为自研的LLM模型专业版,支持长达128K的文本处理,具备理解、生成、逻辑和记忆的综合能力。而Lite版本则以其高性价比,为企业提供了成本效益更高的选择,成本下降84%,延迟降低50%。

声音处理方面,豆包系列模型通过语音合成、声音复刻和语音识别三个模型,展现了其在表达多种情绪、快速声音克隆以及处理复杂语音场景的能力。豆包·文生图模型专注于对中国特色文化的理解和创作,而豆包·Function Call模型则能够智能选择执行任务的函数和算法。

豆包·角色扮演模型满足了用户个性化角色扮演的需求,具备个性化创作能力和剧情推动能力。朱骏副总裁透露,豆包上已有超过800万个智能体被创建.

图源:证券时报

价格上,豆包大模型的主力模型在企业市场的定价仅为0.0008元/千Tokens,比行业价格便宜99.3%,这一定价策略将大模型服务带入了“厘时代”。根据火山引擎公布的价格计算,一元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于三本《三国演义》。

发布会表示,经过一年时间的迭代和市场验证,豆包大模型日均处理1200亿Tokens文本,生成3000万张图片,月度活跃用户量达到2600万。豆包模型已广泛应用于字节跳动旗下的多个产品和业务,并通过火山方舟平台向多个行业客户提供服务。

此外,火山引擎在发布会上与中国电动汽车百人会及20余家汽车厂商成立汽车大模型生态联盟,并与OPPO、vivo等建立智能终端大模型联盟,推动AI技术在汽车和智能设备上的应用。OPPO小布助手、小米“小爱同学”等已接入火山引擎大模型服务,彰显AI技术跨领域合作的潜力。


多企大模型领域动作频频


2024年5月15日,谷歌在其I/O开发者大会上宣布了多项AI产品更新,包括轻量化模型Gemini 1.5 Flash、AI通用智能体Project Astra、AI搜索功能、视频生成模型Veo,以及第六代TPU Trillium。其中,Gemini 1.5 Pro的上下文窗口从100万tokens升级至200万,提升了模型的处理能力。

5月14日,OpenAI公司发布了GPT-4o多模态大模型,它在速度和成本上优于GPT-4 Trubo,并在人机交互的自然性上取得显著进步。GPT-4o能够检测人的情绪,以类似人类或机器人的语调与用户交谈,音频输入响应时间最快可达232毫秒,平均响应时间为320毫秒。

在发布会的演示中,GPT-4o展示了其与众不同的互动能力,能够自然地与人类交流,根据要求变化音色、语调、情感等。OpenAI表示,GPT-4o支持文本、音频和图像的任意组合输入,并能够生成文本、音频和图像的任意组合输出,能够结合视频和音频感受对话者的情绪,并给出充满人类情感的反馈。

5月9日,阿里云正式发布了通义千问2.5,该模型在理解能力、逻辑推理、指令遵循、代码能力上相比上一版本分别提升了9%、16%、19%、10%。在中文语境下,通义千问2.5在多个能力上赶超了GPT-4,并且在安全风险控制方面取得了与GPT-4-Turbo相当的得分,显示出国产大模型的竞争力。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论