Claude 3.5深夜炸街！多指标超过GPT-4o，加码超强实时交互Artifacts-格隆汇

大模型领域再次迎来新突破。

Anthropic 带着他们最强的 AI 模型——Claude 3.5 Sonnet 来深夜炸街。

力压GPT-4o和Gemini 1.5 Pro

Claude系列模型是Anthropic发布的大模型，一直被认为是最接近GPT-4系列的大模型。

据介绍，此次Claude 3.5 Sonnet是Claude 3.5系列的首个版本，它在多个关键评估指标上超越了竞争对手，包括OpenAI的GPT-4o，成为市场上功能最强大、最智能、成本最低的AI模型之一。

性能上的突破

Claude 3.5 Sonnet在智能水平上展现了显著的优势，特别是在研究生水平的推理、本科生水平的知识掌握以及编码能力方面设立了新的行业基准。

它能够以自然、亲切的语气撰写高质量的内容，并且在理解细微差别、幽默和复杂指令方面表现出显著的进步。

这些特性使得Claude 3.5 Sonnet在客户支持或多步骤工作流协调等应用场景中表现出色。

成本效益的显著提升

在成本效益方面，Claude 3.5 Sonnet的每百万输入tokens收费3美元，输出tokens收费15美元，上下文窗口为200k tokens。

与前代Claude 3 Opus相比，新模型的运行速度提升了一倍，而成本仅为原来的五分之一，这使得它在中高端应用场景中极具竞争力。

编码与视觉性能的突破

Claude 3.5 Sonnet的编码能力同样令人瞩目。在内部编程评估中，它解决了64%的问题，相较于Claude 3 Opus的38%，显示出了其在错误修复、功能添加和代码翻译方面的强大实力。

这一能力的提升，对于软件开发和维护领域来说，无疑是一大福音。

在视觉处理方面，Claude 3.5 Sonnet代表了人工智能的一个重要突破。它不仅能执行基本的图像识别任务，还能进行更高级的视觉推理和分析，如解读图表、分析图形等。

特别值得注意的是，它在处理不完美图像中的文本识别能力，这在实际应用中非常重要。

Artifacts功能：智能创作与实时编辑

Anthropic还推出了一项名为Artifacts的新功能，这是Claude.ai平台上的一个创新特性。

当用户要求Claude生成内容如代码片段、文本文档或网站设计时，Artifacts会在对话界面旁边的专门窗口中显示，用户可以实时查看、编辑和基于Claude的创作进行进一步开发。

这一功能不仅创造了一个动态工作空间，使AI生成的内容能够无缝地集成到用户的项目和工作流程中，也标志着Claude从单纯的对话AI转变为一个协作工作环境。

安全与隐私的承诺

在安全评估方面，Claude 3.5 Sonnet保持了与现有主流大模型相同的ASL-2水平，并且Anthropic承诺，除非用户明确授权，否则不会使用用户提交的数据来训练其生成模型。这体现了Anthropic在安全和隐私方面的责任感。

新的活力和竞争

Anthropic的Claude 3.5 Sonnet模型在AI领域具有重要意义，尽管面临性能提升的挑战，Anthropic通过优化数据管理和许可策略，减少了对新架构的依赖。

Claude 3.5 Sonnet的定价具有竞争力，每百万输入和输出tokens的价格略低于OpenAI的GPT-4 Turbo，这可能帮助Anthropic在市场中获得优势。

尽管Anthropic的客户群体正在扩大，包括知名公司，但其企业知名度仍有提升空间。Anthropic注重研发，通过Claude 3.5 Sonnet的性能提升吸引开发者和企业。此外，Claude 3.5 Sonnet在多模态能力上的显著提升，处理速度提升了2倍，显示出AI业界可能已经掌握了加速大型模型推理的技术。

Anthropic正在加大研发力度，推出新工具和功能，如引导AI的实验性功能和基于模型的工具Artifacts，并引入Instagram联合创始人加强产品开发。这些举措体现了Anthropic构建以模型为核心的生态系统的战略，以保持客户忠诚度。

Anthropic的长期成功将取决于其能否围绕Claude 3.5 Sonnet构建强大的生态系统，提供持续的价值和创新。随着AI能力差距的缩小，Anthropic的战略将面临市场的检验。业界对多模态大模型推理加速的掌握预示着未来可能会有更多性能更强、速度更快的AI模型问世。

官博地址：https://www.anthropic.com/news/claude-3-5-sonnet

Claude 3.5深夜炸街！多指标超过GPT-4o，加码超强实时交互Artifacts

力压GPT-4o和Gemini 1.5 Pro

新的活力和竞争

相关阅读

评论