Anthropic公司近日发布了其Claude 3.5系列模型,包括全新的Claude 3.5 Sonnet和Claude 3.5 Haiku,这两款模型在性能上取得了显著提升,并引入了AI操控电脑的新功能,为AI技术的未来发展指明了新的方向。
Claude 3.5 Sonnet 是 Anthropic 即将推出的 Claude 3.5 系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude 3 Opus。与此同时,运行速度、成本与自家前代 Claude 3 Sonnet 相当。
使用地址:点击使用
Claude 3.5 Sonnet的主要特点
- 卓越的编码能力: Claude 3.5 Sonnet在编码领域取得了突破性进展,其在SWE-bench Verified测试中的得分从33.4%提升到了49.0%,超越了所有公开可用的模型,包括OpenAI的o1-preview模型。
- 强大的视觉处理能力: 作为Anthropic最强的视觉模型,Claude 3.5 Sonnet在解释图表、图形或从不完美的图像中转录文本等任务中表现出色,尤其在需要视觉推理的任务中表现更为明显。
- AI操控电脑新功能: 最引人注目的是,Claude 3.5 Sonnet引入了“AI操控电脑”(computer use)功能,这意味着AI可以模拟人类操作计算机,包括观察屏幕、移动鼠标、点击按钮和输入文字。这一功能能够自动化重复性工作,支持软件开发和测试,甚至用于开放式研究任务。
Claude 3.5 Haiku的特点
- 性能与成本的完美结合: Claude 3.5 Haiku在保持与Claude 3 Haiku相同成本和速度的同时,实现了显著的性能提升,甚至在多项测试中超越了Claude 3 Opus。
- 快速模型的优势: Claude 3.5 Haiku在编程任务中表现出色,它在SWE-bench Verified测试中的得分达到了40.6%,超越了多款公开可用的顶尖AI模型,包括原版Claude 3.5 Sonnet和GPT-4o。
Anthropic的Claude 3.5系列模型的发布,不仅在技术上实现了重大突破,更在应用上提供了广泛的潜力。随着这些新模型的推出,我们期待AI技术将在更多领域展现其独特的价值,特别是在AI操控电脑等前沿领域。
想了解更多AI行业资讯信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html