今天仿佛是过节,上午Elon musk宣布xAI API正式上线,晚上Anthropic 宣布推出新模型

image

Anthropic 宣布推出改进版的 Claude 3.5 Sonnet、全新的 Claude 3.5 Haiku, 以及一项新“模拟计算机访问”的新功能
也就是Claude 模仿人类的方式使用计算机,例如查看屏幕、移动光标、点击按钮、输入文本等。
开发者可以利用这项功能自动化重复任务、开发和测试软件、进行开放式任务(如研究),甚至在复杂的应用场景中进行交互。
Claude 3.5 Haiku:
Claude 3.5 Haiku 是速度最快的新一代模型,在多项测试中超越了上一代的 Claude 3 Opus,同时保持了低延迟和高指令跟随能力。 该模型适用于用户界面任务、个性化体验生成等需求。
Claude 3.5 Sonnet:
• 该版本在多项行业基准测试中表现优异,尤其在编程和工具使用任务上有显著提升。
• 在编程测试(SWE-bench Verified)中表现提高到49%,在零售领域的工具使用测试(TAU-bench)中提升至69.2%,航空领域则达到了46%。
• 新版 Sonnet 与其前代版本保持相同的价格和速度,并在多步开发过程中提高了推理和编程能力。
更多详细