广告

宝座易主,Claude 3超越GPT-4成为全球最强模型

2024-03-07 17:18:15 综合报道 阅读:
Claude 3系列的旗舰模型Opus在本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等多个测试中均超越了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra,并在复杂任务上表现出接近人类水平的理解力和流畅性···

近日,Anthropic宣布其Claude 3系列模型正式推出,并在大语言模型(LLM)的各种认知任务上树立了新的性能标杆。Claude 3系列包含三个子模型,分别为Claude 3 Haiku、Claude 3 Sonnet和 Claude 3 Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用的需求。tgLednc

三款型号模型不同的定位如下:tgLednc

  • Opus:智能程度最高。适用于复杂的任务自动化、研发和制定策略;
  • Sonnet:比其他同类模型更实惠,更适合规模化。适用于数据处理、销售、为任务节省时间;
  • Haiku:比同类模型更智能、更快速、更实惠。适用于与用户实时互动、内容审核以及在简单工作流程中节省成本。

据官方称,Claude 3系列的旗舰模型Opus在本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等多个测试中均超越了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra,并在复杂任务上表现出接近人类水平的理解力和流畅性。tgLednc

tgLednc

性能测试对比tgLednc

据了解,Claude 3模型可以支持实时客户聊天、自动完成和数据提取任务,提供近乎即时的响应结果。以Haiku为例,它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文(约10k token)。并且三种型号的模型都具有与其他领先模型相当的复杂视觉功能,可以处理各种视觉格式,包括照片、表格、图形和技术图表。tgLednc

tgLednc

视觉能力对比tgLednc

上下文方面,Anthropic表示,此次全系列大模型均将提供200k token的上下文窗口(相当于150000个单词),并都能够接受超过100万个token的输入,用户可以输入大量数据集,并要求其以备忘录、信件或故事的形式进行摘要,整体来看其单词处理能力接近ChatGPT的50倍。tgLednc

据悉,Opus和Sonnet现已可在claude.ai中使用,已有159个国家/地区提供支持,Sonnet可免费体验,Opus需要付费订阅,Haiku则还需要一段时间才会推出。tgLednc

责编:Ricardo
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了