广告

谷歌推出AI模型Gemini:多项测试优于GPT-4

2023-12-07 17:05:35 综合报道 阅读:
谷歌正式推出了其认为规模最大、能力最强的人工智能模型Gemini,根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了“最先进的性能”,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。

谷歌正式推出了其认为规模最大、能力最强的人工智能模型Gemini, 据EDN电子技术设计了解,谷歌首席执行官Sundar Pichai在6月份的I/O开发者大会上就已首次透露了该模型,根据 Pichai 和 Google DeepMind 首席执行官 Demis Hassabis 的描述,这是人工智能模型的巨大飞跃,最终将影响几乎所有的 Google 产品。i79ednc

根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了“最先进的性能”,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。i79ednc

大型语言模型 Gemini 将包括三种不同规模的版本: i79ednc

  • Gemini Ultra:用于处理高度复杂任务的最强、最大的模型。
  • Gemini Pro:用于扩展各种任务的最佳模型。
  • Gemini Nano:用于手机等设备的最高效模型。

据悉,“Nano”和“Pro”版本将立即整合到谷歌人工智能驱动的聊天机器人 Bard 及其 Pixel 8 Pro 智能手机中。i79ednc

从 12 月 13 日开始,开发者和企业客户可以通过 Google AI Studio 或Google Cloud Vertex AI中的 Gemini API 访问 Gemini Pro 。Android 开发人员可以使用 Gemini Nano 进行构建。Gemini 还将用于为 Google 产品提供支持,例如 Bard 聊天机器人和搜索生成体验,它试图用对话式文本回答搜索查询(SGE 尚未广泛使用)。i79ednc

Gemini Ultra 目前只提供给被邀请的客户、开发者、合作伙伴以及安全专家进行早期实验和反馈,并计划于明年初向开发者和企业客户推出。i79ednc

根据谷歌周三发布的,Gemini 的 Ultra 模型在一些基准测试中表现优于 GPT-4 ,但承认在让 AI 模型实现更高水平的推理技能方面持续存在困难。因为谷歌还没有像 OpenAI 创建和那样训练单独的图像和语音模型,它从一开始就建立了一个多感官模型。i79ednc

i79ednc

据介绍,Gemini Ultra 的性能在 32 个广泛使用的学术基准测试中有 30 个都表现出了超越当前时代的“先进结果”,而这些基准测试也是当前 LLM 领域最常用、最泛用的测试。i79ednc

其中,它以 90.0% 的得分成为第一个在 MMLU(大规模多任务语言理解)上超越人类专家的模型(该测试结合了数学、物理、历史、法律、医学和伦理等 57 个学科)。i79ednc

Gemini Ultra 还在新的 MMMU 基准测试上表现出了 59.4% 的领先级性能,该测试涵盖了“需要深思熟虑的”不同领域的多模态任务。i79ednc

谷歌表示,其 Bard 将借助 Gemini Pro 版本进行更高级的强化,涉及逻辑推理、规划和理解等功能。它将在超过 170 个国家和地区提供服务,并计划在未来扩展到不同的模态,并支持更多语言和地区。i79ednc

此外,明年初将推出全新升级的Bard Advanced,让用户可以更好地体验到其最好的模型和功能,也就是 Gemini Ultra。i79ednc

据介绍,Android开发人员还将能够借助 AICore构建 Gemini Nano,终端设备则将率先支持 Pixel 8 Pro 系列机型。i79ednc

在接下来的几个月里,Gemini 将应用于更多的产品和服务,例如搜索、广告、Chrome 和 Duet AI 等等。i79ednc

对于谷歌来说同样重要的是,Gemini是在 Google 自己的张量处理单元上进行训练的,比 Google 之前的模型(如 PaLM)运行速度更快、成本更低。i79ednc

Google DeepMind 产品副总裁 Eli Collins表示,尽管 Gemini Ultra 是最大的型号,但其服务成本却要低得多。“它不仅能力更强,而且效率更高,”他说。“我们仍然需要大量计算来训练 Gemini,但我们训练这些模型的能力正在变得更加高效。”i79ednc

除了新模型之外,谷歌还推出了新版本的 TPU 系统TPU v5pi79ednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了