谷歌推出新一代大模型 Gemini:其性能可能超越 GPT-4 设定的新标杆
12 月 6 日,谷歌宣布推出其认为规模最大、功能最强大的人工智能模型 Gemini。
谷歌首席执行官皮查伊表示,Gemini 1.0 是目前为止谷歌能力最强的通用人工智能模型,Gemini 是原生多模态打造,是谷歌通往 Gemini 模型时代的第一步。

据介绍,Gemini 1.0 是谷歌筹备了一年之久的 GPT4 真正竞品,将包括三种不同的套件:Gemini Ultra、Gemini Pro 和 Gemini Nano。其中 Ultra 的能力最强,复杂度最高,能够处理最为困难的任务;Pro 能力稍弱,可以用来处理多任务;Nano 则更注重于端侧的处理能力。
和市面上现有大模型相比,Gemini 从一开始就被创建为多模态的模型。因为从最初的预训练数据开始,Gemini 就在针对不同模态的模型进行训练,这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。在灵活度上,从数据中心到移动设备上,它都能够运行。

谷歌表示,对 Gemini 模型进行了严格的测试,并评估了它们在各种任务中的表现。从自然图像、音频和视频理解到数学推理,在被大型语言模型(LLM)研究和开发中广泛使用的 32 项学术基准中,Gemini Ultra 的性能有 30 项都超过了目前最先进的水平。
在权威 MMMU 基准测试中,Gemini Ultra 获得了 59.4% 的 SOTA 分数。作为对比,人类专家的得分率为 89.8%,GPT4 得分率为 86.4%。但是谷歌并没有透露 Ultra 和 Pro 版本的具体参数规模。

此外,谷歌还基于 Gemini 模型开发了专业的代码模型 AlphaCode 2。与前一代相比,AlphaCode 2 的性能提升了至少 50% 以上。
谷歌表示计划通过谷歌云将 Gemini 授权给客户,供他们在自己的应用程序中使用。从12 月 13 日开始,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。
相关攻略
-
谷歌推出新一代大模型 Gemini:其性能可能超越 GPT-4 设定的新标杆
12 月 6 日,谷歌宣布推出其认为规模最大、功能最强大的人工智能模型 Gemini。 谷歌首席执行官皮查伊表示,
-
NuEyes 和 HTC VIVE 联手推出适用于低视力用户的可穿戴增强现实解决方案
近日,医疗 AR VR 眼镜方案商 NuEyes 宣布与 HTC VIVE 合作,为低视力人群打造 NuEyes e
-
《鸣潮》2.4七丘声匣位置一览 七丘声匣回收位置分享:探索神秘潮汐,收集惊喜宝藏
体验激荡潮汐的刺激!如今的游戏圈子,谁都想在众多玩家中脱颖而出,而《鸣潮》这个充满神秘与冒险的游戏正
-
VR 医疗培训企业 Vantari VR 成功获得 700 万美元 Pre-A 轮融资,进一步推动医疗教育创新
近日,沉浸式培训解决方案提供商 Vantari VR 宣布完成 700 万美元 Pre-A 轮融资。本轮融资由 Co
-
VR 社交平台《Horizon Worlds》正式推出全新会员制世界,提升用户互动体验
近日,VR 社交平台《Horizon Worlds》已正式推出会员制虚拟世界服务,使该平台能够被俱乐部、团体和社区使
-
WEN币已经上线了哪些主要交易所?购买WEN币的详细步骤解析
WEN币是一个建立在Solana链上的模因币,该项目旨在利用模因文化来创造一种有趣且引人入胜的加密货币,与加密货币社区轻
-
Liquid AI 成功获得近 4000 万美元融资,专注发展液态神经网络人工智能技术
近日,由 MIT 孵化的初创公司 Liquid AI 成功完成近 4000 万美元的种子轮融资。 该轮融资由多家风
-
欢乐对决魔力圈圈的玩法详解:如何在游戏中获得更多乐趣和胜利
欢乐对决中的魔力圈圈玩法是一种充满趣味与策略的游戏模式。在这个模式里,玩家需要操控角色在场景中与各种对手展开激烈对抗,利