谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家

　　科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型，声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。

　　Gemini已针对不同的应用创建了3个版本，分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。

　　其最小版本Nano旨在在智能手机上运行，实际上有两种模型：一种用于速度较慢的手机，拥有18亿个参数；另一种用于功能更强大的手机，拥有32.5亿个参数。

　　谷歌声称，Gemini的中档Pro版本击败了其他一些模型，但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%，而“专家级”的人类预计能达到89.8%。

　　这是人工智能首次在测试中击败人类，也是现有模型中得分最高的。该测试涉及一系列棘手的问题，包括逻辑谬误、日常道德问题、医疗问题、经济和地理。

　　在同一测试中，GPT-4的得分为87%，LLAMA-2的得分为68%，Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。

　　去年，谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员，而新发布的Gemini声称可击败85%的人类编程师。

　　谷歌“深度思维”的艾力·柯林斯表示，Gemini“几乎在每个领域都是最先进的”。

　　【总编辑圈点】

　　Gemini目前没有可供测试的版本，但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼：我现在就需要它！而对业内人士来说，这个AI更值得注意之处，是它不仅能力最强，还最通用，这意味着其可以适应各种任务。与当前许多专注于文本的模型不同，Gemini接受过文本、图像和声音方面的综合训练，能接受所有这些格式的输入然后再输出，甚至，它还比所有“前辈”模型们更擅长搞开发。【编辑:付子豪】

相关推荐