
等待终于结束了:谷歌正式发布了Gemini。
谷歌将Gemini作为ChatGPT背后的人工智能模型GPT-4的答案。
这种模式已经在开发商中引起了炒作和兴奋。
NEW LOOK注册获取今日市场、科技和商业领域最重要新闻的内幕消息——每日提供。阅读预览广告
今年等待双子座的感觉有点像等待戈多。
OpenAI是一家相对较小的新贵公司,在2022年11月发布ChatGPT时,它严重抢了谷歌的风头。
科技巨头,尤其是谷歌,什么时候会跟进?
现在我们知道了。
广告
周三,谷歌首席执行官桑达尔·皮查伊和谷歌DeepMind的老板德米斯·哈萨比斯向全世界介绍了谷歌新的生成式人工智能模型Gemini,并将其描述为“迄今为止最强大、最通用的模型”。
Gemini有Ultra、Pro和Nano三种不同的口味,是一种多模式人工智能系统,这意味着它不仅处理文本,还处理代码、音频、图像和视频,以响应用户的提示。它还可以直接集成到移动设备中,这是人工智能模型的第一次,也是应用程序开发商兴奋的地方。
对于谷歌来说,这是一个如此重要的时刻,以至于联合创始人谢尔盖·布林(Sergey Brin)“基本上每天”都在参与它的开发,正如一位Gemini开发者所说的那样。
现在还为时过早,但最初的反应表明,Gemini在与支持ChatGPT的最新大型语言模型GPT-4的较量中表现不错。
广告
首先,一些数据可以说明双子座的表现。
谷歌表示,其最强大的Ultra模型将于明年推出,在评估大型语言模型时,“在32个广泛使用的学术基准中,有30个的结果超过了目前最先进的水平”。
双子座可能比GPT-4更好。但仔细研究一下细节就会发现,这种表现只是微不足道的。
例如,在一个基准测试中,Gemini Ultra在Python编码任务中的成功率为74.4%,而GPT-4的成功率为67%。在另一个基准测试中,Gemini Ultra的阅读理解得分为82.4分,而GPT-4的得分为80.9分。
广告
尽管这是微不足道的,但通过谷歌版的ChatGPT巴德体验Gemini的用户对Gemini的第一印象似乎仍然是积极的。
MosaicML的研究工程师Mihir Patel在X上发布了一些截图,比较了Gemini和GPT-4对“深度学习中的曼巴是什么?”这个问题的回答。
Gemini的回答在截图中更为详细,并链接到了外部研究论文。ChatGPT更接近于一个聪明的维基百科条目。
帕特尔的反应是:“双子座太好了。比GPT-4好得多,快得多。”
广告
在另一个演示中,Gemini准确地描述了一只鸭子在水里游泳的照片。这在社交媒体上引发了一些半开玩笑的回应:“谷歌回来了!”
开发人员可能也会欢迎Gemini,因为它是OpenAI提供的一个有趣的替代品。谷歌向英国《金融时报》表示,由于Nano是为在其Pixel手机上“本地运行”而设计的,Android开发者将更容易开发人工智能应用。
至于Gemini会有多成功,以及谷歌能否用它把用户从ChatGPT中挖走,目前还没有定论。许多想要测试Gemini的用户可能不得不等待,因为该公司仍在继续开发这些模型的非英语版本。
双子似乎仍然很容易受到幻觉问题的影响,这一直困扰着双子座。
广告
皮查伊、哈萨比斯和谷歌的其他高管都熟悉创新者的困境——如果大公司在产品开发上不保持敏捷,就有可能失去市场领导地位。对Gemini的早期反应表明,这个老搜索引擎仍有生机。








