导语:“弱小和无知都不是生存的障碍,傲慢才是”。
最近几个月,微软和谷歌在AI领域的一系列竞争,可谓进行得如火如荼。
然而,在这场决定下个时代的对决中,资金更充足,技术也更雄厚的谷歌,非但在第一回合的较量中败给了微软的chatGPT,甚至如今沦落到连自身的“镇家之宝”也保不住了。
(资料图片仅供参考)
今年3月,谷歌得到了一则震惊不已的消息:三星正在计划用必应搜索引擎来替换谷歌,作为其默认引擎。
新必应,是一款集合了GPT功能的新式搜索引擎
有分析指出,倘若三星真的转投必应,谷歌潜在的利润流失在当年就可能达到30亿美元。
这无疑给了长期稳居搜索引擎霸主的地位的谷歌一记当头棒喝。
为了应对微软的新“必应”带来的威胁,谷歌正在准备着一项“激进的”产品升级计划,其中就包括了原有搜索引擎升级和全新的搜索引擎推出计划。
据《纽约时报》报道,这项全新的搜索引擎,将会尝试预测用户的需求,希望提供“更加个性化的体验”。该项目代号为Magi,将在下月发布,目前有 160 名员工参与研发这个搜索引擎项目。
那么,为何将搜索作为核心业务的谷歌,会丧失了行业前瞻性,以至于到了火烧眉毛的地步,才仓促研发新产品呢?
人才尽失其实,对于谷歌而言,这是个尴尬的问题。因为自从GPT这类AIGC诞生的那天起,搜索引擎就陷入了一个岌岌可危的地位中。
谷歌老员工、Gmail的创建者之一Paul Buchheit就曾表示,像ChatGPT这样的人工智能聊天机器人,将会摧毁谷歌,就像当年搜索引擎彻底干掉黄页电话簿一样。
毕竟,有了能自动生成答案的AI,谁还会费力去搜索结果中大海捞针呢?于是,谷歌愈是卖力地研发AI,就等于愈是加快了“干掉”自己的进程。
根据公开财报显示,2021年,谷歌2576.4亿美元的收入中约有80%来自广告,广告收入是谷歌的生命线,而搜索引擎则是广告的展示平台。
但是,ChatGPT这种对话AI,或新必应这样的新搜索引擎,根本没有为广告的存在提供位置。
在这样的情况下,将对话AI商业化融合进搜索引擎,对谷歌来说,成了一件吃力不讨好的事。
2020 年前后,两位谷歌的工程师(Daniel De Freitas 和 Noam Shazeer)开始在公司内部各种拉资源,决心打造一款在当时绝无仅有,且功能异常强大的 AI 聊天机器人(Chatbot)。
为了让这个项目落地,两人做了很多努力。他们曾经尝试让外部的研究人员访问这款聊天机器人,也试过将机器人集成到谷歌助理(功能类似苹果 Siri) 里,后期,他们还曾推动公司直接公开发布这款产品。
只不过,这些尝试和诉求全被高管挡了回去。
Daniel 和 Noam 很是挫败,他们在 2021 年离开谷歌,成立了一家新公司,继续做着他们在谷歌未竟的事业。他们曾对前同事说,只要还在谷歌,他们的 AI 工具就没法真正面向大众。
其实,做出类似决定的,不只Daniel 和 Noam两位。
作为OpenAI的联合创始人的Sutskever,之前也曾在谷歌担任了近三年的科学家,但却于2015年离开了谷歌。
而之前备受关注的重磅论文Transformer,也是由前谷歌的员工所发表的,当时这被认为是自然语言处理方面的一个重大突破。
Transformer 对 AI 发展有跨时代的意义,研究人员发现,Transformer 在自然语言处理(NLP) 领域效率奇高,以至于 OpenAI 的工程师们寝食难安,直接把 Transformer 引入了自己正在开发的产品。
然而,这篇论文的八位作者,除了Llion Jones,都已经离开了谷歌。
而这样的人才流失,在过去的几年中,在谷歌已经成了一种常态。究其原因,是谷歌内部陈腐、臃肿的官僚系统,和难以触碰的利益蛋糕。
今年2月,前谷歌员工Praveen Seshadri在一篇题为《迷宫在老鼠里》的博客文章中称,该公司已经迷失方向,效率低下,管理不善,并因风险而走向瘫痪。
Praveen Seshadri博客文章的配图:迷宫里的老鼠
Seshadri认为大多数谷歌的员工最终不是为客户服务,而是为其他谷歌员工服务。他将公司描述为一个“封闭的世界”,加倍努力工作不一定会得到回报。
他补充说,员工还被困在一长串的批准、法律审查、绩效审查和会议中,几乎没有给创造力或真正的创新留下空间。
如果说,对搜索领域的执念,以及僵化的制度所造成的人才流失,是谷歌在这场AI竞赛中落后于微软和OpenAI的“软差距”,那么具体在大模型的竞争上,数据的差距则是谷歌短时间内没法追上的“硬功夫”。 技术歧途
与谷歌相比,OpenAI对数据有强大的执念,而数据的差距,则直接决定了大语言模型是否强大。
在ChatGPT的成功中,至关重要的一环,就是高质量的标注数据。凭借着雇佣大量廉价劳工做语义标注,以及上亿用户不断给OpenAI提供新的数据,谷歌和OpenAI的差距只会越来越大。
那么,原先在AI赛道上占尽先机的谷歌,为何在这一关键的环节掉链子了呢?
要知道,谷歌当年的AlphaGo可是接连取得了击败围棋顶尖选手李世石和柯洁的骄人战绩啊。
其实,最重要的原因,是二者在具体的技术路线上,选择了截然不同的两条道路。
在2015年之前,人工智能基本是小模型的天下。
过去的微软小冰、苹果Siri、智能音箱,以及各个平台的客服机器人背后都是小模型,在其系统中包含若干Agent(知行主体,可以理解为执行具体任务的程序),一个专门负责聊天对话。
但是ChatGPT不再是这种模式,而是采用了“大模型+Prompting(提示词)”。
这样的选择背后,是OpenAI渴望开发通一种全领域用人工智能(AGI)的意图。
而谷歌虽然也意识到了大模型的作用,但只是将其作为自己备选方案中的一个,并未全力投入研究。其在BERT之后也推出了T5、Switch Transformer等模型,类似于赛马机制。
虽然从事后诸葛亮的角度来看,这种多头押注的决策,显然是不明智的,但在最初的较量中,谷歌的BERT表现却一点也没让人失望。
2018年,OpenAI推出了1.17亿参数的GPT-1,谷歌推出了3亿参数的BERT,双方展开了一场NLP的较量,结果是GPT-1被BERT打得完败。
在当时的竞赛排行榜上,阅读理解领域已经被BERT屠榜。此后,BERT也成为了NLP领域最常用的模型。
这主要是因为,BERT是一种基于预训练+微调的语言模型,微调过程是在预训练模型的基础上,使用更小的标记数据来调整模型参数。这样可以使得模型更适合特定的任务。
然而,初尝败绩的OpenAI,却依然选择“头铁”地走走“大模型路线”。
接下来的两年(2019、2020年),在几乎没有改变模型架构的基础上,OpenAI陆续推出参数更大的迭代版本GPT-2、GPT-3,前者有15亿参数,后者有1750亿参数。
到了GPT-2时,随着训练参数的扩大,其在性能上已经超过BERT,到GPT-3又更进一步,几乎可以完成自然语言处理的绝大部分任务。
而后来的“人类反馈强化学习机制”,则完成了chatGPT诞生的关键一步。
通过人工标注对模型输出结果打分建立奖励模型,然后通过奖励模型继续循环迭代,OpenAI获得了更真实、更无害,并且更好地遵循用户意图的语言模型InstructGPT。
至此,GPT正式开启了自己在通用人工智能领域突飞猛进的进程,直至2022年11月30日ChatGPT诞生,谷歌终于在这场持续数年的大模型竞争中落了下风。
总结如果要问,OpenAI与谷歌的较量,带给人们最重要的启示是什么,那恐怕就是:在科技前进的道路上,是容不得短视的功利主义、机会主义的。
因为虽然能在局部领域取得优势的技术有很多,但真正能改变时代的关键技术可能只有一个。
而谷歌之所以在这方面,犯了多头下注的错误,究其原因,还是之前定下的“AI first”战略。
而这一战略的造成的影响,就是占坑和排他。
换句话说,但凡有人想出来的AI产品,谷歌就要有类似的。
于是,谷歌对AI first的理解,变成了Google first in AI。
也正因如此,谷歌在战略出发点上选择了大而全的模式,谷歌有类似苹果Siri的谷歌语音助手,有类似亚马逊Echo的智能音箱,有对标Facebook的信息和图片助手等等。
这样的战略,看似巩固了谷歌的江山,却也让其逐渐失去了研究的重心与焦点。
虽然在2019年,谷歌相继展示了更出名、尺寸更大的智能显示器、AR搜索结果、AR地图、Google Lens更新、网络Duplex等成果,
它们大多只是一个现成的东西,区别仅仅是得到了AI的推动。
时至今日,谷歌仍然占据着全球最大的搜索市场份额,与之相比,必应在全球的份额仅为3%。
但在这个生成式AI日益进步的今天,大多数用户,已经厌倦了从海量的搜索结果中,大海捞针似地寻找自己想要的信息。
这样的现实,似乎告诉了我们:在技术革新的浪潮下,庞大的体量,从来不是什么坚不可摧的护城河。
用《三体》中的一句话来说:“弱小和无知都不是生存的障碍,傲慢才是”。
这句话用于评价今天的谷歌,也同样适用。