在谷歌巨大的商业化版图面前,单纯提前一天发布 GPT-4o,似乎并没有给 OpenAI 带来足够的优势。
在 2024 Google I/O 大会上,Google 展示了一系列 AI 技术突破,包括 AI 生成视频、AI 驱动的 Workspace 自动化工具,以及产品效果直逼 GPT-4o 的语音助手。众多 AI 产品的发布,形成了某种意义上的 " 狼群效应 ",正帮助 Google 扭转被动追赶的局面。
另外,Gemini 的多模态能力、Android 15 的 AI 增强,不仅提升了用户体验,也显著增强了谷歌生态系统的粘性。相比之下,OpenAI 可能技术上领先一步,但在应用广度上显得相对单一。
如今,Google 带着 " 巨头范儿 " 的反击越来越犀利,而对于 GPT-5 的发布时间仍持谨慎态度的 Sam Altman 而言,压力变得越来越大。
巨头反击教材第一章:放大优势
巨型企业的战略布局,往往建立在持续加强优势业务的前提下。而 Google 起家于搜索,长于 Workspace 等一系列办公套件服务,而这也成了 2024 年 Google I/O 大会发布的重点。
完善的 AI 搜索能力,是业内翘首以盼的。Google 本次发布的 AI Overview,在多模态的问题上做足了文章——
比如 "Ask with video",利用 Gemini 的多模态能力与 Google Lens 相结合,可以实现视频搜索,只要录制一段视频,就能知道用户使用唱片机,甚至维修照相机;Google Photos 中还推出了新的 AI 功能 "Ask Photos",可以通过简单的提问在大量照片中找出 " 孩子多年来学习游泳的历程 "。
OpenAI 还展示了一款名为 Project Astra 的多模式 AI 助手,可以观看并理解通过设备摄像头看到的内容,记住用户的东西在哪里,帮用户在现实世界 " 搜索 " 物品,或是完成其他任务。
Google 版 AI 搜索的输出结果不再是网址的罗列,而是一个全新的整合页面——它更像一份针对用户提问而形成的报告,不仅包括对问题本身的回答,也包括对用户可能忽略问题的猜测和补充,在产品形式上,也算做到了图文并茂。
国内某大厂同样推出了 AI 搜索功能,但只是在传统搜索页面上,利用占网页五分之一左右的空间,植入生成式 AI 的输出结果,且只能针对特定问题触发。整体完成度较低,因而也没有做太高调地发布和宣传。
两相比较之下,Google 此次对于 AI 搜索的革新可见一斑。在有限的搜索引擎市场里,这奠定了全新的标准。而对于模式已经固化多年的搜索广告而言,也更有想象空间。
Google 不是在发布某一项大模型能力,而是在试图重新占领用户心智。当下,Google 的搜索里面是 "Ask,Not Search",多模态的交互方式,只是在用户层面进一步完善围绕 "Ask" 建立的产品概念。
搜索的改造仅仅是个开始,Google 希望搜索能成为激发用户 AI 需求的超级入口,即使用户不知道具体该问什么,Google 也可以给出推荐,帮用户脑暴。这时,搜索界面会进一步变化,变成信息流的形式,每个卡片都可以进一步操作。
在搜索之外,Google 的另一个优势领域是 Workspace。Google 为 Workspace 发布了一款与国内火爆的 " 数字员工 " 非常相似的产品—— AI Teammate。
首先,Gemini 1.5 Pro 即将被植入 Workspace 的文档、表格、幻灯片、云端硬盘和 Gmail 的侧边栏中,涵盖企业日常运营的各个方面。Gemini 可以帮用户查找具体的业务信息而不是通用信息;直接从电子邮件中检索相关的 PDF 文件;整理和管理电子邮件中的收据,并进行归档,或者从收据中提取信息并添加到表格中。
Gmail App 中加入 Gemini 后,还可以提供了更加详细和上下文相关的回复建议,还能够为用户提供电子邮件的摘要。
同时,Google 还将 Gemini 与 Google 生态的日历、任务、Keep 集成,使其 AI 产品成为一个全面的数字助理。Google 还在 Gemini 执行任务前设置了检查机制,确保信息的准确性,而 Google 助力相比其他智能助手最大的优势就在于 Gemini 与 Google 原生产品的无缝集成。
在企业中,数字员工最早的产品是利用 RPA(机器人流程自动化)来自动化执行重复性、高量化、基于规则的任务。过去一年中大语言模型爆发,使很多办公软件、办公协作产品公司看到了机会,纷纷在会议、邮件、协同,以及文档管理等领域推出了大模型加持的数字员工产品,其中不乏国内大厂。
Google 入局此类产品,无疑加剧了行业内的竞争,也给关注此领域的企业树立了一个 " 巨头 " 标杆。在 Google 全套工具的配合下,AI teammate 的 AI 不再是散点工具。它的功能不只是简单的安排日程、订会议、做会议纪要。
在 Google 全家桶的配合下,AI teammate 可以真正理解业务流,理解业务上下文,并给出结论,甚至帮助评估风险业务,回答项目能否按期完成,这甚至已经接近一个 " 董事长助理 " 的工作了
Gemini 支持的 Workspace 将在 2024 年 6 月,以 " 通用助手 " 的形式向付费订阅者推出。
AI 搜索和 AI Workspace 共同组成了 Google 版 AI Agents 的初貌:更强的多模态能力,全面深入多个场景的信息处理,真实理解企业的工作流。相比之下,OpenAI 的 GPT-4o 虽在生成式 AI 技术上有优势,但在办公应用场景中尚未形成全面、高效的解决方案。
巨头反击教材第二章:多打组合拳
除了核心优势业务,Google 也在 2024 Google I/O 大会上对整个生态系统进行了全面升级。
首先是围绕 YouTube 的视频领域。Google 推出了对标 Sora 的 Veo,Veo 同样可以输出时长 1 分钟左右的稳定 1080p 视频。Google 称已经向一些创作者提供 Veo,用于 YouTube 视频制作,同时也向好莱坞推销其用于电影制作,且 Veo 的部分功能将很快落到 YouTube Shorts 中。
Google 还推出了对标 GPT-4o 的 " 可打断的 " 语音助手 Gemini Live,可以在 Android 上实现双向流畅的 AI 对话体验;还有角色聊天机器人 Gems ,与 OpenAI 的 GPT Store,以及 Character.AI 类似,Gems 可制作定制的 ChatGPT 聊天机器人,完成某些任务并保留特定的特征,例如与爱因斯坦或马斯克对话,甚至可以为自己制作一个 " 假的 " 心理医生。
此外,Google 和 OpenAI 一样,都关注教育场景。
Google 推出了 Android 的 Circle to Search,可以应用到家庭教育场景中。通过多模态模型提供个性化的互动式教育体验。这款产品不仅能理解和回应学生的问题,还能根据学习进度调整教学内容,提升了教育过程的互动性和效果。
疫情放大了在线教育的价值,家长也开始不断提高对家庭教育的重视。调研机构 MarketsandMarkets 的分析指出,全球数字教育市场规模预计从 2023 年的 194 亿美元增长到 2028 年的 667 亿美元,年复合增长率达 28.0%。
Gems、Circle to Search 与 Gemini Live 等产品,无疑可以大幅提高在线教育的互动体验,并基于 AI 为不同孩子提供个性化的教育方案,弥补了传统教育模式难以满足所有学生的需求的问题。
除了商业生态和场景,在 AI 基础设施方面,Google 也进行了升级,这一点主要针对大模型 ToB 业务的成本问题。
本次 Google I/O 大会上,Google 将自研 AI 芯片升级到第六代 TPU(张量处理单元)Trillium,与第五代相比,每个 TPU 的计算性能提高了 4.7 倍。谷歌还宣布将成为首批提供 Nvidia 下一代 Blackwell 处理器访问权限的云提供商之一。
Google CEO Sundar Pichai 表示:" 我们将继续投资基础设施,以推动人工智能的进步。"
相比于 OpenAI 和微软的合作模式,Google 通过自身业务生态系统的紧密协作,提升了 Google Cloud 以及 AI 相关服务的兼容性和互操作性,也为开发者提供了更强大的工具和支持,整体的技术和商业化竞争优势更加明显。
在本次 Google I/O 大会上,Google 总共 124 次提及 AI。从商业生态到应用场景,再到基础设施,Google 几乎对所有产品、能力进行了一次围绕 AI 的升级。
相对于 OpenAI,Google 业务的战线更长,这既是劣势,也是优势。一套组合拳下来,OpenAI 前一日的全部发布,成为了 Google 发布的章节内容。这使得 Google 从单纯的产品性能对比层面一跃而出,居高临下的俯视 2024 年初的生成式 AI 市场竞争。
巨头反击教材第三章:整点新公司玩不起的
对于 Google 来说,所有的软件能力,最终都会在硬件上有所体现——为什么不呢?Google 既有产品线,也有相关市场经验。相对于软件服务,硬件业务的重资产属性更明显,新锐公司很难玩得起,但 Google 如鱼得水。
Google 在本次大会中不仅明确了 Pixel 手机将具备原生 Gemini 能力,使设备的多任务处理能力大幅提升,还宣布了很多 Android 15 中将推出的 AI 功能。
事实上,Gemini 早已作为独立 App 在 Android 端上线。此次,更新中 Gemini 对话过程中,用可以直接将生成的图像拖拽到其他应用中使用。在 Android 15 中,Gemini 则支持了 YouTube 视频内容识别功能。Gemini 可以在视频播放界面直接提取相关信息,回答用户关于视频的各种问题,甚至生成视频内容摘要。
此外,用户可以同时运行多个应用程序而不影响性能,这在以往手机中是难以实现的。此外,Gemini AI 根据用户习惯提供个性化推荐,使手机使用更加贴心便捷。这种智能化服务提高了用户满意度,增强了 Google 在智能手机市场的竞争力。
实时语音助手功能,在 Pixel 以及安卓系统中的落地,也必将使生态更加闭环。
在 Gemini 发布时提到的轻量化 Nano 版本已确认将用于 Chrome 的改进,在轻量化模型方面,Google 又推出了全新的 Gemini Flash。这两款 Gemini 模型以及开源的 Gemma 模型,都将在未来的端侧 AI 设备方面,为 Google 积蓄模型力量。
相比于过去单纯讨论芯片性能和安全性,Google 的 AI 手机更加性感,也更符合实际。虽然 Pixel 手机的硬件水平在手机行业中一直处于落后地位,其唯一的竞争优势就是原生 Android 系统。如今作为 Android+AI 的原生设备,Pixel 或将迎来新的春天。
Android 的 Gemini 更新将在 " 未来几个月内推广到数亿台设备 ",并且更多的上下文功能正在开发中。
Android 的生态能力优势,第一次变得如此突出,Gemini 在其中加码极大。对于苹果而言,在 WWDC 到来前,一切都是未知。对于新生的华为鸿蒙而言,挑战更加剧烈。
有趣的是,AI 不仅在 Google 的主力硬件产品中找到了丰富的应用场景,Google 还展示了 Google Glass 的最新应用,似乎想告诉外界:有了 AI 的加持,即使是过去被认为失败的项目,如今也能为新的创新提供基础和灵感。
由此向下继续推演,在 Gemini 和硬件能力的加持下,即使 Google 要杀入最火热的 AI PC 市场的也会 " 顺滑 " 无比。
结语
如何评价谷歌本次发布?不妨先看一下谷歌对哪些公司造成了威胁。
首先,AI 搜索。除了已知的 AI 搜索公司 PerplexityAI,以及传说中的 OpenAI 搜索,Google 最直接威胁的当然是传统的搜索引擎。Google 不只是简单的在搜索结果中增加一个 AI 总结,或是以自然语言对话方式进行搜索,Google 的多模态 AI 搜索,几乎可以说是改变了搜索的范式,提升搜索智能化的同时,极大地提高了用户的使用体验。
基于 Google 这样的升级不管是有 GPT-4 加持的 Bing,还是利用文心一言探索 AI 搜索的百度,都必须在 AI+ 搜索的产品力方面加快创新步伐,才有可能在这一领域保持竞争力。
在办公软件、协作办公方面。Workspace 的升级,使 Google 有能提供 " 真正的 " 数字员工。Google 不只是要对标老牌竞争对手微软,更是对所有研发数字员工、AI 办公软件以及 AI 协同办公的供应商发出了挑战。以钉钉、飞书、WPS 为代表的公司,在文档处理,以及办公、协作等方面的,可能都要重新评估自身的产品力。
在手机行业中,受到 AI 冲击最大的厂商必然是苹果,作为 AI 大模型时代唯一落后的巨头,如果不在 iOS 生态中引入更多创新,苹果恐怕很难应对来自 Android 阵营的 AI 攻势。而其他手机厂商,不管如何高唱 AI 手机概念,在 Android+Gemini 的裹挟下,基于系统的 AI 升级空间将会越来越小,要保持竞争力,就只能在硬件、生产成本,以及供应链等方面 " 抠 " 些小钱了。
而对于整个 AI 行业来说,首当其冲的是 OpenAI。过去一年中,OpenAI 凭借大数据、大算力、强算法、强工程的优势,在 AI 行业内保持了一个身位的领先优势。而随着技术的普及和其他科技行业的发展 OpenAI 所谓的技术优势,支撑正在变低。OpenAI 的领先技术正在从过去的被模仿,变成同期发布。
AI 公司的技术竞争正在悄然向商业竞争和产品竞争过度。Google 通过整合其广泛的产品生态系统,将 AI 技术落地到更多实际场景,如手机、办公软件、智能家居和在线教育等。一步步构建了庞大的商业生态和稳固的市场领先地位。
未来的竞争,或将更多地体现应用在场景中的多样性和市场主导地位的争夺上。在 GPT-5 或是其它更强大的 AI 大模型到来之前,OpenAI 等 AI 公司在应用场景上的劣势将会被 Google 持续放大。
如今,Google 正在以教科书般的方式展示如何在激烈的市场竞争中,通过技术和商业战略的双管齐下实现反击。这不仅仅是技术上的博弈,更是商业模式和生态系统构建上的较量。