文/VR陀螺 万里
当地时间5月10日,谷歌召开了其2023年I/O开发者大会。本次大会主题不出意外是今年爆火的AI,当然AI也是以往谷歌I/O大会的重点所在。
本届大会,谷歌推出了新的大型语言模型PaLM 2,并且几乎把自家全部业务矩阵都与AI串联了起来:谷歌搜索、Gmail、Workspace、Pixel……颇有一种AI全家桶的味道。
(资料图片仅供参考)
而关于XR部分的内容并不多,更新主要涉及三个方面:谷歌地图LBS AR工具、公布Project Starline最新原型、宣布与三星打造新的XR平台。
图源:谷歌
今年2月,谷歌推出了对标ChatGPT的对话式AI工具Bard,结果演示的时候翻车,导致股价大跌。本次I/O大会,谷歌一雪前耻,并把AI与自家应用生态更为紧密结合在了一起。
大语言模型PaLM 2
会上公布的第一款产品是谷歌新一代大语言模型PaLM 2,它支持100种语言,在逻辑推理、编程以及翻译等方面相较上一代均有显著提升。
谷歌CEO Sundar Pichai指出,在写代码时,PaLM 2可检查并修复里面的错误,并且可生成不同语言的注释来实现跨团队协作。此外,它是首款能够给医学执照考试问题提供专业解答意见的语言模型,如可以理解X光图片并为医生提供部分参考信息。
PaLM 2现已开放预览,它针对不同性能的设备提供了不同的适配版本以满足对模型运行的支持,其中Gecko版本甚至能在手机等移动设备上运行。
图源:谷歌
对话式AI Bard
伴随着PaLM 2的发布,Bard也得到了全新升级。它继承了PaLM 2在数学、逻辑等方面的强大能力。编程方面,它学习的编程语言超过了20多种,在演示中,谷歌产品副总裁Sissie Hsiao使用Bard生成了一个基于Python的国际象棋代码,并且可以实现代码优化、注释、导出等操作。
当提问景点建议时,它将会生成带有图片的场景介绍;询问大学报考建议时,它会列出一系列高校名称、地点以及专业信息,甚至可以生成对比表格。不仅如此,谷歌宣布Bard即将与Adobe Firefly达成合作,未来它还将配备文本生成图像功能。
会上,谷歌宣布移除Bard的等待名单候补机制,它已经面向180多个国家和地区全面开放,在语言方面,它新增了对日语和韩语的支持,未来适配语言将增加至40种。
文本生成图片功能演示,图源:谷歌
办公套装Workspace
Sundar指出,谷歌有15款产品,它们的日活均超过了5亿,其中Chrome等五款产品,日活甚至突破了20亿。谷歌希望为这些产品引入AI工具,以进一步提升工作以及生活效率。
图源:谷歌
专门针对办公套件Workspace,谷歌为之带来了名为Duet AI for Workspace的功能更新。
如借助help me write功能,用户可以在Gmail中快速生成一封邮件;在Docs中,你只需要写上简单的招聘需求,它就会自动帮你生成一个信息饱满的招聘广告。此外,AI的新能力在表格、幻灯片等产品上均有体现。
Google Workspace主管Aparna Pappu在会上展示了AI在办公时的强大辅助能力,如你在写一个恐怖故事的时候卡壳,AI能够为你提供故事发展脉络建议。
Workspace AI新功能现已面向少部分测试人员推出,后续会进一步向企业以及普通用户开放,不过具体时间暂未公布。
快速生成招聘广告,图源:谷歌
结合AI的搜索体验SGE
不少人认为,伴随着对话式AI的推出,将会撼动谷歌以搜索为主导的业务根基。不过在I/O大会上,谷歌还是展开了积极尝试,以寻找搜索广告业务新的变现可能。
谷歌搜索副总裁Cathy Edwards展示了名为SGE(Search Generative Experience)的新功能,如当用户搜索自行车,网页中将会出现自行车用途、悬挂系统等AI生成信息,以帮助用户更好完成购买决策(可以简单理解为一个智能客服)。此外,网页端还会出现符合用户需求的商品信息,用户可以点击链接快速完成购买。
SGE将在未来数周内推出,美国用户现可申请加入等候名单。
图源:谷歌
除AI产品外,I/O大会上还为我们带来了三款硬件产品,其中包括首款折叠机Pixel Fold、家庭平板Pixel tablet以及入门级的Google Pixel 7a。这三款产品均搭载了谷歌自研G2处理器,前者售价1799美元起步,后两款产品售价为499美元。
此外,谷歌还为安卓带来了Android 14更新,不过新系统更新乏善可陈,里面除了查找丢失设备、新建个性化时钟等新功能外,AI生成壁纸可算是一个小小的亮点。
图源:谷歌
对于我们关心的XR业务,本次Keynote演讲上似乎显得有点默默无闻。去年谷歌的I/O大会上,谷歌展示了一款具备实时翻译功能的AR眼镜设备,但本次活动上暂未看到该产品的最新动态。
大会上,谷歌Android生态系统副总裁Sameer Samat只是简单提了一句:“我们与三星一起,正在构建一个由Android驱动的全新沉浸式XR平台,我们将在今年晚些时候分享更多信息。” 这已是XR的全部。
LBS AR创建工具Geospatial Creator
虽然没有XR新的硬件设备展示,但是在开场,Sundar提到了其地图业务的更新,谷歌的地图业务是其未来构建大型LBS AR体验的重要载体。
去年,谷歌地图引入了沉浸式视图Immersive view,该功能可以展示动态的3D街景鸟瞰图,这是通过将数十亿张全景图像拼接实现的。此外,用于构建LBS AR服务的Geospatial API也于去年亮相,当时I/O大会透露,里面内置了超过87个国家/地区的3D地图信息,开发者可用于远程构建基于地图的AR服务。
如今,谷歌把Immersive view引入到了骑行、驾驶等导航当中,用户在出发前,可先进行路线图3D导览,并查看天气等。该功能将于今年夏天推出,年底前适配15个城市。
图源:谷歌
此外,谷歌地图进一步推出了AR创作工具Geospatial Creator。根据谷歌官网信息,这是一款低门槛的创作工具,它可直接集成到Adobe Aero和Unity等3D引擎中。“你无需编写任何代码,在数分钟内即可打造基于世界的沉浸式体验。”
用户则可通过Geospatial Creator生成二维码或者链接以共享AR体验,无需下载特定的APP。目前Geospatial Creator内置的3D地图数据涵盖了49个国家/地区。
应用落地方面,谷歌宣布已经与Gap、Mattel、Global Street Art、新加坡旅游局、Gensler、TAITO等企业或者客户达成了合作。如TAITO即将发布的AR游戏《SPACE INVADERS: World Defense》,里面结合使用了ARCore和Geospatial Creator技术。
Google Arts & Culture与Global Street Art和三位世界知名艺术家合作,通过Geospatial Creator为伦敦 (Camille Walala)、墨西哥城 (Edgar Saner) 和洛杉矶 (Tristan Eaton)打造了AR壁画体验。
图源:谷歌
新的Project Starline原型
Project Starline是一款搭载了光场技术的远程会议协作产品,最早于2021年I/O大会亮相。在Keynote演讲之外,谷歌在官网上发布了它的最新原型产品更新信息。
其最新的原型产品改进主要集中在设备瘦身方面。在先前版本中,为了实现裸眼3D显示效果,里面需要配备大量红外发射器和特殊相机等复杂硬件,它的体积就像一个餐厅摊位般庞大。如今借由新的AI技术,只需要数个标准相机即可生成高质量的3D图像,如今它的外观也更近似于一台普通的纯平电视。
目前,Project Starline系统已经在Salesforce、T-Mobile、WeWork等企业展开测试,但是正式发布时间还并未确定。有消息指出该系统售价高达数万美元,高昂的售价可能也是制约其推广的重要因素。
图源:谷歌
本次I/O大会上谷歌的XR新动作并不多,可算是一个遗憾。不过,从去年的Geospatial API,再到今年的Geospatial Creator,谷歌给我们留下了巨大的想象空间,通过地图工具构建AR体验,这为未来XR产品的爆发打下了重要的生态基础。
根据以往信息,谷歌去年10月展开了一轮有关AR眼镜的小规模线下测试;去年以1亿美元收购AI头像初创公司Alter……相信谷歌在XR硬件方面也很快会有更多动作公布。