CNET科技行者

网站导航

谷歌刚发布了一款 AI 相机,没想到埃隆·马斯克又开怼了!

埃隆·马斯克(Elon Musk)喷人工智能貌似已经成为日常,这不,谷歌刚刚发布的一款 AI 相机又成了“靶子”。

这款 AI 相机是Google在其刚结束的秋季发布会上发布的,号称“抓拍神器”的Clips——一个小巧的 AI 相机。这款相机搭载了谷歌机器学习(Machine Learning)技术,可通过 AI 分析和学习来辨别捕捉画面中的难忘瞬间,并且一一保存。

Clips可以利用人工智能判断用户可能感兴趣的人脸,并在这些人脸出现时自动拍照。因为外形小巧,这款设备可以被放置在很多隐蔽的场景中,而且拍照过程中不会闪光,达到“不经意间拍摄”的效果,非常隐蔽。

马斯克当天发表了一条推文,引用科技媒体 the Verge 发布的由 Google Clips 拍摄的视频,并讽刺其公然侵犯隐私:他们甚至不屑于让自己“看起来”是无辜的。

Google Clips

马斯克发推“嘲讽”Google Clips

谷歌并未对马斯克的评论做出回应。但该公司发言人表示,Clips“是一款相机,目的是主动捕捉更多对用户重要的人的更多瞬间——7秒的片段。”

正是被马斯克“怼”的这款相机,Google Clips只是本次谷歌一口气发布的多款产品(谷歌Pixel 2/XL 智能手机、Pixelbook 笔记本、Google Home Mini&Max 智能音箱、Pixel Buds 无线耳机、Google Clips )其中之一。

谷歌一直善于巧用 AI 解决一些其他厂商诉诸硬件才能解决的问题。本次发布会上的 Dual-Pixel 技术,再次展示出谷歌的精巧心思。不过在谷歌首席执行官Sundar Pichai 看来,本次发布会最后出场的 Clips 却最能体现谷歌的硬件 AI 之道。

来重新认识一下Google Clips

在谷歌首席执行官Sundar Pichai掌舵下的谷歌悄然发生了转变。Google I/O 2017 大会上,谷歌明确宣告将战略重心由“Mobile First”转为“AI First”。

Google Clips谷歌首席执行官Sundar Pichai

本次新品发布会,谷歌不仅强调AI First,并首次提出了“AI+软件+硬件”的三位一体战略。随着以Pixel 手机为核心的系列硬件产品发布,加上其在人工智能技术及软件产品上的突出优势,谷歌在“软件+硬件”上的全面人工智能生态已经初步显现。

但是,Pichai想要的真正人工智能, 不仅仅是将人工智能的功能整合进每一款产品中,而是通过那些人工智能技术的产品来激发更大的市场。

Clips是谷歌想要做更多事情的一个缩影。它是一款只有5厘米高、60克重的方形相机,售价249美元。非常小,也非常轻便。全机上下只有一个快门按钮、一个镜头、一个拍摄时会亮起的LED灯,套上自带的塑料外壳后可以立在、挂在、勾在家庭里的任何一个角落。

通过扭动镜头打开相机后,它能以15帧每秒的频率录制拍摄,拥有一个1200万像素的传感器与130度的广角镜头,能够自动对焦,有16GB的存储空间,电池续航时间为3小时——不过,没有内置麦克风。

Google Clips用户可以选择在手机APP上将这些段视频剪辑、导出为视频、照片、GIF、或是动态照片

它以新的方式重新定义摄影,内部人工智能引擎会引导相机寻找它感觉有趣的东西:微笑、你关心的人、追逐尾巴的狗,并自动捕捉这一刻。随着时间的推移,这款相机会更加智能化。

Pichai在接受The Verge采访时称,“之所用一款软件的名字来命名硬件,是经过了慎重思考之后的决定。我们给它取名Clips的主要原因是它拥有让人兴奋的机器学习,并且幕后更有计算机视觉提供支持。”

对于谷歌来说,硬件不仅只是为了卖产品,同时也在不断学习如何在硬件中更好的集成 AI。Pichai说:“如果你不能将这些东西集成到一起,就很难推动未来的发展。”从根本上说,Pichai对每一款硬件产品都会进行“如何通过 AI 进行改善”这样的思考。他不想让 AI 成为一种额外单独的功能,而是希望 AI 从根本上改变每一台设备的本质。

Google Clips背后的硬技术:AI与机器学习

谷歌Clips能否成功,取决于它能否兑现谷歌的两大承诺:它能否拍摄稳定、对焦准确的照片?是否足够智能,能在尽量不需要用户干预的情况下处理照片任务?

Google ClipsGoogle Clips AI相机

或许,你也可以将Clips的思维过程进行这样梳理:1、它睁开眼睛,看着眼前的世界;2、接着处理一系列问题:这个世界里有脸吗?是我认识的脸吗?这张脸上眼睛是睁开的吗?是微笑着的吗?这里的光线足够充足吗?这个镜头模糊吗?...最终确保照出来的片段是好的、值得拍摄的。

Google ClipsGoogle Clips产品主管Juston Payne

谷歌Clips产品主管Juston Payne称,Clips的“智能”内置在设备中,所以不像Google Home那样完全依赖于连接到云端,Clips完全在本地执行任务,“它是以摄像头为AI引擎开始的”。

Clips采用了机器学习技术,这意味着,事先它需要合适的训练数据(可能在你与孩子玩耍时将其放在客厅中),运行其预先训练的机器学习算法来找到最佳的学习算法,然后自动生成剪辑并为你挑选最佳图像。

Google ClipsGoogle Clips 在手机APP界面

然而,每一个AI模型都需要经过训练,Clips使用的模型也不例外。为了帮助Clips找到合适的训练数据,谷歌的Clips团队与一大批视频编辑者与图像评估团队合作,从谷歌拥有的海量视频中(包括旗下视频网站YouTube)通过人工标记、评分视频的方式为Clips提供训练素材。

Payne称,世界上没有任何一套机器训练数据集里有“这有一个婴儿在地板上爬的短视频,这是他父母想要保存的片段”的带标记数据,而Clips的“智能”也绝不是像辨别猫狗这样简单。

随着时间的推移,谷歌Clips会“认识”用户的家人和朋友。例如,用户亲自动手按下快门给某人拍照,会给谷歌Clips提个醒:这个人对我很重要。未来,谷歌计划在更多的终端设备上拓展AI功能,以支持更多的应用场景。

谷歌发布会上最不起眼的硬件,却住着一颗AI芯

其实作为一款消费级产品,Google Clips 主要适用于家庭场景,它在功能上的独到之处是利用机器学习对场景中的人物、宠物、环境等画面进行识别和分析,从而让摄像头发现适合拍摄的画面时进行自主拍摄;这个过程的实现,不仅需要依赖谷歌的AI技术,还需要机身内部搭载的一块 AI 芯片。

Google ClipsMovidius Myriad 2 VPU

这块 AI 芯片,就是英特尔旗下 Movidius 推出一款名为 Myriad 2 的 VPU(Vision Processing Unit,视觉处理单元)。

Myriad 2 发布于 2014 年(这时候 Movidisus 还没有被收购),作为一款视觉处理芯片,它的功能就是专门用于图像处理;其特点在于功耗很低,能够在半瓦的功耗下提供浮点运算功能,使用 20 纳米的工艺进行制造。

实际上,在 Myriad 2 之前,Movidius 已经推出了 Myriad 1,它被谷歌用于 Project Tango 中,作为智能手机和平板电脑 3D 感应技术方案的关键组件。作为继承之作,Myriad 2 的性能是 Myriad 1 代的 20 倍;与此同时,Myriad 2 的体积也非常小,可以用在纽扣大小的照相机上。

Google Clips

当然,除了传统的影像处理能力外,Myriad 2最重要的就是AI能力。对于Clips来说,也就是相机的智能理解能力。除了芯片本身,Movidius还设计一系列的补充算法与SDK,使得Myriad 2支持3D建模和扫描、影像搜索、室内导航、以及手势输入、脸部识别、实物探测等。

纵观整场发布会,最后一个出场的谷歌Clips相机,其实无论画质、清晰度还是便携性,谷歌Clips智能相机都不算太犀利,但是它却是首款由AI来决定工作与否的消费级相机产品,也是谷歌“AI First”战略的一个重要的小尝试。

关注科技行者公众号

即将跳转至电脑版页面您确认跳转吗?
取消 跳转