史记淮阴侯列传写道「秦失其鹿,天下共逐之。」,后来这段话有了三国演义里「群雄逐鹿」的成语,用以形容多势力对统治权的争夺。对于一直在图形图像领域边缘创业的笔者来说,似乎正在亲眼见证群雄的一次新的争夺战。争夺战的主角都是耳熟能详的大厂——率先进场的微软,通过收购布局的苹果,以及两位追赶者谷歌和英特尔。
在英特尔的深度摄像头产品发布会之后,笔者应邀参加了微软 Kinect 内部开发者大会以及编程马拉松,从得到的情报来看,可以确定一点:目前微软与英特尔选择了不同的发力点,一个主打游戏机,一个主要瞄准移动设备,至少在短期内很难正面交锋。加之谷歌也是刚刚发布其 Project Tango 计划,主要精力还在 Google Glass 上,苹果如何使用 PrimeSense 的摄像头也只是几则流言,所以笔者很难对目前各大厂的形势做出准确判断。
但有一点笔者可以喊出来;「深度摄像头,也许是继触屏之后又一次设备革命!」
一、争霸:虚在设备
英特尔在深圳召开的 IDF 峰会上,公布了适用包含手机、平板、笔记本在内的深度摄像头,并将其深度摄像头统称为——RealSense,与微软的 Kinect、苹果的 PrimeSense 形成对照。如果说英特尔为了弥补自 2007 年主动放弃 ARM 导致丢失移动时代主要份额,而在移动芯片以及其设备上下功夫,这件事是非常显性的需求,那么唯一和 2007 年苹果刮起的那波触屏风暴不同的是,这一次革新的可能性不止是设备这么简单了。
如果是经历过 2007 年那场触屏革命的用户们应该可以理解,在一个新的操作方式初期——是需要给人一个熟悉过程的。就好像从键盘时代到触屏时代,甚至触屏也经历了好几年才从单点到多点。这是一个硬件的进步,带动软件进步的过程。在 2007 年,这个世界上应该很少人会理解下拉就能刷新是多么爽的一件事。
同理,让人现在就知道在摄像头面前虚空做个动作的交互优势,实际上还不现实。微软在这点上努力了三四年,但在利用摄像头进行基础操作上的开发进展并不顺利,这点从其 SDK 就能看出,这个细节我会在此后的文章中详细说明。所以我们可以预想到的是:英特尔从发布,再到将深度摄像头装入所有的手机、平板,还需要长时间的累积、沉淀。
这里简单介绍下各大厂关于深度摄像头相关技术以及主力应用设备:
微软:Kinect1 xbox360、Kinect4windows v1、Kinect2 xbox one、Kinect4windows v2
微软最早从 PrimeSense 手里买来其深度摄像头产品,并为 Xbox 量身打造了KInect,数千万的装机量证明了其的成功。不过其随后推出的 Windows 版 Kinect 并没有获得像其 Xbox 版那样的推广资源,大部分产品也仅限于与合作厂商的合作。据可靠消息,微软短期内也没有计划要推出移动版的 Kinect。
苹果:苹果在 2013 年收购了以色列公司 PrimeSense,在 2014 年 3 月份 PrimeSense 官方宣布不再供应其主要产品,这件事在相关开源社区引起了很多反响和担忧。PrimeSense 早期从事的是工业级深度摄像头开发,随后在开源社区的帮助下,借助「openni」项目完善了其民用深度摄像头技术。随后他将其授权给了微软、华硕,并在 2011 年与华硕生产了移动端的深度摄像头 MEMS,也就是后来的 Capri,不过项目以失败告终。在微软选择 Kinect2 不再使用 PrimeSense 的技术后,这家公司也很少出现在主流媒体的视野中。国内的互联网电视品牌 LeTV 也使用的是 PrimeSense,这应是它继华硕之外唯一的合作伙伴。
目前苹果将如何使用 PrimeSense 的技术还未知。流言认为苹果会将深度摄像头率先用在新版的 AplleTV 上,随后再放入 iPhone。
谷歌:Project Tango,这个在 CES2014 上公布的项目,除了几张概念图和叙述文字外,并未看到其他东西。不过可以推测,谷歌这一次是将鸡蛋放在了两个篮子里,一个是 Google Glass ,一个则是主流移动端的 Tango。Google Glass 主要使用的图形图像技术也统称为 OpenCV(这个此后会做介绍),其使用的是普通摄像头,而相信 Tango 是搭配深度摄像头。
至此大家就会发现深度摄像头的普及还远未开始,有的大厂如微软、苹果还稳坐钓鱼台,主要是对自己原先优势领域的一次升级,而英特尔和谷歌则是将鸡蛋分散的放在了各处。这就好像在没有 iPhone 的那个时代,还需要一个设备来起到关键性作用。这个设备不太可能是游戏机或者PC,但具体是可穿戴设备还是手机?天知道……
二、战场:实在数据
虽然我们难以预计哪种设备甚至是否有设备能够引领深度摄像头的潮流,但技术的发展就好像摩尔定律一样,是有历史可寻的。在这里笔者可以引用业界大牛 Michael Abrash 的预演来下个判断——新设备战争虚在硬件,实在数据。赢得深度摄像头革命的关键已经不再是谁的销量更高占有率更高能够衡量的了,谁能获取并学习更多数据,才是胜负的关键。
Abrash 何许人也?Valve 虚拟现实项目负责人,图形图像传奇程序员,大神卡马克的好基友。还记得几周前 Oculus Rift 被 FaceBook 收购的新闻吧,Abrash 和卡马克就先后加盟了 Oculus Rift。Abrash 认为无论是 AR(增强现实)也好还是 VR(虚拟现实),他们成败的关键将是机器学习。Oculus Rift 未来将面临的三大难点之一,即如何进行机器学习。这句话放在深度摄像头这个更为基础的设备上就更为明智——因为她将采集大量的数据,你的每一次动作,你的肌肉变化,你的心率变化,甚至是你的情绪。机器学习所有搜集的数据,并为使用者提供更好的服务,这就是未来技术,人机交互的重要基础。
数据,这就是深度摄像头如此诱人的原因。她提供给了所有用户一个一天 24 小时打开摄像头的理由,你不仅是挥一挥手就能切换操作界面那么简单。深度摄像头所采集的人机数据,将会把用户所处的世界,用户的兴趣,用户的所思所想都摸得清清楚楚。如果说以前的机器学习,还需要通过文字、点击来判断一个人的喜好,现在则完全不同。游戏公司可以依照玩家在摄像头面前每一次的情绪变化,来调整其游戏,电视台也可以直接通过摄像头来采集观众反馈。
是不是觉得自己的隐私被侵犯了?没关系,反正人们已经习惯在社交媒体上分享一切了。这就是为何那么多家人脸识别公司首先被超级公司收购的原因,而如致力于利用普通摄像头感知用户情绪的 Emotient、被英特尔收购的 Baisis 现在备受瞩目的原因。他们将所搜集的数据,不仅回馈给了用户以形成无尽的生产力,更是积累足够的财富。
就像 Google 利用其搜索以及邮件的行为数据来推送精准广告一样,深度摄像头所捕捉的数据将难以想象值钱并被所有公司所垂涎。
三、掉队者:LeapMotion,输在财力还是定位?
这里是应小编要求,加入部分命题作文。英特尔公布深度摄像头计划时有人问我:「英特尔的 RealSense 与 LeapMotion 比,谁好?」我这么回答的「LeapMotion 虽好,但早已掉队了」。
有人可能会问 LeapMotion 掉队了吗?笔者认为这是一个很自然的猜测,既然业界四巨头齐齐杀入,还不是大公司的 LeapMotion 自然面临淘汰。但实际原因其实不在财力问题,而是在于其定位过于狭窄。一个很好的逻辑,如果其发展顺利面临财力问题,早该有家超级公司将其纳入其中了,但事实是英特尔选了其他公司作为 RealSense 技术的基础。
Leapmotion 定位于小巧便携的体积和更加精准的体感定位,它的目标是让其开发者围绕各类应用开放基于 LeapMotion 的操作工具。简单来解释,就是 LeapMotion 造了一个利用摄像头的虚拟鼠标,开发者要做的是让其兼容现有的软件应用。她的定位相当清楚——替代鼠标。
LeapMotion 在小型化以及精度上确实表现的很卓越:79 x 30 x 11mm 的体积和 0.1 磅的重量使得使用者可以随身携带,当连接电脑后,它将在一个 8 立方英尺的锥形区域中追踪用户的十根手指,精度达到了惊人的百分之一毫米。完全满足一些精细操作的要求。这符合其替代鼠标的定位。
类似的思想一直存在,在以 primesense 相关技术为基础的开源社区 openni 中很早就出现了类似于 leapmotion 的尝试,知名研究机构 FORTH (*1) 在 2012 年提供了可以基于 primesense 在锥形视觉区域中追踪双手的库文件,并持续维护至 2013 年 5 月。
不过成也萧何败也萧何,LeapMotion 为了其精确性,导致其对计算机资源的需求,甚至高过 Primesense 和 Kinect,致使其不能对应手机和平板,小型化优势全无。而其并不廉价的售价,也使得用户和开发者都会非常犹豫。在体感这个新鲜劲过去后,其高精细度和丰富的手势控制既有卖点又是鸡肋,由于可追踪范围在 50cm 以内,且整个锥形区域被划分为识别区和触碰区两部分,实际操作的空间是很有限的,使用者稍不注意就可能越过追踪区域。
如将 LeapMotion 当做跟鼠标的替代品——即生产力工具,比如追踪画笔和实现艺术构想,不如伏案在绘图板上尽情发挥。前者可是很考验臂力的。如今便携性、性能、适用性——这三大决定普及率的要素均已经被英特尔赶超,LeapMotion 大限将至。
唯一可以注意的是 LeapMotion 公司宣布将在 2014 年第三季公开其面向移动设备的产品,看来是要做最后一搏了。但笔者认为,除非有超级公司愿意为其铺陈平台,不然 LeapMotion 注定会是掉队者的。
(*1 The Foundation for Research and Technology-Hellas (FORTH), established in 1983, is one of the largest research centers in Greece with well-organized facilities, highly qualified personnel and a reputation as a top-level research foundation worldwide. The research and technological directions of FORTH focus on areas of major scientific, social, and economic interest.)
作者:黎明明&宫勐 BFP inc