01、AI:共生共长
关于VR的电影非常多,如果你小心,仔细的去看这些电影,会发现,当VR发生的时候,经常也会伴随着人工智能AI的事情。
比如说在虚拟世界里,会看到很多故事是关于人造人跟自然人之间的一些故事。VR跟AI,非常紧密关联的两个概念。基本上所有的科幻片,里面都会有VR的场景,VR的元素。
这个题材为什么长盛不衰呢?中间其实很大的一个原因是,VR跟AI涉及了人类两个非常深刻的问题。
第一个问题是,我们在哪里,我们是什么样一个世界,这是什么样一个世界。在之前,我们有两个工具,一个是物理学,一个是哲学,或者宗教,来研究这个世界。
在计算机诞生之后,我们有第三个工具,用计算的方式,来研究这个问题,VR就是从计算的角度思考“世界本源”。
在有人工智能之前,我们基本上通过生物学,通过哲学,通过宗教的方式,来研究人的精神,研究什么是人类智慧,而随着计算机科学的发展,人工智能其实就是我们通过一种计算、仿真的方式,来思考“智慧”,让我们反思人和机器的差别是什么。
VR跟AI两个都有非常长久的历史,经过了好几次的高峰、低谷,起起伏伏,有很大的进展。1950年到1960年这个阶段,相当于是VR跟AI的早期阶段。在VR这边,出现了很多非常简陋的机械的,或者电子的一些模拟器。在AI这边,出现了最早的感知算法。
到了1980年左右,VR开始应用在很多的飞行模拟器,帮助训练飞行员,包括产生一些新的游戏机,让人去玩VR的游戏。而在AI那边,出现了多层的感知网络。一直到2010年,VR跟AI都有非常非常大的突破。在VR这边,出现了很多普通消费者可以承受的,小型的VR头盔,可以让很多人去尝试什么是VR。在AI这边,因为深度学习的突破,使AI在很多领域开枝散叶。
所以会发现VR跟AI像是两个相互交织的一个波浪线,在过去的60年里起起伏伏。因为这两个话题有共生共长的土壤,第一它需要强的计算力,第二它们都需要海量的数据,第三它们需要很好的连接性。因此无论什么时候,计算力,数据量,跟连通性有提高的话,这两个领域,VR跟AI就会迅猛地发展。
02、VR到底是什么?又能干什么用?
VR到底是什么?
从某个角度来说,它是一个新的媒体。从最早用文字,到用图像,用视频,再到VR,人们对事情表达的表达力越来越强。
比如说用文字去描述北京很漂亮,就说“哇!北京好漂亮”,感觉就比较单薄。如果有图片,你可以拍一个非常漂亮的北京的图片,去讲北京好漂亮,然后如果可以拍视频的话,就能更加动态地描述更多的信息。那VR就相当于是直接把用户放到北京,让他自己去看。
如果从这个角度考虑,VR其实有很多的应用,比如说可以拍一个VR的电影,让人可以设身处地的,去看一下故事,会有一个新的用VR讲故事的方式。也可以在手术室里面,把整个手术的内容拍下来,对没有进手术室的人来说,他可以去尝试,去学习手术室里面发生什么样的事情。
对新闻来说,不再是让观众去看简单的画面,而是可以让用户真正到事件的现场,去看发生了什么事情。最后,有很多公司,会用它来做一些营销,来做一些品牌的建设。
其实也可以从另外一个方面去理解什么是VR
VR是一个新的人机界面,最早计算机发明的时候有打孔机,用来做输入输出。后面有了键盘,有了鼠标,有了显示器,到2010年左右出现了触摸屏,因此iPhone变得非常非常成功。
而现在很多人相信VR,会是下一个人机界面。
很多人认为VR是终极的人机界面,因为在VR里面,人是通过最自然的头部的转动,手势,前后走动,跟计算机做交流。它可以把人在不同的地方,连接在一起,甚至把不同时空的人连接一起,甚至可以把一个人,连接到一个虚拟的世界里面去。虽然现在在市场上,并没有很多人在做这件事情,但是这是很多做VR人的愿景。
03、VR是怎么工作的?难题在哪里?
但对于一个新的事物,很多人会有不同的理解,不同的期望,不同的判断。要做好更好的判断,首先要理解,VR是怎么工作的?VR的难题在什么地方?解法在哪里?
VR的工作原理,其实相当简单,人跟这个世界交流,是通过感官,人们经常会说五感,触觉、视觉、味觉、嗅觉、听觉,但其实人的感官,远远超出这五个,特别在VR里面,有另外的感官,叫做运动感知,它在人的内耳里面,内耳前庭,它可以感知身体的体位,运动的加速度。
所以如果围绕这六个感官来讲VR的话,其实是人接受这六个接口的信息,大脑处理了这个信息之后,产生了对这个世界的理解。所以如果改变这六个接口的输入,那就可以在人的脑子里,形成另外一个虚拟的世界。有些人听了,可能会觉得不舒服,这是在欺骗人的感官?但其实人们一直在做这件事情。
比如听觉,当戴耳机的时候,其实耳机给了一个虚拟的信号,它不是周围真正发生的,而是一个电子的信号传过来变成声音,传到耳朵里面。这跟现在的VR,其实是一模一样,只不过它对付的不是你的视觉,而是你的听觉。
但是为什么我们不把耳机当作虚拟现实呢?因为对人来说,人的大脑大部分信息,80%到90%都通过视觉来传入的。只有把视觉欺骗了之后,才能真正地做到虚拟现实的效果。所以说眼见为实,必须欺骗到人的眼睛。但欺骗人的眼睛非常难,人的眼睛非常精密、挑剔。
首先,人眼非常高清,正常的人的眼睛在视网膜的中心,每一度可以看到60个像素,就是说360度的话,大约是20K的分辨率。现在市场上可能买到的VR,分辨率大约是1080P,如果转换成视力表的话,大概就是0.1的视力,但正常人眼睛的视力是2.0,这中间的差距,何止十倍。
不仅如此,人眼睛有很多其他挑剔的地方,比如说人眼睛会有对焦,对焦有两种方式,一种通过晶状体来对焦,还有一种是两只眼睛的聚焦。那这两种对焦方式要一致,否则眼睛会觉得不舒服。
另外人的眼睛,对图片的失真非常敏感,配过近视眼镜的人都知道,就是第一次配完眼镜,会发现很不舒服,世界好像变形了,特别是眼角的地方,然后多戴一会儿可能就会头晕,这其实也是VR里面,头晕的来源之一,因为人的眼睛对图像的变形非常敏感。
人的眼睛对图像的刷新率,也非常敏感。如果刷新率不够高,转头后,发现图像会抖动,图像一旦抖动就会晕。所以晕眩,从一个非常直观的理解,就是人的大脑,觉得你给我东西太假了,它就有一个反应。
人脑其实是非常精密的一个仪器。随便改变它的输入的话,它会觉得输入不够真,会有些异常的反应出来。所以晕眩其实是现在VR发展最重要的一个问题。
那这个问题最终的解决是需要非常大的数据量,非常大的计算量,现在的很多平台,CPU,或者网络没法支撑这么大的计算量跟数据量,当然可以等这个CPU变得越来越快,摩尔定律说,基本上互联网的网速每年60%的速度增长,还有尼尔森定律是说,互联网的速度每年增长50%,听上去非常快,但是远远跟不上VR对数据跟计算量的要求。
所以答案只能在算法的设计上。做过算法优化的人可能会知道,一个优化好的算法,跟一个没有优化好,普通的算法,它之间的效率会差非常多。可以有一百倍,甚至一千倍的差别。在过去的三年里面,有很多新的算法被设计出来,让VR的系统,变得更高效。
04、不断推动VR从想象变为现实的黑科技
VR内容的产生,需要有两类工具,一类是通过3D建模的方式来做。还有一类是通过VR相机直接拍摄。VR相机一般来说,是由很多个相机构成,每个相机覆盖一个小的视场,然后再通过算法,把所有的相机拼接一起。比如说这个相机是谷歌的JUMP相机,它由16个相机组成,每个相机是2K乘2K的分辨率,差不多一秒钟,会有480帧的数据进来,每一帧是2K乘2K。
在算法优化之前,一小时的视频,它需要75天去处理。今天拍了一个节目,要过两个半月以后,才能看这个视频,但是经过算法的优化之后,它可以在十个小时里面,把一个小时的视频处理好,提高了将近150倍。但这个速度其实还是不够的,因为只有真正做到,一个小时的视频用一个小时处理完,才能真正做直播。所以在这个方面,技术还要进一步的提高。
VR的视频非常大,那就会导致,对互联网的传输,对客户端的播放,产生非常大的压力。这里就出现第二个非常重要的技术:视域选择性传输与渲染技术。
就是说对人的眼睛来说,在同一个时刻,虽然这个世界可能很精彩,有很多很多内容,但是你的眼睛在同一个时刻,你只能看到很小的一个区域,所以你只要把这一块区域处理好,把这一块区域传下来,渲染出来。如果这么做的话就可以省掉最多80%的数据,省掉可能有50%或更高的CPU的用量,可以把一个原来最多只能画4K的一个手机,变成可以画12K的手机。所以这是非常重要的一个技术。
VR内容的产生,还有一种方式,就是做3D的建模。
做过3D建模的人都知道,是非常花时间,非常费力的。
在VR的一个世界里,可能一个场景就有好几百个物体在里面。
怎么样可以非常高效的,把3D模型建出来,这是很重要的一个问题。
所以最近有一些新技术,比如说智能的图形设计,对一个物体,比如说花瓶,拍张照片,在这张照片之上可以做一些手描把它的轮廓画出来,在轮廓的基础上再画一些辅助线,然后把这个手描完的图片传给算法,算法可以按照画的线生成一个3D的模型。就这是一种新的智能的方式,来帮助人们更高效地建立3D模型。
另外,其实很多人已经在尝试,真正的去建一个虚拟的VR社交的平台,在这个平台上,跟其他的客户做一些交流。这么一个平台,其实是一个非常好的人工智能练习的一个平台,在这个平台上,有很多用户的输入,也可以加入人工智能的一些机器人在里面。所以人工智能可以让VR的世界变得非常丰富多彩。丰富多彩的VR的世界,可以提供大量的数据给AI。所以在科技史上,很多人会预测,就是强人工智能的机器人,其实最先会在VR的世界里出现。
对VR的未来,很多人有不同的想象,那到底这些美好的未来,离我们现在生活有多远?我们只是在非常非常早期的一个阶段,VR只是刚刚起步。如果考虑可能VR的应用的话,这个冰山才刚刚露出一个小的角,甚至在这些非常有限的应用里面,很多用户体验还不是非常好。大部分的美好的应用,都还在水底下,没有浮现出来。
图文源自互联网,转载此文目的在于传递更多信息,版权归原作者所有。