虚拟现实:虚拟现实技术漫谈
正如其它新兴科学技术一样,虚拟现实技术也是许多相关学科领域交叉、集成的产物。
它的研究内容涉及到人工智能、计算机科学、电子学、传感器、计算机图形学、智能控制、心理学等。我们必须清醒地认识到,虽然这个领域的技术潜力是巨大的,应用前景也是很广阔的,但仍存在着许多尚未解决的理论问题和尚未克服的技术障碍。客观而论,目前虚拟现实技术所取得的成就,绝大部分还仅仅限于扩展了计算机的接口能力,仅仅是刚刚开始涉及到人的感知系统和肌肉系统与计算机的结合作用问题,还根本未涉及“人在实践中得到的感觉信息是怎样在人的大脑中存储和加工处理成为人对客观世界的认识”这一重要过程。只有当真正开始涉及并找到对这些问题的技术实现途径时,人和信息处理系统间的隔阂才有可能被彻底的克服了。我们期待这有朝一日,虚拟现实系统成为一种对多维信息处理的强大系统,成为人进行思维和创造的助手和对人们已有的概念进行深化和获取新概念的有力工具。
就像电影《黑客帝国》里描述的那样,未来的我们竟可以生活在一个由电脑控制的虚拟世界里。在这个世界里,我们同样拥有各种感觉,同样拥有亲戚朋友,同样拥有工作,同样拥有现实世界的一切“真实”。只是,这一切都是虚拟的。
人类有许多梦想,一些梦想已经变为现实,而有一些梦想也许永远都不可能实现。然而,有一种技术却能使一切梦想全部实现,这就是虚拟现实技术(Virtual Reality,简称VR)。
虚拟现实是在计算机图形学、计算机仿真技术、人机接口技术、多媒体技术以及传感技术的基础上发展起来的交叉学科,对该技术的研究始于20世纪60年代。直到90年代初,虚拟现实技术才开始作为一门较完整的体系而受到人们极大的关注。
基本概念
概括地说,虚拟现实是人们通过计算机对复杂数据进行可视化操作与交互的一种全新方式,与传统的人机界面以及流行的视窗操作相比,虚拟现实在技术思想上有了质的飞跃。
虚拟现实中的“现实”是泛指在物理意义上或功能意义上存在于世界上的任何事物或环境,它可以是实际上可实现的,也可以是实际上难以实现的或根本无法实现的。而“虚拟”是指用计算机生成的意思。因此,虚拟现实是指用计算机生成的一种特殊环境,人可以通过使用各种特殊装置将自己“投射”到这个环境中,并操作、控制环境,实现特殊的目的,即人是这种环境的主宰。
从本质上来说,虚拟现实就是一种先进的计算机用户接口,它通过给用户同时提供诸如视觉、听觉、触觉等各种直观而又自然的实时感知交互手段,最大限度地方便用户的操作。根据虚拟现实技术所应用的对象不同,其作用可表现为不同的形式,例如将某种概念设计或构思可视化和可操作化,实现逼真的遥控现场效果,达到任意复杂环境下的廉价模拟训练目的等。该技术的主要特征有以下几方面:
多感知性(Multi-Sensory)——所谓多感知是指除了一般计算机技术所具有的视觉感知之外,还有听觉感知、力觉感知、触觉感知、运动感知,甚至包括味觉感知、嗅觉感知等。理想的虚拟现实技术应该具有一切人所具有的感知功能。由于相关技术,特别是传感技术的限制,目前虚拟现实技术所具有的感知功能仅限于视觉、听觉、力觉、触觉、运动等几种。
浸没感(Immersion)——又称临场感,指用户感到作为主角存在于模拟环境中的真实程度。理想的模拟环境应该使用户难以分辨真假,使用户全身心地投入到计算机创建的三维虚拟环境中,该环境中的一切看上去是真的,听上去是真的,动起来是真的,甚至闻起来、尝起来等一切感觉都是真的,如同在现实世界中的感觉一样,典型的系统为虚拟现实大屏幕立体投影系统。
交互性(Interactivity)——指用户对模拟环境内物体的可操作程度和从环境得到反馈的自然程度(包括实时性)。例如,用户可以用手去直接抓取模拟环境中虚拟的物体,这时手有握着东西的感觉,并可以感觉物体的重量,视野中被抓的物体也能立刻随着手的移动而移动。
构想性(Imagination)——强调虚拟现实技术应具有广阔的可想像空间,可拓宽人类认知范围,不仅可再现真实存在的环境,也可以随意构想客观不存在的甚至是不可能发生的环境。
一般来说,一个完整的虚拟现实系统由虚拟环境、以高性能计算机为核心的虚拟环境处理器、以头盔显示器为核心的视觉系统、以语音识别、声音合成与声音定位为核心的听觉系统、以方位跟踪器、数据手套和数据衣为主体的身体方位姿态跟踪设备,以及味觉、嗅觉、触觉与力觉反馈系统等功能单元构成。
这里,虚拟环境处理器是VR系统的心脏,完成虚拟世界的产生和处理功能。输入设备给VR系统提供来自用户的输入,并允许用户在虚拟环境中改变自己的位置、视线方向和视野,也允许改变虚拟环境中虚拟物体的位置和方向。而输出设备是由VR系统把虚拟环境综合产生的各种感官信息输出给用户,使用户产生一种身临其境的逼真感。其主要的研究内容包括以下几个方面:
动态环境建
模——虚拟环境的建立是VR系统的核心内容,动态环境建模技术的目的就是获取实际环境的三维数据,并根据应用的需要建立相应的虚拟环境模型。三维数据的获取可以采用CAD技术,更多的情况则需采用非接触式的视觉技术,两者有机结合可以有效地提高数据获取的效率。
实时三维图形生成技术——三维图形的生成技术已经较为成熟,这里的关键是如何实现“实时”生成。为了达到实时的目的,至少要保证图形的刷新频率不低于15帧/秒,最好高于30帧/秒。
在不降低图形的质量和复杂程度的前提下,如何提高刷新频率是该技术的主要内容。
立体显示和传感器技术——虚拟现实的交互能力依赖于立体显示和传感器技术的发展,现有的设备远远不能满足需要,比如头盔式三维立体显示器有以下缺点:过重(1.5 kg至2kg)、分辨率低(图像质量差)、延迟大(刷新频率低)、行动不便(有线)、跟踪精度低、视场不够宽、眼睛容易疲劳等,因此有必要开发新的三维显示技术。同样,数据手套、数据衣服等都有延迟大、分辨率低、作用范围小、使用不便等缺点。另外,力觉和触觉传感装置的研究也有待进一步深入,虚拟现实设备的跟踪精度和跟踪范围也有待提高。
应用系统开发工具——虚拟现实应用的关键是寻找合适的场合和对象,即如何发挥想像力和创造性。选择适当的应用对象可以大幅度提高生产效率,减轻劳动强度,提高产品质量。为了达到这一目的,必须研究虚拟现实的开发工具,例如VR系统开发平台、分布式虚拟现实技术等。
系统集成技术——由于VR系统中包括大量的感知信息和模型,因此系统集成技术起着至关重要的作用。集成技术包括信息的同步技术、模型的标定技术、数据转换技术、数据管理模型、识别与合成技术等等。
关键技术
虚拟现实是多种技术的综合,包括实时三维计算机图形技术,广角(宽视野)立体显示技术,对观察者头、眼和手的跟踪技术,以及触觉/力觉反馈、立体声、语音输入输出技术等。下面对这些技术分别加以说明。
实时三维计算机图形技术
相比较而言,利用计算机模型产生图形图像并不是太难的事情。如果有足够准确的模型,又有足够的时间,我们就可以生成不同光照条件下各种物体的精确图像,但是这里的关键是实时。例如在飞行模拟系统中,图像的刷新相当重要,同时对图像质量的要求也很高,再加上非常复杂的虚拟环境,问题就变得相当困难。
广角(宽视野)的立体显示
人看周围的世界时,由于两只眼睛的位置不同,得到的图像略有不同,这些图像在脑子里融合起来,就形成了一个关于周围世界的整体景象,这个景象中包括了距离远近的信息。当然,距离信息也可以通过其他方法获得,例如眼睛焦距的远近、物体大小的比较等。
在VR系统中,双目立体视觉起了很大作用。用户的两只眼睛看到的不同图像是分别产生的,显示在不同的显示器上。有的系统采用单个显示器,但用户带上特殊的眼镜后,一只眼睛只能看到奇数帧图像,另一只眼睛只能看到偶数帧图像,奇、偶帧之间的不同也就是视差就产生了立体感。
用户(头、眼)的跟踪:在人造环境中,每个物体相对于系统的坐标系都有一个位置与姿态,而用户也是如此。用户看到的景象是由用户的位置和头(眼)的方向来确定的。
跟踪头部运动的虚拟现实头套:在传统的计算机图形技术中,视场的改变是通过鼠标或键盘来实现的,用户的视觉系统和运动感知系统是分离的,而利用头部跟踪来改变图像的视角,用户的视觉系统和运动感知系统之间就可以联系起来,感觉更逼真。另一个优点是,用户不仅可以通过双目立体视觉去认识环境,而且可以通过头部的运动去观察环境。
在用户与计算机的交互中,键盘和鼠标是目前最常用的工具,但对于三维空间来说,它们都不太适合。在三维空间中因为有六个自由度,我们很难找出比较直观的办法把鼠标的平面运动映射成三维空间的任意运动。现在,已经有一些设备可以提供六个自由度,如3Space数字化仪和SpaceBall空间球等。另外一些性能比较优异的设备是数据手套和数据衣。
立体声
人能够很好地判定声源的方向。在水平方向上,我们靠声音的相位差及强度的差别来确定声音的方向,因为声音到达两只耳朵的时间或距离有所不同。常见的立体声效果就是靠左右耳听到在不同位置录制的不同声音来实现的,所以会有一种方向感。现实生活里,当头部转动时,听到的声音的方向就会改变。但目前在VR系统中,声音的方向与用户头部的运动无关。
触觉与力觉反馈
在一个VR系统中,用户可以看到一个虚拟的杯子。你可以设法去抓住它,但是你的手没有真正接触杯子的感觉,并有可能穿过虚拟杯子的“表面”,而这在现实生活中是不可能的。解决这一问题的常用装置是在手套内层安装一些可以振动的触点来模拟触觉。
语音输入输出
在VR系统中,语音的输入输出也很重要。这就要求虚拟环境能听懂人的语言,并能与人实时交互。而让计算机识别人的语音是相当困难的,因为语音信号和自然语言信号有其“多
边性”和复杂性。例如,连续语音中词与词之间没有明显的停顿,同一词、同一字的发音受前后词、字的影响,不仅不同人说同一词会有所不同,就是同一人发音也会受到心理、生理和环境的影响而有所不同。
使用人的自然语言作为计算机输入目前有两个问题,首先是效率问题,为便于计算机理解,输入的语音可能会相当罗嗦。其次是正确性问题,计算机理解语音的方法是对比匹配,而没有人的智能。
代表性设备
在VR系统中,有许多有趣的、功能不同的专用设备,下面选一些代表性的设备加以介绍。
BOOM可移动式显示器:它是一种半投入式视觉显示设备。使用时,用户可以把显示器方便地置于眼前,不用时可以很快移开。BOOM使用小型的阴极射线管,产生的像素数远远小于液晶显示屏,图像比较柔和,分辨率为1280×1024像素,彩色图像。
数据手套:数据手套是一种输入装置,它可以把人手的动作转化为计算机的输入信号。它由很轻的弹性材料构成。该弹性材料紧贴在手上,同时附着许多位置、方向传感器和光纤导线,以检测手的运动。光纤可以测量每个手指的弯曲和伸展,而通过光电转换,手指的动作信息可以被计算机识别。
TELETACT手套:它是一种用于触觉和力觉反馈的装置,利用小气袋向手提供触觉和力觉的刺激。这些小气袋能被迅速地加压和减压。当虚拟手接触一件虚拟物体时,存储在计算机里的该物体的力模式被调用,压缩机迅速对气袋充气或放气,使手部有一种非常精确的触觉。
数据衣是为了让VR系统识别全身运动而设计的输入装置。数据衣对人体大约50多个不同的关节进行测量,包括膝盖、手臂、躯干和脚。通过光电转换,身体的运动信息被计算机识别。通过BOOM显示器和数据手套与虚拟现实交互数据衣。
虚拟现实的本质是人与计算机的通信技术,它几乎可以支持任何人类活动,适用于任何领域。
较早的虚拟现实产品是图形仿真器,其概念在60年代被提出,到80年代逐步兴起,90年代有产品问世。1992年世界上第一个虚拟现实开发工具问世,1993年众多虚拟现实应用系统出现,1996年NPS公司使用惯性传感器和全方位踏车将人的运动姿态集成到虚拟环境中。到1999年,虚拟现实技术应用更为广泛,涉足航天、军事、通信、医疗、教育、娱乐、图形、建筑和商业等各个领域。专家预测,随着计算机软、硬件技术的发展和价格的下降,预计本世纪虚拟现实技术会进入家庭。
VR技术在医疗领域也大有作为。该技术可用于解剖教学、复杂手术过程的规划,在手术过程中提供操作和信息上的辅助,预测手术结果等。另外,在远程医疗中,虚拟现实技术也很有潜力。例如在偏远的山区,通过远程医疗虚拟现实系统,患者不进城也能够接受名医的治疗。对于危急病人,还可以实施远程手术。医生对病人模型进行手术,他的动作通过卫星传送到远处的手术机器人。手术的实际图像通过机器人上的摄像机传回医生的头盔立体显示器,并将其和虚拟病人模型进行叠加,为医生提供有用的信息。美国斯坦福国际研究所已成功研制出远程手术医疗系统。
在航天领域,VR技术也非常重要。例如,失重是航天飞行中必须克服的困难,因为在失重情况下对物体的运动难以预测。为了在太空中进行精确的操作,需要对宇航员进行长时间的失重仿真训练。为了逼真地模拟太空中的情景,美国航天局NASA在“哈勃太空望远镜的修复和维护”计划中采用了VR仿真训练技术。
在训练中,宇航员坐在一个模拟的具有“载人操纵飞行器”功能并带有传感装置的椅子上。椅子上有用于在虚拟空间中作直线运动的位移控制器和用于绕宇航员重心调节宇航员朝向的旋转控制器。宇航员头戴立体头盔显示器,用于显示望远镜、航天飞机和太空的模型,并用数据手套作为和系统进行交互的手段。训练时宇航员在望远镜周围就可以进行操作,并且通过虚拟手接触操纵杆来抓住需要更换的“模块更换仪”。抓住模块更换仪后,宇航员就可以利用座椅的控制器在太空中飞行。
在对象可视化领域中,VR技术应用的例子是模拟风洞。模拟风洞可以让用户看到模拟的空气流场,使他感到就像真的站在风洞里一样。虚拟风洞的目的是让工程师分析多旋涡的复杂三维性和效果、空气循环区域、旋涡被破坏的乱流等。例如,可以将一个航天飞机的CAD模型数据调入模拟风洞进行性能分析。为了分析气流的模式,可以在空气流中注入轨迹追踪物,该追踪物将随气流飘移,并把运动轨迹显示给用户。追踪物可以通过数据手套投降到任意指定的位置,用户可以从任意视角观察其运动轨迹。
在军事领域中,VR技术应用的一个例子是“联网军事训练系统”。在该系统中,军队被布置在与实际车辆和指挥中心相同的位置,他们可以看到一个有山、树、云彩、硝烟、道路、建筑物以及由其他部队操纵的车辆的模拟战场。这些由实际人员操作的车辆可以相互射击,系统利用无线电通信和声音来加强真实感。系统的每个用户可以通过环境视点来观察别人的行动。炮火的显示极为真实,用户可以看到被攻击部队炸毁的情况。从直升机上看到的场景也非常逼真。这个模拟系统可用来训练坦克、直升机和进行军事演习,以及训练部队之间的协同作战能力。
当然,虚拟现实技术的应用远不止以上这些。随着计算机技术的进一步发展,虚拟现实与我们的生活将日益密切。
上一页123