专题栏目:ARVRMR虚拟现实

基于视觉的输入设备是什么?

随着计算机硬件与软件技术的发展,特别是视觉计算技术的出现,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。建立在计算机视觉基础上的基于视频的交互(Vision-Based- Interaction,VBI)或基于摄像头的交互( Camera-Based- Interaction,CBI)强调视觉信息在用户交互意图中的作用,计算机通过对采集到的视频数据进行计算,可以获得用户的位置、姿态、朝向、手势、表情等信息。通过基于视频的交互方式,人可以按照自身行为习惯完成交互动作,由摄像头感知人的动作和行为,并由计算机进行视频数据的分析与理解,然后自动地完成交互任务,整个过程甚至可以忽略计算机与摄像头的存在。比如通过肢体动作控制游戏中的对象,不但会激发游戏玩家的兴趣,而且会增强沉浸感,基于视频的交互在虚拟现实领域越来越受到研究人员的重视,并将成为主流交互方式之一。

计算机视觉研究的内容之一是如何利用二维投影图像或图像序列来恢复场景的三维信息、运动场景中的运动信息以及目标物体的一些表面物理属性,从而建立世界的三维表示,最终达到对于三维景物世界的理解,即实现人的视觉系统的某些功能。计算机视觉是一个逆向问题,投影过程不仅损失了深度信息,同时像光照、材料特性、朝向、距离等信息都反映成唯一的测量值灰度。要从这唯一的测量值恢复上述一个或几个反映物体本质特征的参数是一个病态过程。因此,很多学者尝试在获取二维投影图像或图像序列的同时利用深度摄像机获取相应的深度信息,以方便对三维物体的重建或者理解。

内容来源:黄海 《虚拟现实技术》

发表评论

相关文章