HoloLens 2为何采用MEMS而非LCOS
微软光学部门总经理祖尔菲·阿拉姆(Zulfi Alam)在微软Build大会期间接受了内部团队采访,探讨了一系列跟HoloLens 2有关的话题,以及选择MEMS显示技术的优势等等。采访内容整理如下:
主持人:太神奇了。你可以介绍一下你自己,以及你在微软(MSFT)的工作吗?
Zulfi Alam:我的名字是祖尔菲·阿拉姆。我是光学部门的总经理。但在我开始介绍之前,我想知道你这套行头是怎么回事?
主持人:恩,我就想着来点改变。大家的穿戴都十分整齐正式,而我想穿成与众不同的样子,所以我今天是长颈鹿。
Zulfi Alam:我们应该穿成同一个系列的。但不管怎样。非常感谢你。我今天想讲的是我们开发的显示器和显示技术。对于显示,我想介绍的第一个话题是定制硅。我们是世界少有的拥有自主定制硅并且可以从零设计出完整解决方案的企业。我们拥有自己的光学团队。我们拥有自己的系统团队。我们拥有自己的软件团队。而且我们拥有自己的算法团队。你很少会见到这样的企业。
主持人:你们对这方面进行了大量的投资。
Zulfi Alam:是的。没错,但所有这一切都是由公司统一领导,所以我们能够以非常快的速度进行创新,并且构思出新颖的解决方案。当我们决定开发第一代,第二代的显示器时,这种技术当时根本尚不存在,所以我们需要从零开始。所以我们开发了自家的定制硅。我们开发了基于MEMS的显示器,而我想你应该能理解为什么我们会朝这个MEMS的方向前进。但我们开发了这款显示器。我们从LED转向了激光。更高的发光效率。
主持人:你是指从初代HoloLens到第二代HoloLens
Zulfi Alam:是的。第一代HoloLens是基于LED。然后我们转向了激光。接下来我们没有选择LCOS或DLP类型的方法,而是选择了这种名为MEMS的微电子发射镜。它们基本上是一种能够以非常快的速度来回移动并渲染图像的微反射镜。这种方案的优势十分明显:对于一枚芯片,如果你希望不断增加视场,芯片需要变得越来越大。但对于这种MEMS解决方案,以及就长期考虑而言,我们可以简单得改变MEMS的扫描角度,并令其渲染更大的显示器。我们随后会进一步解释这方面。
主持人:明白。
Zulfi Alam:但我们基本上就是选择开发这种MEMS显示器,而它的优势超级明显。
首先是视场显著提升了两倍。我们一开始是36度。我们将其提升至51度。这相当于相翻倍了显示器。相同的形状参数。和/或更轻,和/或更小。一般来说,如果你要变大什么,你通常无法保持原状或变小。所以这对团队而言是一项巨大的成就。他们是这个世界里最令人惊叹的开发团队。
我们接下来着手的地方是舒适度。每个人都是独特的个体。这是一款可穿戴设备。当你尝试设计一款无需10种不同商品属性(小/中/大/男/女)的设备时,我们能够涵盖所有这一切,因为我们是从零开始设计,而且我们会说‘嘿,这款设备需要是地球中最优秀的企业级设备’。如你所见,这是开发团队的成员,他们都有着独特的头型,而他们都能够穿戴相同的设备。
主持人:就像是我的头型不同于你的头型。
Zulfi Alam:就是这样。你不会希望消费者支付了3500美元而产品只是为一人定制。你希望能够分享设备并享受相同的体验。最后是对比度:这款设备的对比度非常优秀。因为我们是基于激光,所以对于全息图不输入的位置,我们可以关闭激光。你可以看看这两个图像。
如你所见,让我把光标放到这里。全息图到这里结束,但你依然可以看到这种迷蒙。这就是LCOS系统。至于HoloLens 2系统,显示系统能够有效地关闭激光。
主持人:所以当没有内容展示的时候,激光关闭,你就可以看到后面。你可以一眼看到后面的元素。假设有一张全息图,如果那里什么也没有,我可以看到其背后的内容,是这样吧。
Zulfi Alam:没错。这十分重要。对比度是2500:1。这是同类最佳。我们对这项成就非常自豪。这就是我要讲的事情。不知道你还有什么问题吗。
主持人:我真正想问的是,或许你可以讲讲它与其他同类设备的不同之处是什么。比如说,它与Magic Leap显示器有何不同。
Zulfi Alam:这是个好问题。我需要好好想想如何回答这个问题。
这个地球有多卓越秀的企业,如苹果,谷歌,而Magic Leap同样是其中一家。他们都在努力追逐同一个圣杯,亦即打造出优秀的头戴式设备。我们各自采取的基本方法有所不同。因为,我们会说‘嘿,我们要确保这款设备对所有人而言都足够舒适。所以,我们设计了这样的视窗,亦即你能够感知的区域,我们设计的视窗比其他人都要大。我们设计的适眼距比其他人都要大。不仅如此,这是唯一允许你阅读文本的设备。假设你是一名企业工人。你在执行修理任务时希望阅读操作手册。你将能够切切实实得阅读相关的文本。我们之所以能够实现这一切的原因是,我们能够在模拟光子的生成,从激光到光学引擎,到波导,再到你的眼球。没有其他人能够做到这一点。
主持人:你们是如何做到的呢?你是如何确定眼球的位置的呢?我的意思是,当我戴上HoloLens后,我的眼球可以朝向任何一个方向。是吧?
Zulfi Alam:确实如此。这正是微软算法的奇妙之处。关键的一点是你没有任何参照物。头部可以朝向任意一个方向,而在头部移动的时候,你希望能够将图像稳定地摆在你的正前方,而不是说相反的情形。所以,我们开发的这种与投影相关的算法,它可以根据头部运动判断头部的未来位置,然后我们再相应地投影图像。我们在正确的时间点发射激光,从而确保我们可以在正确的位置开始渲染图像。
主持人:主持人:即便我是戴着眼镜,或者无论眼睛与屏幕之间有什么。这依然可行?
Zulfi Alam:是这样。因为适眼距比其他产品都要大,所以我们可以支持眼镜。
主持人:但对于眼睛与屏幕之间的距离,其中应该会有很大的差别吧。
Zulfi Alam:没有任何问题,我们可以支持任何适眼距,不是说所有适眼距,但我们支持的适眼距可以覆盖99.9%的人口,包括眼镜。
主持人:这很棒。下面我们来谈谈视场。你提到HoloLens 2的视场是HoloLens 1的两倍。你们是如何翻倍的呢?怎么可以做到的呢?
Zulfi Alam:我们做的事情是,我们没有选择视场更大成像器同样需要更大的LCOS方案。我们选择了其他解决方案。我们采取了MEMS途径。通过改变扫描角度,我们能够生成像素管道可以支持的最大图像。像素管道设计成支持51度。我们发射器的扫描角度能够支持51度。所以我们可以增加图像尺寸。这与原来的方案不同,亦即固定的36度。
主持人:这是用于屏幕的全新技术。你用新技术完全取代了旧有的技术。
Zulfi Alam:这是全新的方案。
主持人:为什么你选择这个方向呢?为什么你选择用激光呢?激光当然很酷,但除此之外呢。
Zulfi Alam:尺寸,重量,以及功耗。
主持人:嗯嗯。
Zulfi Alam:激光是很酷,它们同时是我们生成光线的最有效机制。所以这是一个正确的选择。它提出了自己的挑战,但这是一个正确的选择。因为MEMS方案,我们可以提升视场而重量无需改变。所以这同时比初代设计更轻。然后是SRG,波导,它们是同类最佳质量。所以我们能够维持尺寸和功耗限制,但同时可以实现更大的视场。
主持人:这很棒。然后,你们是如何令设备适配这么多的用户呢。测试过程是怎样子的呢,你们是如何确保它可以支持不同的用户。
Zulfi Alam:这是好问题。我们从公开的头型数据库开始。然后我们在内部开发模型。数以千计的模型,数以万计的数据点。我们基本上扫描了不同人的头型,然后你就需要为规格思考这一系列的问题:他的适眼距是多少,眼睛在哪里和透镜应该在哪里,以及我们最大可支持的范围是多少。所以这基本上是一次非常繁琐冗长过程,采集数以万计的头型扫描,然后打造支持所有这一切的规格。
主持人:我猜这涉及所有的微软员工,甚至之外的人群。
Zulfi Alam:我希望就是这样简单直接。但是的,我们确实…我们实际上构建了一种用于测量头型的设置。
主持人:你提到了高对比度。我可以在户外使用吗,比如说日光照射下的公园?
Zulfi Alam:原来的设备在尼特方面限制在非常低的数字,500尼特。对于这款设备,是的,你可以。我不太确定我们是否有承诺过公司之外的数字,但这款设备的设计可以达到非常高的尼特,超过1000,所以你应该能够在户外环境中穿戴使用。
主持人:你们是如何确保激光以二维形式显示图形的呢。你有激光,你有反射镜,反射镜是如何与激光配合的呢?
Zulfi Alam:基本上你有一个快速扫描仪,它是以水平方向进行扫描。然后你有一个慢速扫描仪。一旦你在水平方向绘制图像,你下移一个像素,然后开始水平绘制。两个反射镜彼此配合。一个负责水平轴,一个负责垂直轴。
主持人:这个屏幕的分辨率非常高,是吧。反射镜的实际扫描速度有多快呢?
Zulfi Alam:一秒54000次。
主持人:所以说激光一秒扫描54000次。
Zulfi Alam:这是反射镜周期。每秒54000次。激光为每个像素发射。所以我们能够渲染数百万的像素。所以是的,这款设备的文本可读性非常出色。我们内部的测试基本上是8磅字体。所以开发者应该能够开发出8磅字体的内容。
主持人:这非常棒。感谢你今天的分享。我学到了很多。我希望大家同样能够学到很多。