临床医学中的“失明”究竟意味着什么?
通常来说,人们认为失明就是完全丧失看事物的能力。其实,这是一种误解。世界健康组织(World Health Organization, WHO)将失明定义为严重的视力丧失,即使在配带眼镜或者隐形眼镜的情况下,还是不能分辨3m处举起的手指个数的情况。所以,就算是诊断为目盲的人,仍然 可能拥有一定程度的视力,其中大部分人仍可以不同程序地分辨对比度的变化。
提高视障人士的视力水平
我们牛津大学临床神经科学系的科学家团队正在开发一种创新的视觉义肢。这是一台电子辅助系统,用以支持视障人士的视力。
目前,我们正在执行新技术试验,使用个人的视觉能力来判断对比度的变化。我们从头部佩戴的摄像机视频源获得并处理图像数据,检测附近的物体,如人、 标志杆,或感兴趣的障碍物。被测物体被简化为一组LED显示的图像返回给头部佩戴的头盔显示器。使用的很少量的LED,我们就可以指出紧邻设备穿着者的障 碍物的位置和分类。
最终,我们希望将该技术设计成一幅电子眼镜,我们亲切地称为“Smart Specs”。这种眼镜将让更多视障人士可以生活更独立,帮助他们找出附近的物体、观察他们的周围环境。批量生产后,Smart Specs的成本将与一台现代化的智能手机相当。其性能与一只经过充分训练的导盲犬相当,但却便宜得多。
搭建义肢仿真环境来验证我们的设计
首先我们从仿真视网膜义肢的功能开始,探讨如何提高低分辨率显示图像所能提供的信息量。我们使用LabVIEW和NI视觉开发模块来开发仿真软件。 该模块可支持多种不同的相机类型,给我们提供了现成的图像处理函数、图像采集驱动、显示功能和图像记录功能。我们无需大量的开发就可以快速地采集原始图 像。我们已经发表了我们的方法和结果(van Rheede, Kennard and Hicks. Journal of Vision 2010)。
在这第一项的研究中,我们提出了使用机器视觉来简化视频流中的重要信息,重新生成一幅明亮,低分辨率的图像,这样的图像也许可以帮助那些只有最低视觉能力的人士。接下来,我们开始了现在正在进行的研究,这个研究就完全基于LabVIEW、NI-IMAQ和Vision。
我们按照下列开发步骤来创建我们的系统:
- 失明仿真。
- 开发实时图像优化,如边缘检测和对比度优化等。
- 开发实时的对象检测算法,探索不同的方法来对图像进行简化,输出适合具有严重视觉障碍人观察的明亮图像。
- 开发一套快速的脸部检测算法来连接到简化的图像输出。
- 开发实时且不受方向限制的文字识别算法。.
我们分别在健康对照组(在仿真失明条件下)和一个失明者身上使用上面描述的技术进行了原理验证性研究。结果两者都可以很容易地发现和识别出我们系统所处环境中的物体,而这些物体以往是看不到的。
使用NI视觉开发模块提供的功能,我们开发了各种内嵌的处理算法,如降采样和基于高斯模糊的细节简化算法。通过这些算法,我们可以处理采集到的图 像。我们使用了几个视觉模块提供的函数如模式匹配和光学字符识别来检测感兴趣的视觉对象。但我们绝不限于只使用模块提供的功能函数。例如,我们使用色彩对 比函数选板中的函数创建了人脸识别算法。
最开始,被测物体是通过一个商业的头部显示器(Head mounted display, HMD)展示给被测对象,但我们很快就意识到我们可以使用通过串行接口的一组LED来自定制一个改良的、低分辨率的显示器。为了将我们自定制的头部显示器 整合进仿真系统中,我们选择了NI USB- 8451 I2C/SPI接口模块。有了这个接口模块,我们可以迅速通过我们的目标识别软件来产生一个明亮的图像显示。我们可以使用人类视觉无法分辨的速 度来刷新LED阵列中所有128个LED。
NI 解决方案的优势
通过使用USB-8451接口模块来采集回转器数据(I2C)并同时控制LED显示(SPI),我们最小化了对硬件设备的需求,这个不但简化了系统 的开发,而且帮我们节省了开发成本。我们也考虑过使用其它供应商提供的别的串行接口设备,但USB-8451凭借它易于集成的特点轻松融入了我们的系统, 让我们转向NI的产品。同时,作为NI的典型硬件产品,USB-8451在安装驱动的时候也安装了大量有用的范例程序,这进一步加速了我们的开发。
作为我们仿真系统软件的应用开发环境,除了LabVIEW,我们没有考虑过其它的产品。作为一个狂热的LabVIEW开发者已经有10年时间,这 10年中,我发现没有任何一款其它的应用程序开发环境(ADE)能够提供像LabVIEW一样快捷、灵活的软件开发和调试体验。另外,LabVIEW提供 的一系列现成的视觉处理函数非常方便易用,编程效率很高,这是满足我们项目需求必要因素。
技术前景展望
这项技术在未来有着无穷的发展潜力。我们可以使用彩色的LED来反映不同的信息,这样佩戴者就可以区别物体的重要性,例如是行人还是道路标记。我们还可以通过控制LED阵列的亮度来反映被测物体的远近。
我们相信,凭借我们的努力,可以进一步改进字符识别程序,使它可以在通过佩戴者的集成耳机,在将图片读回之前就能够区分报纸文章的头条消息和视频中 的图像。同样的,我们可以实现条形码识别算法,这已经是NI视觉开发模块的一部分,使我们的产品可以识别不同的商品,然后下载价格信息并阅读给佩戴者。
结论
我们现在已经开始了这项新技术的第一次完整的临床试验。虽然这项技术还处于开发的初期阶段,但是我们的创新能力必定能给我们开创一条帮助视障人士的新的途径。
正如上面所说,我们在这项技术上有着宏伟的计划。通过使用LabVIEW作为我们仿真系统的核心以及采用有很强可维护性的软件架构,扩展我们现有的系统来集成未来的新创新技术的过程将会是简单而且高效的。