- 03/08
- 2007
-
QQ扫一扫
-
Vision小助手
(CMVU)
美国麻省理工学院的科学家们应用了一套计算机模型,该系统模拟人的大脑将可视信息处理为复杂而现实的世界:可识别繁华街道场景中的目标。“在相当长的一段时间内,人们都在谈论计算机模拟人脑这个问题,” Eugene McDermott脑科学和认知神经科学研究教授Tomaso Poggio说,同时他还是麻省理工学院大脑研究所的成员。“我们的研究从生物学角度启发了计算机科学。” Poggio说。
“我们开发了一套视觉系统模型,可用于神经科学家的实验设计和解读,但同时也可应用在计算机科学上,” Poggio实验室的博士后助理Thomas Serre说。“我们将街道场景识别作为例子,这是因为它有固定的目标识别类,也是实际的社会应用,” Serre说。在由Serre等人完成的论文(March 2007 IEEE Transactions on Pattern Analysis and Machine Intelligence)中,描述了团队如何展示这套模型随机选择图像,即该系统学会了如何根据特征识别现实世界中常见的目标物,如树木和人。在所谓的培训管理中,这套模型通过在街道场景中建立的数字照片,并根据目标物的类别代表来对目标物进行分类,如:楼房和汽车。
与传统的计算机视觉系统相比,这套生物模型是垂直式的。传统的系统专为特殊的目标物类别进行设计。例如:专门设计用来进行面部识别或材料识别的系统在检测汽车上就会很逊色。在生物模型中,相同的算法可用来对多种不同类别的目标物进行检测。
在对模型进行测试的过程中,团队选择了以往在街道场景数据中不能看到的情况。这套模型先是扫描场景,然后根据最先设定的管理培训,在场景中对目标物进行识别。最大的亮点就是该模型可从例子中获得信息。根据Poggio的说法,这是该系统人工智能的标志。
教会计算机如何识别目标物曾经很困难,这是因为一套计算机模型有两个相矛盾的目标。它需要为一类典型的目标物创建一个非常特殊的代表,如一匹马与一头牛或一头独角兽。同时,这些代表又必须完全“不改变”,这样就不能考虑在姿态、照明及其他外表上的变化。
即使是一个孩子的大脑也能很好的应对这类相矛盾的目标物识别。类似于像素的信息从网膜进入,然后通过视皮层的分层结构。Poggio实验室的模型之所以有这样的功能,用计算机术语来讲,它模拟了大脑自身的分层结构。专业的说,该模型内的“多层”根据生物实验室的神经记录模拟了神经元的输入和输出。
(中国图像网报道)