- 12/28
- 2015
-
QQ扫一扫
-
Vision小助手
(CMVU)
人类的眼睛总是和各种富有灵气的词汇联系在一起,并不断赋予人们创新的源泉。人类大脑中接近一千亿个神经元,绝大多数只做一件事情,就是处理我们的视觉信息,因为大脑所接收80%的信息都源自视觉。那么在极限追求智能的今天,机器也变得越来越灵光闪闪。而当机器有了高精度的视觉,将为整个世界带来怎样的改变?
机器视觉有什么用?
英国《每日邮报》2013年11月曾报道过日本东京大学研制出的机器人。这款机器人在玩经典的游戏石头剪刀布时,战无不胜,打败了所有的人类挑战者。如此好的战绩都得归功于它的高速视觉系统,系统能帮助它观察对手的手指运动趋势,并在最短时间内分析出对手手指的最终形状,然后伸出能够战胜对方的手势。但严格来说,这可是在作弊呀。
开挂的石头剪刀布机器人
2014年3月在英国伯明翰一个青年科技展上,代号为“Cubestormer3”的机器人以3.253秒的极速还原魔方,打破吉尼斯世界纪录,比上一代机器人创下的旧纪录快了2.017秒。据称人类目前最快的世界纪录也要5.55秒呢。这款机器人由科技公司ARMMobile花费18个月研发,还原魔方时会先用一部三星GalaxyS4手机扫描魔方,完成计算后便能开始利用4只机械臂不断翻转,3秒搞定还原。
魔方高手 Cubestormer3
这些鲜活的科技成就,让我们体会到机器视觉所带来的震撼和新奇体验。但机器视觉绝非仅仅应用于以上所述狭小范围,发展机器视觉的目的是为科学研究、国防军事、自然旅游、科普教育、历史文化、工程建设、医疗卫生等众多领域提供服务。视觉产品也将涉及人们的工作与生活、对传统各行业的改造,并可提供更加卓越的效率。
我们需要什么样的机器视觉?
所谓机器视觉,并不仅仅是人眼的简单延伸,更重要的是要具有人脑的一部分功能一一从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。
这项技术从上个世纪发展至今,不断被刷新,但是与创想不同的是,现实应用中也存在诸多“痛点”:
比如工作环境光线不充足,或者同时需检测的几个部件颜色过于接近,或者需检测的部件是黑色的,这些情况下,有时机器眼睛就会傻傻分不清楚。而与此并存的另一个问题是机器视觉的实时性不足,及“大脑”对图像信息的分析和理解速度慢。
如果把机器视觉比作人类赋予机器人的眼睛,那么目前机器人的视觉水平还处于婴孩阶段,虽然能看到影像,但是还非常欠缺分析信息和反馈信息的机制,所以我们要做的还很多。
试想下机器人如果能够识别移动物体的攻击性动作,并及时触发反制机制,那么我们的政要们出门就可以不用带着保镖而是随身跟着机器人保护自己,而且安全系数更高;如果机器服务生能够非常快速并准确的看到过往的顾客,并及时躲避,那么机器服务生就可以实现真正安全的服务水准;如果能实现以上所述,那么我们的无人驾驶汽车就可以得到迅速推广,并放心的开到马路上了;如果孩子的机器玩具能够看懂孩子的表情,那么它就可以在孩子需要的时候帮他们拿到想要的东西,如果孩子周围有危险物品,也可以第一时间移开。
这种交互方式或许才是我们最终想要的,也是真正带我们走进智能世界的终极途径。
“察言观色”,机器视觉的新标准
人工智能领域也一直在追求这一目标:识别视觉信息的能力能最终决定机器智能化程度的高低以及人机交互体验的优劣,并且是一个十分有活力有前景的领域。最近博人眼球的百度人工智能在国际大规模视觉识别挑战赛中的成绩虽然存在争议,但是我们不难看出这个领域的关注度和各个公司在不断追求的目标。还有那个很可爱很可爱的Jibo机器人助理,除了它会和你说话、帮你订餐、它哪里让你觉得最亲切、交互体验最舒服呢?个人感觉就是当你和它说话时,它会转过头看你; 如果你边走边和它说话,它的“目光”也可以一直锁定你; 当你回到家时,它能认出你; 还可以帮你拍美照,以上这些功能都属于机器视觉范畴。
可爱的机器人助理Jibo
上帝给了人类眼睛让我们了解世界,我们可以毫不谦虚的预测我们赋予机器的眼睛将会改变世界。从早期的扫描仪,OCR识别软件,到现在光学照相机,高速摄像机,再到数字超高速摄像机,每一项进步,不单纯是一个事件,而是一种需求,只要人类有需求,世界就会有变化,相信机器会察言观色也将很快变成司空见惯的事实。