日期
05/08
2015
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

机器视觉 智能生活的第三只眼
收藏
2015-05-08 09:41:00来源: 中国视觉网

  上世纪50年代,美国人弗兰克·罗森布拉特开始尝试建立一种能够像人类思维那样从感知到识别,再到记忆的机器。后来,他成功了,人们看到了“感知器”。这是一种人工神经网络,当时主要被用来对二维图像进行分析、识别和理解。

  伴随光学技术、图像分析等技术逐步完善,时至今日,机器所能看见的事物,某种意义上已经开始让那些拥有“5.0”视力的人类望尘莫及,未来的想象空间已进一步打开。

  为了说明智能技术如何帮助食物管家们省心省力,Scorpion Vision的总经理保罗·威尔逊举了一个披萨生产的例子:“他们设计了一块金属模板用来测量披萨的大小,每半小时这么测量一次,以确保每块披萨的大小都是正确的。”但是,“如果你用机器视觉代替这一步骤,可以在人力上省去不少成本。”

  “这种级别的自动化往往带来意想不到的好处。”他说。Scorpion 正将高级别的3D识别技术应用于石油天然气行业,用来监控机械位置,以及在水下放置电力信号传送脐索的角度。

  让机器代替人眼来“看世界”并加以行动,这曾是科幻小说家所憧憬的世界。在好莱坞剧作家笔下,机器人要么意图秘密推翻人类,要么是不停闪烁或者发出嗡嗡叫声来提供喜剧效果。但现如今的真实世界已经大为不同,先进的机器正深刻地“洞悉”人类世界,它们所到之处,见证着智慧世界的活色生香。

  通过摄取图像模拟人眼的视觉功能,并提取信息加以分析处理,最终从食品生产流程管理、农业种植控制及医学检测等个体需求,再到交通及安防等公共项目,“机器视觉”已经成为构建智慧城市过程中不可或缺的“第三只眼”。

  机器视力不止“5.0”

  上世纪50年代,美国人弗兰克·罗森布拉特开始尝试建立一种能够像人类思维那样从感知到识别,再到记忆的机器。后来,他成功了,人们看到了“感知器”。这是一种人工神经网络,当时主要被用来对二维图像进行分析、识别和理解。

  这种技术随后的发展就像是手握一张平面图纸,后来建造出了摩天大楼。从二维图像出发,到了上世纪60年代,麻省理工学院的科学家们已经可以通过计算机程序从数字图像中提取出诸如立方体及楔形体等多面体的三维结构。十几年后,这种机器的“视觉”开始系统性发展,一些视觉应用系统及方法、理论框架随之出现。

  机器视觉在互联网最为蓬勃发展的上世纪末吸引到大批“极客们”的注意,这种热情延续至今。

  当人们发现,信息和通信技术(ICT)行业已经成为重要的社会基础设施,更高效的社会功能也愈发被需要。机器视觉开始在满足这些预期上扮演重要角色。

  在电脑诞生之初,鼠标曾经是最重要的“人机交互”工具,它们靠一根线联接。后来,智能手机的出现,让触控屏幕成为新的交互方式。但它依旧离不开和机器间的密切接触。

  碍于机不离手的麻烦,身处德国柏林的科研人员开始酝酿新的技术革命:用手势来操控电脑和其他自动机械。那是2011年的某一天,据报道,心理学家保罗·霍耶茨基当时站在大显示屏前拍手。不一会儿,显示屏上出现一本皮革封装的古书。霍耶茨基靠上去开始在空中挥动自己的手臂,神奇的是,书本开始跟着他的手势翻页。

  支持这一技术的,是两个装在显示屏上方的照相机。镜头摄下了动作,后台软件便可以判读手势的形状,然后将指令发给电脑。

  随着技术进步,机器视觉不仅可以作为人类视觉的替代,也帮助批量处理更加“立体生动”的信息。德国视觉软件供应商MVTec在去年底发布了机器视觉算法包“HALCON 12”,能够监测和跟踪物体的三维运动。HALCON 12新特性还包括一个“自动文本阅读器”,它既可以处理字符特征的变化,还可以检测和识别针对个别字符的操作。

  随着科技业巨头谷歌正式发布ProjectTango项目,3D机器视觉变得更热门。通过3D成像技术,机器可以引导车辆等联网设备自主运动并快速传输图像。

  上世纪五十年代创立的Fanuc一直在研究机器人如何协助工厂自动化。区域销售经理约翰·莱纳说,该公司一直在忙于整合2D和3D视觉传感器,基于名为iRVision的解决方案,机器人视觉可以帮助执行选择、检查、扫描条形码和矩阵识别等高级功能。它还可以模仿人类的手眼协调能力提供自动化的解决方案。

  机器领域专家、图像传感器开发商Aphesa的创始人及CEO阿诺·达尔蒙特则推出一种高速3D视觉相机,这是一种基于千兆以太网通信协议开发的设备,允许用户进行长距离的快速图像传输。

  机器所能看见的事物,已经开始让那些拥有“5.0”视力的人类望尘莫及,未来的想象空间进一步打开。“我们已经看到最近在3D成像方面有一些重大突破,但谁知道接下来会发生什么。”达尔蒙特说。

  跨领域洞察世界

  在诞生之初,机器用来帮助人类从高度重复或者极度危险的工作中得到解放,它们也被应用于小精度、焊接和绘画等汽车装配线上。如今,机器人自动化技术的进步反过来在推动高度复杂项目的工作速度,同时也提供着劳动力度和灵活度。在诸如医生手术等关键领域,人类可能遭受疲劳和注意力分散等问题的困扰,但机器视觉得以帮助增强工作的精密度和准确度。

  人们也很快发现,这种借助机器的“隔空操纵”在一些特定行业中可以多加利用:比如特别为了开刀而设计的机器。医生可以在进行手术时,让机器帮助呈现检验结果、病历报告、X光片,并通过识别医生手部的动作,机器可以来帮助放大所需要细细检查的患者部位。而这一切,都在无菌的情况下完成。

  技术的演进也在食物质量控制领域开辟新的可能性,无论是对食品本身或是包装的检验,还是可追溯性,机器视觉都立下功劳。

  通过智能相机,一直以来由人眼充当的所谓产品质量控制“黄金标准”如今就要被机器替代。Stemmer Imaging的市场主管威廉姆森表示,视觉系统的改进算法,让这些机器更易于被部署。这在十年前,是很难想象的。

  “我们将产品销售给好几家生产食品加工机器的企业。”威廉姆森举例说,每一包培根都需要有固定的重量和数量,但是“猪肉并不是作为标准化产品被运输来的”,所以需要部署机器视觉系统,让它帮忙检查熏肉切片有多少脂肪和瘦肉,并调整厚度。“这帮助在早期生产流程中识别出错的地方,防止浪费。”他说。

  科技业新技术迭出,也为机器视觉的应用领域不断打开新的窗口。研究机构Transparency近日指出,纳米传感器、机器对机器(M2M)通信系统和物联网等新兴趋势预计将进一步提振工厂自动化和机器视觉市场。

  未来这一技术可应用的领域或扩展至消费性电子、可穿戴式装置、汽车先进驾驶辅助系统以及智能化监控等更贴近大众生活的领域。

  申万宏源(000166,股吧)研报认为,随着“工业4.0”的浪潮袭来,机器视觉会摆脱最初“辅助工具”的地位成为生产系统的“眼睛”与 “大脑”。机器视觉通过机器视觉产品将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄取物的形态信息,再根据其体现出的像素、亮度、颜色等分布转换成数字信号,然后利用人工智能软件系统对数据进行分析处理,最终从中推断出人类所需的信息并进行下一步分析决策。

  抢夺产业链前哨

  机器视觉系统主要由光源、镜头、相机、图像采集卡以及核心软件五个部分构成。工厂自动化风潮兴起,正带动机器视觉设备需求大幅增温。其中相机是关键硬件。

  根据申万宏源数据,2011年至2014年,我国机器视觉市场规模持续扩张,工业相机市场份额连续4年保持平稳增长,增幅远高于中国整体自动化市场的增长速度。

  然而,工业智能相机并不是一台简单的相机,而是一种高度集成化的微小型机器视觉系统。其最本质的功能就是将光信号转变成有序的电信号。

  与此同时,芯片及相关应用程序(APP)也正在争夺产业链的前沿。

  德州仪器日前便发布了两款高分辨率DLP(数字光处理)芯片组,它们能够广泛适用于3D打印机、3D机器视觉系统及光刻机等多种工业用途。而多家半导体厂商则透过与专业IP厂商合作/授权的方式,推出其专用视觉处理器,包括飞思卡尔、德州仪器以及意法半导体等。

  早在两年前,一款名为Presence的应用,便已经可以让用户家中闲置的iPhone、iPad及iPod Touch等智能设备变身为免费的监控摄像头。

  用户只需在一部随身携带的手机上安装这款应用程序并登陆账号,家中所闲置的另一部设备上的该应用便开始进行摄像,它提供实时视频和音频流、运动检测,并将异动及时通知用户。用户从此不用担心家中被盗,或是狗狗捣乱。

  其他的一些应用也有类似的功能,例如AirBeam也是一款视频监控应用,帮助用户通过网站获得视频。

  对于盲人,机器也可以通过APP成为他们的眼睛。名为KNFB Reader的APP可以将影印文字转换为音频,传进盲人的耳朵里。有了它,无论是浏览菜单、写读书报告,或者在瓶瓶罐罐上贴标签,盲人都可以变得和普通人一样便利。这款APP是美国盲人联合会与知名人工智能科学家兼谷歌高级雇员科兹威尔长达40年合作的成果。

  产业蓝图盈利可观

  不过,当城市、机场以及商场都希望增强公共生活的便利性、安全与防护的同时,一些问题也随之而来,人们开始关心个人隐私问题以及数据如何被收集、储存与利用。

  在今年的美国国际照明展上,作为光传感网络(LSNs)的先驱,Sensity System公司的“无监控防护”拉开“隐私为先”的视频安全解决方案的纪元。

  无监控防护解决方案是一个综合性处理方法,包含了分散式存储与处理、分布式分析以及渗透式传感网络,在保证了个人隐私的同时也提高了安全防护。通过利用分析学而非人为监控,Sensity的隐私优先技术能够实时鉴别出发生在特定的“热点地区”潜在事故,从而给安全部门发出警报。

  该公司的CPO西普曼表示,隐私是Sensity如何运作的核心元素,公司利用技术与加工保证了隐私。最新进展证实了隐私为先技术的可能性:基于视频图像的安全防护措施在产生安全效益的同时最小化了意外事件的视频收集数量,并减少了潜在的渗透个人隐私方面的无限记录视频监控。

  通过结合平台上的带有分散录像式视频缓冲器的高速无线网通讯提供了对安全事件的态势感知,使得工作人员能够观看实时警报流的同时也能够看到先于事件的全分辨率视频片段。这个措施可以最小化第一目击者的危险。

  这在一定程度上缓解外界顾虑,而机器视觉这一产业近年来的发展也有目共睹。AIA的调查显示,在2014年,北美地区的机器视觉组件和系统的销售额实现了15%的增长,达到23亿美元,创下有这项调查以来最佳表现。分类别看,软件出现19%的同比增幅,其次是相机、照明和光学,同比增长率都在10%以上。

  根据Tractica本周发布的报告,计算机视觉将在2014年至2019年的五年间以高达42%的复合年均增长率扩容,从2014年的57亿美元到2019年增长为333亿美元。

  “科技的快速发展、下跌的芯片价格、自动化及监测需求的提高,以及消费者对附带摄像机设备的需求,这是驱动应用计算机视觉科技的一些因素。”该公司的资深分析师阿南德·乔希表示。

  而行业龙头已经从中尝到蜜糖。2014年,全球最大的机器视觉公司康耐视净利润增长惊人,增幅高达65%,收入则增长了37%至4.862亿美元。此外,Datalogic去年的销售收入增幅为3.1%,净利润总额则同比上升了14.7%。

  名词解释

  机器视觉(MV)使用自动化技术捕捉图像并传输到电脑,捕获的图像随后将被进行检查处理,最终用于实际检测、测量和控制。这是一门涉及人工智能、神经生物学、心理物理学、计算机科学、图像处理、模式识别等诸多领域的交叉学科。一般而言,一套完整的机器视觉系统由光源、镜头、图像采集系统和视觉分析软件组成。