- 12/30
- 2015
-
QQ扫一扫
-
Vision小助手
(CMVU)
美国东部时间12月10日,素有“计算机视觉奥林匹克”之称的ImageNet结果揭晓。此次比赛有微软、三星、高通、腾讯、UIUC等业界和学界巨头参与,三支华人科学家团队则囊括了所有冠军。来自国内的商汤科技(SenseTime),更是成为首个在此项赛事中夺魁的中国企业。 首夺世界冠军的中国企业
在计算机视觉领域,ImageNet堪称发展风向标,在学界和业界都有着深远影响。
中国企业此次夺魁的“视频物体检测”比赛,是今年ImageNet的新增比赛任务,需要在运动的连续视频中检测物体位置、同时识别物体类别,堪称此次比赛中难度最大的领域。一旦该技术成熟,在无人机、交通、安防、电影、动画等领域都将迎来巨大的应用空间。
这项赛事中夺冠的团队,由香港中文大学欧阳万里教授和商汤科技主任研究员闫俊杰领衔,在检测数量、检测准确率两项指标上都获得了世界第一,其中检测准确率更是超过60%。要知道,在四年前的首届ImageNet上,冠军对于静态图片物体的检测准确率也仅为8%。
这并非香港中文大学在此项赛事上首次一鸣惊人。该校的多媒体实验室由汤晓鸥教授创立,是最早应用深度学习进行计算机视觉研究的华人团队。在去年的ImageNet上,该实验室团队就曾获得世界第二名,仅次于谷歌;同样是在去年,在另一项世界级人工智能竞赛LFW(大规模人脸识别竞赛)上,该实验室曾力压FaceBook夺得冠军,使得人工智能在该领域的识别能力首次超越真人,引爆科技界,并直接催生了之后该项技术的大规模商用浪潮。
领跑视觉技术的华人科学家
ImageNet由斯坦福、卡耐基梅隆、北卡罗莱纳、密歇根等一流名校发起。现在,它正在迎来华人科学家“包圆儿”的时代。
比如,在图像中物体定位、检测比赛中获得多项冠军的微软研究院团队,就是由4位中国科学家组成。该团队研究员何恺明博士,同样毕业于香港中文大学多媒体实验室,2009年,他就成为首获计算机视觉领域三大国际会议之一CVPR“最佳论文奖”的中国学者。
而在图像中物体定位等任务中取得世界第一的,同样是由华人科学家率领的团队——悉尼科技大学陶大程教授、邓健康博士、和南京信息工程大学刘青山教授领衔此团队。值得一提的是,2015年获颁澳大利亚科学最高荣誉尤里卡奖的陶大程,也出身于港中大多媒体实验室。
在计算机视觉这项“烧钱”又存在重重技术困难的领域,历届ImageNet中,都体现出巨大的技术壁垒。自2010年创办以来,ImageNet 的参赛者中,不乏人工智能巨头,包括谷歌、百度、微软、高通、IBM、NEC、Adobe、三星、INRIA、牛津大学、伯克利大学等;而冠军,则大多由谷歌,微软、NEC等工业界巨头,以及多伦多大学、东京大学等名校获得。
纵览此次夺冠的所有团队,无一例外地,都吸纳了大量的知名教授、优秀博士生。
打通学界与工业界
在ImageNet中,每隔一段时间,就会增加一项学术和工业界公认的最难的任务。例如,2013年新增的图像中的物体检测任务,需要同时标出图像中所有物体位置并识别,是当时人工智能的研究热点。而今年新增的“视频中通用物体检测”,则是首次引入的视频任务,除了难度更高之外,其对于工业界的实用价值也更强,更好地反映了市场的需求。
2012年至今,随着人工智能突破性新技术—深度学习方法不断进步,计算机视觉技术也进入了黄金发展期。作为最“烧脑”的行业之一,人工智能也的确需要这样的合作。
商汤科技CEO徐立表示,深度学习给人工智能领域带来了巨大变革,传统工业界和科技界都需要有储备和准备应对这场变革。
“利用深度模型在竞赛中学习得到的特征可以被广泛应用;由ImageNet训练得到的深度学习模型,将会是推动人工智能在视觉领域发展的强大引擎。我们希望用持续积累的原创力量推动这场变革,帮助更多的企业,尤其是中国企业把现有产品与科技前沿的成果有地融合,让中国的消费者更早享受到科技进步的改变。”徐立说。
陶大程则十分看好学术界与工业界的合作前景:“我们这支参赛队伍由悉尼科技大学、南京信息工程大学联合组成,并获得了AMAX的硬件支持。大公司的优势在于硬件、人力资源方面的整合能力,学术界则能够提供很多创新的想法。港中文多媒体实验室和商汤科技的联手夺冠,也是很成功的范例。大家合作研究技术与产品,这不仅仅是某一个实验室、某一家公司的事情,而是整个人工智能界的必由之路。