日期
10/18
2017
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

大华股份人工智能技术:文本识别领域又拿下两项国际竞赛第一
收藏
2017-10-18 09:40:19来源: 中国视觉网

  大华股份基于深度学习技术的文本识别算法在ICDAR的Born-DigitalImages(Web and Email)和Incidental Scene Text两项比赛中同时刷新了全球最好成绩,超越腾讯、百度、优图、海康等多个知名AI企业,为人工智能的产品和解决方案提供了坚实的技术基础。当前该技术已应用到公司的多个领域,包括:车牌识别、集装箱号识别、物流面单识别、自然场景字符识别等。
  关于ICDAR:即国际文档分析与识别大会(International Conference on Document Analysis and Recognition),是国际模式识别协会举办的文档分析与识别、模式识别领域世界最权威的国际学术会议之一,每两年举办一次。
相对于传统意义上的文本识别任务,自然场景下的文本识别任务存在图像压缩降质、字体多变、角度倾斜等不利因素,对算法模型的鲁棒性提出了很高的要求。大华的文本识别技术,在Attention机制的基础上,结合多特征多模态融合技术大幅提高了文本识别的精度,达到全球领先水平。

  ▲互联网/邮件文本识别竞赛
  互联网和邮件文本识别竞赛(Born-DigitalImages Competition)主要针对的电子产品存储的互联网和邮件文本图像。大华股份取得了97.43%的识别率,位列第一。

  ▲随手拍自然场景文本识别竞赛
  随手拍自然场景文本识别竞赛(IncidengtalScene Text Competition)是难度系数最高的文本识别竞赛任务之一,其难点在于待识别文本都拍摄于真实街道或商场场景。大华股份以82.76%的识别率超越第二名2.47%,位列第一。

测试集识别结果

  ▲文本检测识别技术在集装箱和海外车牌识别中的应用

集装箱应用场景

突尼斯车牌应用场景