- 10/18
- 2017
-
QQ扫一扫
-
Vision小助手
(CMVU)
大华股份基于深度学习技术的文本识别算法在ICDAR的Born-DigitalImages(Web and Email)和Incidental Scene Text两项比赛中同时刷新了全球最好成绩,超越腾讯、百度、优图、海康等多个知名AI企业,为人工智能的产品和解决方案提供了坚实的技术基础。当前该技术已应用到公司的多个领域,包括:车牌识别、集装箱号识别、物流面单识别、自然场景字符识别等。
关于ICDAR:即国际文档分析与识别大会(International Conference on Document Analysis and Recognition),是国际模式识别协会举办的文档分析与识别、模式识别领域世界最权威的国际学术会议之一,每两年举办一次。
相对于传统意义上的文本识别任务,自然场景下的文本识别任务存在图像压缩降质、字体多变、角度倾斜等不利因素,对算法模型的鲁棒性提出了很高的要求。大华的文本识别技术,在Attention机制的基础上,结合多特征多模态融合技术大幅提高了文本识别的精度,达到全球领先水平。
▲互联网/邮件文本识别竞赛
互联网和邮件文本识别竞赛(Born-DigitalImages Competition)主要针对的电子产品存储的互联网和邮件文本图像。大华股份取得了97.43%的识别率,位列第一。
▲随手拍自然场景文本识别竞赛
随手拍自然场景文本识别竞赛(IncidengtalScene Text Competition)是难度系数最高的文本识别竞赛任务之一,其难点在于待识别文本都拍摄于真实街道或商场场景。大华股份以82.76%的识别率超越第二名2.47%,位列第一。
测试集识别结果
▲文本检测识别技术在集装箱和海外车牌识别中的应用
集装箱应用场景
突尼斯车牌应用场景