日期
05/04
2017
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

海云数据展示最新的唇语识别技术,连比尔·盖茨都为他们点赞
收藏
2017-05-04 13:26:30来源: 中国视觉网

    在很多武侠小说中,我们经常会看到一些武林高手远距离通过读唇语便能知晓别人说了什么,让人惊奇。然而时至今日,这一“特异功能”将不再只是幻想。

 

    5月2日,这个比尔·盖茨曾到访并高度评价的企业,将带着他们最新的唇语识别技术参加展览,市民将有机会一睹其“庐山真面目”。

 

 

    据了解,海云数据被称为中国大数据可视分析的领导者,提供企业级大数据整体运营与分析服务,依托于计算机数据视觉、数据算法等技术,探索大数据的潜在商业价值,为不同行业客户提供基于数据交互可视化的整体产品,真正实现将大数据应用于分析、决策和预判领域。

    2016年11月,Google旗下的Deepmind发布了一篇唇语识别研究论文,识别的准确性大幅度超过人类专家,成为人工智能超越人类的又一个领域。而海云研究院自2016年12月以来,成功复现了Deepmind发布的研究成果,同时开展了中文唇语识别模型的研究工作,取得了一定的成果。目前看来,中文识别模型有望在准确性上超过Deepmind发布的英文识别模型。海云数据称,将在今年上半年公布研究成果。

 

    目前,海云数据的唇语识别技术的中文准确率已达到71%,英文准确率高达80%。

 

    据了解,唇语识别是一项集机器视觉与自然语言处理于一体的技术,目的在于直接从有人讲话的图像中识别出讲话内容。唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,判断其中正在说话的人,提取此人连续的口型变化特征;随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音;随后根据识别出的发音,计算出可能性最大的自然语言语句。

 

    训练唇语识别模型,需要用到大量的语料,这些语料是经过处理的有人讲话的视频,以及视频中每个讲话的口型所在的时间点上,对应的讲话内容文字。可以使用来自视频网站的公开视频,但是这些视频不能直接使用。利用视频制备语料,首先需要对视频进行筛选,把说话人不在画面中的部分去除,然后分离出筛选后的视频中的语音,将语音识别成文字,最后将识别出的文字对齐到语音中相应发音的时间点上。

 

 

    海云数据目前已创造出全新的大数据运营产品“图易”、“智驾”、“ DIVA”、“智警”、“慧务”等多个产品。微软创始人比尔·盖茨曾在造访海云数据时评价道:“这是一支充满激情的团队,形象化数据是商务智能的重要组成部分,我对海云数据的数据分析能力印象深刻。”

 

    今天,海云数据的产品被世界500强企业所广泛使用,并进一步推动了大数据可视分析的商业应用市场空间。