2021十大人工智能趋势：3D视觉技术如何助力产业消费升级--机器视觉网

人工智能产业已经上升至国家支持产业，人工智能技术的发展对国家经济发展、产业转型和技术进步起着至关重要的作用。近日，在2021全球人工智能技术大会(GAITC 2021）上，腾讯优图联合厦门大学人工智能研究院共同发布了《2021十大人工智能趋势》，基于长期对人工智能尤其是计算机视觉的研究洞察，提出3D视觉技术、数字内容产业、AI多模态融合等方向的前沿预测。

趋势报告显示，3D视觉算法效果大幅提升双重促进视觉体验增强和生产成本下降，不断推动商业发展和个人消费升级；AI与数字内容产业的深度耦合，也将有希望为行业释放更大的科技势能，构筑数字内容生成新范式。

1.3D视觉技术助力产业消费升级,淡化虚实边界

作为视觉AI领域多年热点研究方向之一，3D视觉技术的核心任务是对三维空间、物体及环境进行真实还原与重建。随着相关算法与硬件计算能力的不断升级，3D视觉算法效果得到大幅提升，三维几何重建更加精细,表面纹理重建更加清晰,带来更加逼真的视觉观感。

近年来，诸多3D视觉研究成果为低成本高质量的3D内容生成提供了良好技术支撑，基于3D虚拟形象的舞台演出、直播带货、教育互动等应用层出不穷，成为AI内容产业全新发展方向。以此为基础，结合5G时代流量带宽的全面升级，带有交互功能的3D虚拟现实、增强现实、混合现实的3D视觉应用将用户体验向真实与虚拟的完美融合进一步迈进。

用户会因为虚拟偶像生动自然的舞台表演进行打赏，会由于虚拟主播“卖力”地带货促销而下单购买，而线上平台则依靠3D视觉技术大大降低内容制作和IP运营成本，最终带来社会商业发展模式与个人消费习惯的颠覆与变革。展望未来，3D视觉技术将持续在包括游戏娱乐、影视制作、电商直播、医疗整形等众多领域广泛应用，虚拟与现实的边界将不断淡化。

2.人工智能推动数字内容生成向新范式演进

随着数字文化产业的蓬勃发展，尤其是二次元文化渗透出圈，数字内容产业面临新一轮的需求升级，伴随着5G商业化进程的不断加深，多元化、精品化的优质数字内容将面临更快的消费节奏，与此同时，供给侧仍存在巨大的产缺口，数字内容产业正处于劳动密集型向科技密集型的转型阶段。

AI与数字内容产业的深度耦合，将有希望为行业释放更大的科技势能，以GPT-3、DALL-E为代表的AI技术，已在文本、语音、图像、视频等内容生成中取得了令人惊艳的结果，然而在精确性、泛化性、合理性方面仍然面临挑战，目前的前沿研究一方面探索从模型结构（自动化搜索等〉，训练形式(无监督对比学习等〉等方面提升精度效果;另一方面引入知识图谱领域知识，向机器介绍常识和其他特定领域的知识进而提升常识推理效果。

伴随着技术的持续升级演进，我们预页见AI将逐步在数字内容生成领域释放引擎级的影响力，在内容、平台、技术多方合力引导下，构筑数字内容生成新范式。

3.多模态融合加速AI认知升维

深度学习在多个人工智能的细分领域（如视觉，自然语言处理等〉已日趋成熟化和规模化，然而要真正实现通用人工智能，必然要将这些细分领域各自所针对的信息模态整合利用，即多模态融合。多模态融合的目标是建立在图像、文字、语音等的多模态信息识别的基础上，实现不同模态信息的统一表征框架,从而起到1+1>2的作用。

典型的场景之一是通过图文语音联合识别，实现对隐晦和暗示性，招嫖广告，儿童不良表情包等图文混合内容识别，支持审核业务i深度打击不良内容。除了图文融合等跨域模态融合，同域内的不同信息维度同样可以融合，如随着深度生成技术的发展，当前的人脸识别除了传统的RCB图外，还需要融合深度图、红外图等信息来更好的防御越来越多元化的人脸伪造攻击，实现更强的人脸防御。

随着人工智能认知能力的提升，多模态融合也将会从图文等实质性模态，逐渐拓展到如物理关系，逻辑推断，因果分析等知识性模态，从感知智能迈向认知智能。

4.无监督/弱监督学习逐渐成为企业降本增效新利器

在过去的几年中，深度学习所取得的巨大成功离不开大规模标注的数据集。大规模标注成为企业发展过程中抬高交付成本、制约效果提升的主要因素之一。在此背景下，无监督学习和弱监督学习通过不使用标签或减少对标签数量、质量的要求来迅速降低深度模型对于数据的标注需求，使得原本无法利用的数据如今都可以加入到模型的练中去，进而由量变引发质变。

可以预见的是，将有越来越多的人工智能企业会面临从前期的迅速扩张到稳定期高效化运作的新阶段，而在这个过程中，无监督/弱监督学习无疑将成为他们过渡到这个阶段的重要手段之一。

除此之外，自动机器学习的自动化程度与可解释性提升、边缘计算与人工智能加速融合、人工智能内核芯片向类脑神经计算方向演进、AI算法公平性与隐私保护、人工智能技术向安全智能方向迈进等趋势，也成为趋势报告的关注重点。