首页>专访>正文
日期
06/23
2025
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

AI视觉让机器人从"看得见"到"想得通"
收藏
2025-06-23 11:38:41来源: 中国机器视觉网1432

伴随全球人工智能技术的蓬勃发展,智能机器人迎来了一个新的爆发期。机器人视觉技术也从小众领域发展成为今天的产业创新主战场。梅卡曼德作为这一领域的领军企业,不仅完成了从动作自主(L2)到任务自主(L3)的技术进阶,还以领先的三维视觉技术和人工智能算法为智能机器人插上双翅。《机器视觉》杂志有幸邀请到梅卡曼德(北京)机器人科技有限公司创始人兼CEO邵天兰先生,探讨公司的创业历程、技术路线、未来发展战略以及他对行业未来的思考。

M:MACHINE VISION

S:邵天兰

创业之路:风口是等来的

"很多风口其实是等来的。超一流的人才能创造风口,大部分的成功源于深厚积累等待风口,而追逐风口往往是徒劳的。"回顾创业历程,邵天兰如是感慨。

邵天兰从2009年左右就开始涉足机器视觉和人工智能领域,他说,那时这些领域还非常小众,现在毫不夸张地说,如今几乎每家公司都自称是人工智能公司或智能机器人公司,非常火热。但我们早在这个风口很多年前就已经选择了这个方向。

选择机器人领域,对邵天兰来说更多是出于兴趣,机器人是一个跨学科的综合性领域。他本科在清华软件学院学计算机,但计算机是个强大的'锤子',需要找到合适的'钉子'。相比互联网,机器人在技术上更有挑战性,成就感也更大。

邵天兰介绍,梅卡曼德创立之初,三位创始人分别来自计算机、机械和电机领域的清华校友,这种跨学科背景为公司奠定了坚实基础。刚回国创业时,机器人和智能视觉非常小众,我们需要做很多科普工作。经过几年的持续发展,客户逐渐理解并认可了我们的产品价值。再加上人工智能技术的迅猛进步,从2021年开始,我们的业务便进入了高速增长期。

如今,梅卡曼德已经连续五年市场占有率第一,不仅在中国市场领先,在日本、美国、欧洲也是市场第一名。

德国求学:技术路线与产品定义的启蒙

邵天兰在德国慕尼黑工业大学求学和工作期间,参与了协作机器人的研发,这段经历对梅卡曼德的技术路线产生了深远影响。

在德国做机器人时,我有几个深刻感受。邵天兰回忆道,第一是机器人的实际使用是一个很复杂的过程。我印象很深的一件事是,我们做一个课程作业,七八个研究生一起加班加点干一周,才让机器人去做一些稍微复杂的事情。我就想,在真实场景中这肯定是不行的,企业负担不起。所以机器人最重要的是要有更高的智能,要能够很方便地部署。

第二个感受是发现机器人的瓶颈在于视觉。机械部分的速度、精度、负载在绝大部分情况下都已经够用了,但因为没有很好的视觉,所以很依赖固定的工装,适应变化和复杂环境的能力就很有限。

第三点感受是机器人应用场景的多样性。通过在德国参与的实际项目,我认识到我们要做的系统必须能解决多种应用场景,同时还要稳定可靠、简单可配置。

这些感受促使邵天兰回国创业后,没有选择做机器臂本身,而是专注于机器人的关键视觉系统,希望让它既简单易用又足够强大,能够在多种场景下快速部署。

跨越鸿沟:将创新转化为实用产品

从创新到一个可用的产品,确实存在着一道巨大的鸿沟需要跨越。谈及机器视觉行业面临的挑战,邵天兰说,我们也看到过许多技术创新和炫酷展示,但最终能够转化为优质产品的并不多见。

在机器视觉领域,这种从实验室到市场的跨越尤为突出。尽管我们能经常看到各种炫酷的技术展示,但最终能成为可用产品的却寥寥无几。邵天兰认为,真正的挑战在于如何提高系统的稳定性、部署效率,以及满足现场的实际需求。让一个系统在特定场景中真正可用,比号称能做很多事情要更重要。宁愿把一件事做到位,而不是宣称能做100件事,却没有一件做好。解决问题达到90%与完全没解决,实际差别并不大,因为对客户而言,这两种情况下系统都无法使用。

这种对产品落地和客户需求的关注,成为梅卡曼德赢得市场的关键法宝。技术创新固然重要,但只有真正解决客户痛点的产品才能获得市场认可。

AI时代的跨学科人才培养

作为跨学科背景的创业者,邵天兰特别强调了跨学科学习的重要性:今天的人才一定是多能化、跨学科的。以视觉领域为例,如果你学视觉,那么光学、成像的知识会很有帮助。有的人可能只专注于人工智能算法,不关心成像原理,但这样在面对实践中的真实问题时,解决方案就会受限。

尤其是,AI时代为跨学科学习创造了前所未有的便利条件,在当今这个AI时代,跨学科学习的门槛变得越来越低。以前资料可能都在图书馆,你必须去上课才能了解很多东西。但现在几乎所有知识都能在网上找到,有公开课、书籍、视频,甚至AI可以解答你的问题。只要你自己有心,愿意去学习,就能获取所需的知识,这与以往是完全不同的。

智能程度提升:机器人行业的巨大进步空间

谈到机器人行业的技术进步空间,邵天兰认为智能程度的提升是关键。梅卡曼德已经初步实现了"动作自主"(L2级别智能),即任务易编程,但动作通过3D视觉和人工智能的识别规划来自主进行。梅卡曼德是全球第一家实现这一技术规模化应用的公司。

目前,公司正在研发L3级智能,即任务可以通过自然语言的口头指令临时下发,机器人能自主理解并执行。未来还将让机器人能够自主寻找任务,进入到L4级别的智能。"我们正在做机器人的手眼脑,让机器人理解指令和任务,并能识别和操作非常广泛的物体,甚至逐渐进入服务业,比如便利店等场景工作。"邵天兰解释说,"简言之,就是能应对越来越复杂和变化的环境。今天的机器人主要应用在大型制造业和物流领域,但在中小制造业和服务业,仍有无数场景无法解决,主要是因为机器人智能程度不够,无法应对复杂变化的环境,无法与人很好地配合。随着大模型的进展,我们看到有希望逐步提升这方面的能力。"

Mech-GPT:多元异构数据的处理技术

邵天兰说,梅卡曼德的Mech-GPT已经达到了L3的阶段,因为它的任务是可以临时下发的,不需要完全事先指定。当然,目前它还没有达到规模化应用的阶段,现在还处于展示阶段。

关于Mech-GPT如何处理语言、视觉和空间坐标等多元异构数据,邵天兰解释道:"这是一个非常重要的问题。我们是在语言基座模型的基础上,把3D视觉空间、动作以及机器人手部操作训练在一个模型里面。这样它会继承语言基座模型的一些能力,比如理解语言以及部分常识能力,同时又把3D视觉空间的概念和操作也训练进去。"

据了解,梅卡曼德在这方面与中国科学院院士张建伟进行了合作,共同研发多模态大模型。从公司成立开始,张院士就一直是技术顾问,通过产学研合作,开发多模态大模型。通过这种以语言基座模型为基础,融合视觉、3D多模态和机器人操作的模型,能让机器人获得综合能力,理解指令,拥有一定的常识和推理能力,并且识别和操作丰富的物体,完成任务。

智能机器人基础设施产品的战略

梅卡曼德定位为"智能机器人基础设施产品公司",邵天兰解释了这一战略的落地路径:用户的需求是五花八门的,比如汽车总装厂、汽车零部件、家电生产、锂电、物流、服务业等多个场景都有应用。每个行业又有大量细分工艺,没有任何公司能独立为所有行业的所有需求提供解决方案。

但这些需求中有很多共性,比如我们做的3D相机、人工智能视觉算法软件等。如果每个场景都单独开发,既做不好也承受不起成本。所以我们要把共性的东西提炼出来,让大家不需要重新发明这些基础设施。

邵天兰还形象地比喻:就像我要做一顿饭,不可能先炼铁、造锅、种水稻,而是用合理价格买个现成的锅就可以炒菜了。工业需求极度碎片化,客户有很多定制需求,但其中的标准化组件需要有人专门做好。这是一个久经考验的商业模式。

感知技术的多模态布局

关于未来的技术布局,邵天兰表示,梅卡曼德当前以视觉为主,但也开始关注其他感官技术,如自然语言处理,未来还会涉足触觉等领域。视觉是当前机器人最成熟也是最重要的感官,所以短期内我们会先把视觉做深。从长期来看,也许一两年内还不够成熟,但像听觉、触觉等也都有很好的应用场景。

触觉传感器虽然近期有很多企业融资,但从技术成熟度来看,从核心原理到材料,再到算法和应用场景,都还需要进一步提升,相比视觉成熟度还低。从长期看,机器人一定是多模态的,会结合视觉、听觉、触觉等多种感知能力。

全球化布局:技术本地化与标准化并行

梅卡曼德的国际化战略已经初见成效。邵天兰介绍:我们在日本、韩国、美国和德国各有一家子公司,在东南亚等地也都有本地团队。目前,海外业务已占据我们总业务的近一半,并且正呈现快速增长的态势。

对于如何平衡技术本地化与标准化产品输出,邵天兰表示,梅卡曼德两者并重:本地化方面,我们有众多合作伙伴,如系统集成商和终端大客户,我们为他们提供培训和技术分享,让本地合作伙伴拥有很强的能力。同时,我们的产品仍以标准化形式输出,但会定期与全球客户沟通,收集意见建议,不断迭代产品。硬件产品大约一年半更新一次,软件产品则是半年左右更新一次。

梅卡曼德不是"中国的便宜货",而是具有全球领先竞争力的产品,我们能在很多主流市场上获得头部客户的认可,并且融入全球产业链。在每个细分市场,我们都有许多当地合作伙伴,与我们建立了良好的合作关系。

从"看得见"到"想得通"的未来之路

从德国留学经历到创业实践,从技术研发到市场落地,邵天兰和梅卡曼德的发展历程映射了中国机器视觉行业的成长轨迹。面对技术创新与市场应用之间的鸿沟,梅卡曼德选择专注于视觉这一机器人的关键感知能力,通过多模态大模型提升机器人的智能水平,打造适用于多种场景的基础设施产品。

在人工智能和大模型技术的推动下,智能机器人行业正迎来前所未有的发展机遇。跨学科的综合能力、对实际应用的关注以及耐心等待风口的到来,将是这个行业持续创新的关键所在。梅卡曼德的发展之路,也提供了一个从技术创新到市场落地的成功范例。

  • 邵天兰

    梅卡曼德(北京)机器人科技有限公司创始人兼CEO

    伴随全球人工智能技术的蓬勃发展,智能机器人迎来了一个新的爆发期。机器人视觉技术也从小众领域发展成为今天的产业创新主战场。梅卡曼德作为这一领域的领军企业,不仅完成了从动作自主(L2)到任务自主(L3)的技术进阶,还以领先的三维视觉技术和人工智能算法为智能机器人插上双翅。《机器视觉》杂志有幸邀请到梅卡曼德(北京)机器人科技有限公司创始人兼CEO邵天兰先生,探讨公司的创业历程、技术路线、未来发展战略以及他对行业未来的思考。
  • 创新者

    荣获CMVU 2024“机器视觉创新产品TOP10”企业CMVU会员企业

    当制造业数字化转型进入深水区,机器视觉技术正在经历一场前所未有的变革。从亚微米级精度的突破到AI大模型的赋能,从单一传感器到多模态融合,2024年机器视觉创新产品TOP10榜单揭示了一个清晰的产业趋势:中国机器视觉产业正在从"精度突破"向"智能跃迁"全面演进。
  • 唐磊

    光子(深圳)精密科技有限公司全球销售总监

    随着工业4.0浪潮的不断推进,智能制造已成为全球工业发展的新趋势。高端工业传感器和精密测量仪器成为了不可或缺的关键要素,然而,这一关键领域长期被国外品牌所主导。光子(深圳)精密科技有限公司就是在这样的背景下奋力崛起的,并不断引领行业创造新的辉煌。近日,《机器视觉》杂志特邀光子(深圳)精密科技有限公司全球销售总监唐磊,看他如何怀揣高端工业传感器和精密测量仪器在中国实现国产化替代的崇高使命,开启光子精密的故事。