人工智能的未来是个演进的过程，前景十分广阔——张文生在机器人大讲堂做《AI信息计算》主题报告--机器视觉网

人工智能演绎出许多激动人心的故事，实际上出现了很多事，从1956年人工智能的萌芽时期复杂信息处理的Dartmouth会议，到现在我们人工智能又热起来，这个中间发生了很多事情。另外从马文·明斯基第一台神经网络计算机SNARC到深度开放域问答系统Watson，从Shannon、Samual最先设计的下棋程序到IBM深蓝国际象棋程序，再到谷歌AlphaGo的人机大战，历史上发生了哪些激动人心的故事？这样一些事情预示着什么？

张文生教授，国家重大专项“云计算与大数据”专家组成员

3月19日，在苏州 “机器人大讲堂•天使会姑苏创新创业天堂高峰论坛”上，张文生先生在题为《AI信息计算》的报告中，从四个方面对AI给出了很好的解读。这四个方面的内容是：

人工智能是人造的智能；人工智能的核心是什么；历次人机大战预示什么；人工智能的局限和展望。

‍

下面是张文生教授的分享：

人工智能实际上本身是作为研究、开发、模拟、延伸和拓展人的智能理论、方法、技术与应用系统。机器人实际上是人工智能一个展示，当然不是全部。人工智能我想讲的是人造的智能，主要是想把有智能的生物体特别是人的智能怎么样用机器来实现，最集中的可能还是在大脑上。我们说人工智能它的内涵和本质，从这个问题出发六十年了它做了很多事，但是哪些是我们应该关注的事情？这个可能我简单说一下。

实际上在人工智能这一块，有的人划分得很多，我觉得划分两块就可以了。第一块就是结构派，我们要研究一下产生智能的载体到底是怎么样的，通过研究载体我们怎么样做一种机器，让机器来模拟载体的结构那就是神经元的过程然后进行信息的智能处理，这就属于结构派。像现在我们用的很多神经元网络、深度学习等等都是这样一排。另外一派就是鸟飞派，也就是在模拟人脑的功能、智能功能。比如我们最早的，实际上是一个黑箱子过程，比较典型的就是飞机，我们要造飞机，鸟能飞起来是有翅膀来回动飞起来，我们的飞机不动、翅膀不动怎么样能飞起来？实际上在功能上的模拟，里面结构到底怎么处理的我们不关心，实际上这样两派。具体实现又有很多的相应技术。

人工智能和机器人相关，在我们人工智能领域里面有一个叫临场感人工智能，很像现在的增强现实。最早是做昆虫，美国相应的大学、欧洲大学做昆虫，希望把智能的东西在昆虫这样一个载体上来实现，进行感知、进行认知、进行控制这样一个过程。最具代表性的是1986年Brooks临场感的提出，主要是对环境的适应。另外一块就是工业机器人工业生产线，这个刚才赵老师和曲总都会讲，这里面都是大家我就尽量不讲，因为讲起来害怕讲错了。另外一块就是类人机器人和临场感机器人有突破，比如能够进行识别手势应答新加坡做的工作。比如我们中国科技大学做的这样一个佳佳的过程，你看两个人模仿她很像，但是大家会发现她的行为很少，打招呼、简单交互但是更多的东西还是做不到的。另外一个像美国做的一些大狗，然后仿照士兵的行为，能够站立、能够奔跑。包括足球机器人，做的也比较多，那么它内部大脑的控制和感知这一块是属于我们，包括发送一些指令这是人工智能要做的事情。

人类做人工智能追求什么？追求就是要把人类的大脑变成机器的大脑、机械的大脑或者是铁打的电子的大脑，最终核心就是我们这个大脑到底怎么样发挥作用，这是一个我们要关心的事情。这样一个事情我们说什么叫智能？这个智能实际上定义五花八门，它是认知和理解世界环境的能力，这是一个方面。另外我们说能够通过提出概念建立方案进行演绎、归纳、推理进行决策的能力反映在智能上。另外他的学习能力、自适应能力等等，总的来说人类的智能涉及到信息的描述以及信息处理复杂的过程。

那么复杂信息的处理到底是干什么的？实际上复杂信息的处理我们计算机是搞计算的，计算这个东西我们说信息的加工实际上就是一种计算。我们怎么样把数字的计算推到符号的计算？也就是说我们怎么样进行符号的加工、符号的表示、符号的推理以及学习？这个过程是由传统的计算到人造智能的过渡过程。复杂信息是什么信息呢？是非线性信息，所以处理起来就相当的麻烦。实际上人工智能本质是复杂信息处理，那么这样的过程大家起了个好名字，但是很多人把这个东西给忘掉了。我们说人工智能的任务实际上就是做这样一个过程，根据人类信息加工原理设计计算系统，使计算系统来完成更复杂处理的任务。另外一块就是用计算系统来研究人类的思维活动。

最早检测智能是图灵测试，实际上这个大家都知道，但是图灵测试最关键的一条是所有人都认为这个计算系统跟人区别不开，那么这样一个定义被媒体给偷换了。比如AlphaGo只战胜一两个冠军然后它认为就把人类给战胜了，包括深蓝很早下国际象棋把卡斯帕罗夫下败了就认为把人类下败了，这是概念的偷换，你把李世石下败了不一定能下过张世石不一定能下过另外一个人，你能说它会超越人类吗？这是另外一个。但是我们觉得这样一个偷换就激励人做的更好。人工智能你做的系统是不是就有智能？你得试，怎么试呢？你得找这样一个领域，包括人机大战，整个人机大战过程就是在试你的系统具不具有智能这样一个过程。

人工智能实际上发展得很快，他能够解代数方程、证明定理、学习和使用英语等等。在情感这一块，在这个过程中大家非常乐观，认为很快当时认为二十年就会怎么怎么样，但是事实上这个乐观一直没实现，一直没实现主要原因就是人们对他的估计不足，对这里面的估计很不足，所以造成了一连串的打击，对这个学科的打击。实际上是困难重重的，比如我们要证明连续函数的和仍然是连续函数，如果要是用计算机来证明这就要用到人工智能最重要的就是归结原理，要做这个东西要做十万步仍然做不出来结果，那么这么简单的东西它就做不了，证明这个问题让计算机做还是很复杂的。另外一块是下棋，很多人说世界计算冠军很多人都下过了，但是到现在都没有下过。包括翻译，自然语言翻译经常闹笑话，这里面的原因是什么呢？我们想造一个人造的系统来反映人类，在反映人类的时候你要处理的能力是怎么样？实际上我们人类如果从结构上看，我们的大脑有11-12次方的神经原它的连接大概是10的11-12次方，这么复杂的东西我们怎么样构造一个函数甚至一个系统能够实现它呢？现在大家冷静期来看，这是非常难的一个事情，甚至是很难解决的一个事情。

我们看一下象棋，国际象棋的比赛。走第一步有10的120次方可能，那么我们要用计算机算要算这么多年根本没法做，不管有法做没法做但是这是确定量的，它的理都是确定的。走了这一步往下一步算只是时间问题、只是存储问题，但是我仍然能够算出来，这个大家要注意。就是如果我能算出来的，用解析的方法算出来的我个人觉得不是大事，那就是计算量存储问题。另外一个是算不出来的，那是难事。在这样的情况下，大家为什么做的游戏还能战胜一些人呢？就是他不是全算，而是在这里面采用了一些技术，比如减枝技术、启发式信息技术在这里面做了工作。

2010年以后人工智能又火起来了，处理主要核心就是信息的有效利用，包括刚才讲的一些国家重点专项、重大专项里面也是复杂信息、复杂场景的感知、复杂场景的理解、复杂场景的判断和预测，主要是做这个问题，有效信息的利用。

下面我们就简单说一下，人工智能的核心是三个东西。表示问题、推理问题和搜索问题。实际上我们人类聪明不聪明？聪明的人表示问题非常简洁，由于你表示问题简洁、概括性强那么你推理非常快，如果你是乱麻糟的东西推理起来肯定很乱，最终你要得到结果肯定要在大脑里面搜索你已有的东西，这三个东西是人工智能的核心。你做来做去做人工智能就做这三个东西，不管怎么变都是在做它。在理论上讲，表示主要是知识的表示，而不是数据的表示，知识的表示就是在特定的函数下这个理论模型，如果这个理论模型跟真实模型一样那么这个问题就解决了，大量的情况下不一样。在工程上我们就要在特定结构下建模，这是表示。另外推理实际上我们是有意义的，也就是在给定逻辑公理，在公理下进行演绎。对于人工智能来说公理不仅仅有数学意思更重要的必须有实际意义，如果没有实际意义这个人工智能就没用了，就变成数学了。最后搜索所有的问题因为复杂信息是非线性的都是NP的，那么我们怎么样把非指数的变成线性的或者是近似线性的这样一个过程实际上就要用到难度曲线方法，一级启发式的方法。也就是说我不知道背景在哪，我可以问一下北京在北边，苏州在南边我就往北走，这样的话这个方向就是启发式信息给大家了。数学追求的是精确，我们追求的是次优。

人机大战预示着什么，到底背后是什么，看热闹大家都在看。人工智能是1956年提出来的，那么1957年有两个大佬就开始研究跳棋，让机器来玩跳棋，这当时还是很厉害的，还想到要做符号。做这样一个过程他们希望十年之内战胜国际象棋冠军，事实上60年了，仍然没战胜，很难。那么哪些能战胜呢？有些不能战胜，哪些能战胜呢？IBM是国际上非常有名的公司，他选了一个能战胜的领域来做，就是在国际象棋冠军里面的深蓝机器人。这样一个机器人经过了1985年、1996年、1997年到2011年这样一个演变，这样一个演变过程在1985年的时候卡斯帕罗夫一个人下32台电脑，电脑仍然下不过他，这里头当时计算、搜索、推理能力很弱，当然当时的算法都有，当时的算法数学的东西都有，但是由于机器跟不上所以他后来就考虑了其他的事情。到了1996年，他比赛的时候能够实现比赛结果4：2，这时候卡斯帕罗夫就感觉到有压力了。在1996年2月10日-17日之间他们比赛的时候出现了这样一个结果，就是出现了深蓝的战绩胜、和、和其他都败。这样一个过程创造了计算机首次在规定时限的条件下赢下了一名国际象棋冠军的记录，这样一个记录之后经过了14个月的攻关主要是对芯片加速、对软件改进然后做启发式评估函数这样一个过程，然后对他的复盘、检测以及全新的评价函数做减枝，大家能看到AlphaGo做的东西只不过算的复杂一点，但是计算机复杂了所以我后面在讲做的主要是减枝。做了这样14个月，最终终于战败了，后来卡斯帕罗夫说我再跟你下我不信我下不过你，结果人家不下了，给你二百美元就不下了，因为再下有可能下败。IBM为什么花三千多万搞这个事呢？重要的是由于IBM想创造一个先机，说我的计算机不单硬件好，我的软件也好，那你要买你就买我的，我软件也好、硬件也好，你不买我的买谁的呢？算是做广告。

IBM卖了十几年发现又有竞争对手了，当时光下棋不行，大家希望追求的是能够理解自然语言，能够对自然语言进行回答。他就选了另外一个不下棋了，选择了一个类似于中国的《一战到底》、《开心辞典》，我们竞争我们选，谁选上了谁回答，回答了之后赢钱这样一个涉及到历史、文学、艺术、科技、体育等等五花八门的问答抢答，上一次选的卡斯帕罗夫最牛的世界冠军，这一次他选了两个，一个是美国的获奖金最多的，从2002年到2005年得了330万美元的这位老兄，然后又选了一个永远不败记录最长的连续胜了74场的这样一个人，他用这两个人我的机器跟他们答，结果最后经过比赛沃森也赢了。这个赢的很艰难，要快速理解问题要识别人类的语言而且还要分析微妙的讽刺、联想这样微妙语言的意思，这是很难的。另外还要模仿人，模仿人的搞笑另外与互联网断开自己想这样一个过程，这是他的问题。

另外他的团队大家看涉及很广，很多人都对他进行支持。这个能做，为什么在1997年、1998年、1999年不做呢？大家看这里面用了90台服务器，然后处理芯片的个数以及处理的速度峰值每秒八十万亿次，原来根本做不到。另外一个它的存储容量15T，能存这么多的东西在里面，所以脱开以后仍然能够工作，而且比人强，这个是由于技术的进步所以信息技术的进步提供了工具。另外一个在技术上光技术硬件进步不行还有软件，这里面他建立了一个新的体系，就是深度开放域的问答系统，这是很难的东西。这个难的东西，现在掌握和应用这样一个框架的公司不多，主要是有一百多套核心的算法有域网络的技术，另外可以在三秒之内把问题给解析了，这个很快，比人快，然后解析了以后马上就选择，花了这么多钱做了这么多事，然后结果非常好。

我们对比深蓝和沃森，他们两个计算能力沃森是深蓝的1000倍，解决的问题也不一样。深蓝下棋包括AlphaGo做的都是确定型的，就是只管算就行了。而沃森做的是模糊型的，我们人类主要是模糊型的信息，这是一个质的跳跃而不是量的增加，这是人工智能最重要的。不同的里程碑，深蓝解决的是数学问题，而沃森解决的是常识问题，这是人类最核心的东西。

由于战胜了他IBM现在火了，机器根本不用宣传大家都在买。我告诉你，全世界的银行用的几乎全是IBM的机器，你想想那得多大，金融业几乎都用他的，中国也是用他的。他应用很广泛，但是现在只做三个领域，第一是金融领域，第二是政府管理，第三是医疗健康领域，其他的不做，其他的愿意做别人做去。另外真正实现了计算机的感知能力重大的突破，使得IT产业从“人围绕计算机转”变成“计算机围绕人转”的进步，这样一个过程。另外让人基本上从听不懂人的感受到听懂人的感受，这是非常难的一个过程。我为什么不讲AlphaGo呢？它是一个确定问题。我个人觉得就是深蓝上的增量增加，它用的东西就是计算能力强了，创新体现在是深蓝仍然设计评估的函数，而AlphaGo是靠学习来做评价函数，这是两个本质不一样的，这是机器里面学习的本质不一样，这是有进步的，最后套在Deep Learning上这不是一个大的问题。

最后我讲一下人工智能的局限与展望，人工智能的局限实际上就在认知领域我们有局限，对人类大脑的结构和功能我们远远不了解。第二个就是智能物化的方法和途径，我们在结构派、鸟飞派上我们也有局限。第三个是数学，数学上的局限在于数学解决的是结构不变的东西，而人工智能解决的是结构大量开放域，开放域这个东西就容易发散。另外数据解决了封闭系统，而人类解决的是开放系统，这两个系统完全不一样。数学解决的是线性问题而人工智能解决的是非线性问题，数学追求收敛，人类往往是发散思维。另外鼠雀解决的是精确解，而人工智能解决的是近似解，这是完全不一样的。有人说把数学扔了用其他的，门都没有，还得用。还有计算模型、演绎理论以及硬件软件实现上也有局限。人工智能的未来实际上前景还是很广阔的，我们尽管难但是我们还在进步、还在往前做，它是一个演进的过程，包括现在两会开了以后把人工智能写进五个领域之一，这实际上对我们做这个行当的人是一个激励、是一个利好。但是由于媒体的宣传，我个人觉得对做这个行当的人很不利，因为媒体把大家胃口提得很高，实际上能做的并不这么高，大家都容易对我们失望，一失望就不会支持经费了，就很难了就不好干了，谢谢各位领导。本来我还想讲一下我们自动化研究所的工作，由于时间的关系这个广告就不做了。