胡郁机器人未来可“私人订制”但《机械姬》还不会来

C新智元推荐

【作者：屈婷韩淼】在中国科技会堂的咖啡厅里，科大讯飞轮值总裁、研究院院长胡郁坐到了我们的面前。略微褶皱的灰色棉麻西装，领口敞开两个纽扣的白色衬衫，驼色休闲皮鞋……这位在人工智能界颇有盛名的科学家，全身上下的打扮就是一个大写的“休闲”，很难想象他刚还在镁光灯的聚焦之下领取了业内的一个年度奖项。

他应该给自己开发一个能够提供场合着装建议的AI（人工智能），我们腹议着。

于是，话题就从人工智能谈起。近一个小时的时间里，胡郁畅谈了科大讯飞的机器人战略、讯飞超脑的最新进展和人工智能的发展和问题，还聊了谷歌神秘的Atlas，以及让人头皮发麻的电影《机械姬》。

行为主义、迭代优化、深度神经网络……虽然他态度诚恳的笑脸，多少化解了话题的复杂程度，但这些不断出现的术语也在提醒着一个事实：他和他所在的团队所专注的，不是浮夸的商业理念，而是实实在在的——科技。

机器人还在摸索阶段

Q:科大讯飞最新推出了完全自主研发的机器人小曼。我记得去年这个时候，您还对媒体说，机器人还没有达到大众产品的地步，科大讯飞目前不做机器人。一年时间，是什么让您和科大讯飞的想法发生了改变？

A:关于机器人，我觉得分为3个层面，第一个是基本能力，比如运动、机械和外形，第二个是智能化、自动化的能力，比如说玩具机器人、家庭服务机器人，第三个是专业服务机器人。

这三个层面没有高低、难易之分，只是要求不同。比如谷歌的Atlas，被人推倒了还能自己站起来，这是运动的能力。再比如专业机器人，关键的是它要能处理具体的业务，为客户提供服务。

真正意义上的机器人，就是要集合这三个层面的东西，其中核心是它的专业性。目前，科大讯飞自己研发的小曼身上，就集合了这三方面的内容。比如，它的运动层面是下面的机械底盘，保证它不会撞到人，这是第一个层面上的能力。

不过这不是我们的核心亮点。智能的人机交互，特别是在语音方面，这是我们的强项。在这点上，小曼可以不用麦克风跟人交流，实现“远场”对话；它还可以根据你说话的声音，确定你的位置，这是“定位”。再有，我们可以在它讲话的时候打断它，然后继续对话，做到“自然交互”。

在专业服务层面，我们其实之前已经在银行、通信运营商那里做过了，比如在安徽中国移动的语音服务中，我们的人工替代率已经达到50%，这个比例还在逐步上升。只不过这次换成了一个机器人的形象来提供服务。

这两个层面都是科大讯飞非常有特色的。怎么做到的？是通过我们最新的AIUI技术，就是人工智能时代的人机交互界面。

目前，科大讯飞在语言交流这一块已经是世界最先进的。除了“自然交互”的对话方式，小曼还能做到一部分情感的识别，不过细微的情感现在还分析不出来，但是像我们呼叫中心里面，有听到客户的那种情绪比较大的语气，小曼就会说出一些安抚的语言应对。

虽然现在我们有上述两方面的优势，但并不是说我们要做那种面向大众的机器人，我们现在做的其实还是原来业务的一个延伸。

在我们看来，小曼只是之前业务落地的一种方法。真正的机器人还处于研发阶段。虽然中国已经有几千家机器人公司，但大部分还在探索，并没有找到自己的定位。

机器人一定是个性化的

Q:那么，科大讯飞在机器人和人工智能上的战略定位是什么？是不是想做计算机行业的英特尔，为大家提供核心的芯片或者硬件？

A:我们首先是想把智能层面这个东西能够做好。因为所有的机器人，要想实现人机交互，必须有智能的这种特征。而这种特征是最难做的。至于像不像英特尔？有点那个意思，就是我们给你一块芯片或者一个硬件，或者更进一步的，我们还要把云和端的这两种能力联合在一起。在这一点上，给他们（机器人制造商）提供核心的能力。

我们机器人战略的核心，还是希望能够给机器人提供一个智能化的平台，或者说是“大脑”。因为机器人的最终形态太多了，但大脑只有一种。我们想给实体化的机器人一个最终解决方案，而且我们还会反过来，帮助这些机型、厂商去整合功能，提供一个销售服务的平台。比如，一个酒店可能需要会打扫房间，又能跟客户交流、会订房间的机器人，那是不是可以把其中几项功能整合在一起，开发一个综合性的酒店机器人？我们就可以提供这种整合，并且帮你找到销售渠道，把它卖过去。

我们现在就在尝试这种方式，比如营业厅机器人。我们的目标是让机器人变得更多元。在这一点上，我们又跟英特尔不同。因为我觉得机器人这个商品需求的本质就是多元，跟手机或者计算机这样的商品不一样，最后变成只有几家厂商的垄断。机器人在标准化之前，一定是寻求个性化解决的。

人工智能还没达到意识层面

Q:关于人工智能对人类的反噬，大家都会想到电影《机械姬》。电影里，机械姬欺骗善良的工程师爱上了自己，最终逃脱牢笼，融入了人类社会。你怎么看待这部电影里描述的人工智能？

A:我觉得机械姬这个东西，坦白说，在我能看到的这个将来还不会有。我们现在所有讨论工业界的人工智能并没有跟意识联系在一起。我们现在所有做出来的（机器人）只是在“智能”上跟人类比较接近，但并不代表它在意识上就跟人一样。也就是说，现在世界上最先进的人工智能，也就是止步于人类的“智能”方面。

而对机器人怎么去模仿人的意识，现在这方面的研究还很少。意识其实就包括情感。即便说我们的机器人现在可以模仿情感，但并不代表我们真正可以创造一个能产生情感的东西。现在我们所有的科学家都没有在机器人的意识这方面研究太多，而且或者是甚至都没有找到入口。

人工智能的“私人订制”

Q:那您觉得人工智能和人类之间的关系是什么呢？人工智能的终极样貌是什么？

A:人工智能并不是为了代替人类，而是为了给人类提供更好的服务技术。“服务”是什么意思呢？比如说语音转写系统，它可以把你的录音都转写成文字，但最终还是由人来决定这些文字会被处理成什么内容，比如这其中的要点是什么，想要表达什么。机器主要还是来处理语音转成文本这种简单工作。这个方面，像智能家居、家电包括可穿戴式设备等，都是这个目的，用技术提供服务。

那么从未来发展来看，我认为人工智能这个商品的本质就是多元，特别是进入家庭的人工智能产品。它更多是个性化，而不是标准化的。人工智能可能最终会有点像家具，或者说有点像玩具，没人希望家具、玩具都长得一样、发出一样的声音。最终进入到人类家庭、生活的人工智能，一定是个性化的，具有私人订制特点的。

人工智能重点在人所不能

Q:谈谈学习机器人吧，就是863项目中说要在2018年参加高考，还要考上一本的机器人。目前还有两年时间，你们进展的怎么样了？

A:到什么程度很难说。我们现在刚刚开发了一个叫做“六龄童”的系统，是一个相当于6岁小孩的阅读理解能力的系统。比如，一篇文章，中间有一个主要的词语把它去掉，让机器看完全文，能不能理解，能不能填出来。比如说前后文都在描述一只小鸭子捉鱼的故事，我们把“小鸭子”去掉，这里面应该填上小鸭子、还是小猪、小牛？你得读懂这篇文章，才能填上的。现在我们这个系统已经做得比小孩子要好。这就是它的逻辑推理能力。

高考机器人不只是储存知识和高考题型，还包括这种逻辑推理能力。另外一方面的进展是，反过来我们帮老师去批改作业。现在批改的效果已经非常好了。

Q:我也是学英语的，有些英语老师反映说，机器阅卷，批改语法和词语错误没问题，但是它们发现不了作文题跑题，你怎么看？

A:现在真的是可以。因为你想，主题是靠词语和词语构成的语句来确定的。机器可能根本不需要理解“主题”，机器能够做到什么呢？它能够比较你这篇文章和大量符合主题的文章之间的差异。机器可以通过词语出现的位置、频率，以及词语之间的逻辑关系，发现很多人类很难发现的关系。这就是大数据分析。而这正是机器所擅长的，而人类做不到的，或者说人做到要花很长的时间。

至于怎么从大数据中找到这种关系和差异，就需要建立一个模型和算法，让这个模型的结果和人的表现很接近，甚至在最终结果上超过人的表现。这就是机器的人工智能。

关于机器的人工智能一定要记住一句话：机器胜过人的地方，并不是用人的思维来做，而是用人类设计的、但人类做不到的方式去做。比如，让你数清楚一堆数据，你可能要花10年的时间，但机器一秒钟就算出来啦。

不担心人工智能威胁论

Q:业界比较认同的关于人工智能的路径，有三个层次：深度神经网络，大数据和迭代优化。后两者还比较好理解，前者就牵涉到算法，比较神秘，所谓的“深度神经网络”到底是什么呢？和人类的神经网络是一个意思吗？

A:它也叫“人工神经网络”，是一种非常抽象的概念。它是跟人的神经网络一种抽象的类比，工作原理是完全不一样的。虽然叫“人工神经网络”，但是离人的神经网络之间还是有很大差别，打双引号还是有很大差别。

例如说，“人工神经网络”之间传递的是数字和参数，但是人脑要复杂很多。“人工神经网络”主要体现的是一种交互和连接的复杂模型。现在它最大的特点是能够从非常大的数据量中获取有用的信息，并且把信息储存下来。但人类其实不是这样的，人类是有“举一反三”的学习能力，从小样本中进行学习。但机器现在还是不具备“举一反三”的学习能力的。

Q:那人工智能的核心是什么呢？就像您说的，机器和人脑的运行机制很不一样，但是机器终归还是按照人设计的规则在运行的呀！

A:你说的没错。机器的运行规则都是人类设计的，但是机器能做的事反而是人类做不出来的事情。人工智能的核心就是人类设计出一套路径，让机器用它擅长的办法执行出来，效果可能比人自己做还好。

这也回到了说我为什么不担心机器人威胁论的原因，因为人工智能的这个本质就决定了它不能够威胁人类。因为这些路径不是它想出来的，而是人想出来的。所以与其说AlphaGo战胜了李世石，不如说是设计出它的计算机学家战胜了李世石。

计算和数据储存能力是机器的强项，你要用算法把模型搭建出来，让机器用它擅长的办法去实现你想要的效果，这套路径的设计才是核心。人类思考跟人工智能的思考路径是不一样的，但最后在表现形式上，都是把问题给解决了。其实说白了，就是用不同的方向去解决问题，有些人做不来的东西，可以设计出路径让机器来做。

↙ 背景简介

胡郁：

中国科学技术大学信号与信息处理专业工学博士，教授级高工，国务院特殊津贴获得者，语音及语言信息处理国家工程实验室执行主任，中国科学技术大学兼职教授、博士生导师，科技部863人工智能重点项目首席专家。

1999年，胡郁作为创始人之一创立安徽科大讯飞信息科技股份有限公司（以下简称“科大讯飞”）。2009年6月至今，胡郁担任科大讯飞高级副总裁、讯飞研究院院长，总体牵头科大讯飞人工智能前瞻项目——讯飞超脑计划。其带领的科研团队是中国和世界智能语音和语言核心技术的顶尖团队之一。

（编辑：韩淼）

「招聘」

全职记者、编译和活动运营

欢迎实习生

以及人工智能翻译社志愿者

详细信息请进入公众号点击「招聘」

或发邮件至 jobs@aiera.com.cn

胡郁机器人未来可“私人订制”但《机械姬》还不会来

1300亿美元，买断AGI未来？OpenAI完成5千亿股改，奥特曼0股权

年终盘点全球顶尖人机交互技术，讯飞年度发布会不得不看（上篇）

NBC年度荐书2015年12本值得注意的科学技术书

新华网生物传感智能机器人“亮相“传媒超脑论坛”

诺奖级论文大脑GPS：寻路神经系统如何导航

相关文章