新智元笔记:反Eliza效应,人工智能的新概念

我: 人工智能里面有一个著名的现象,叫 Eliza 效应,说的是人可以过度解读机器的结果,读出原来不具有的意义。

其实,人的所谓智能也有类似的一个效应,就是很多时候我们把人类的能力神话,忽视了其中 90% 以上的成分其实很水,包括押韵、对仗、格律、词序等,这些本来以为是很神的能力,其实都可以分解,可以形式化,可以模仿得比人还强。

人的智能其实经不起分解,分解几次以后就发现,人的神性或灵感不过 1%,99% 是水货。糅合在一起就容易被我们膜拜为大师或天才。人工智能的目标从来就不是对准那 1%,既不可能,也无必要,总得给人类留点面子。

拿对联来说,属于 1% 的绝妙好联还有:因荷而得藕 (因何而得偶),有杏不须梅 (有幸不须媒)。老友还给了一个“绝对”:莲子心中苦(怜子心中苦), 梨儿腹内酸(离儿腹内酸)。这类 “机巧”可遇不可求,没办法也无必要去 model 它。没有可重复性的东西不具有AI价值。证明“绝妙好联”不具有可重复性很简单,对于这些对联,基本可以肯定,没有哪个大师还可以找到第二个下联,可以对得同样“机巧”。而机器要做的事情不是唯一,而是一组。即便这组结果可以排序,second best 与首选通常也不会一落千丈。

宋: @wei 那倒不一定。大师找不到,机器也许能找到。你说的荷杏联,如果有一定的语音知识、百科知识,也许能湊出来。

我: 机器搜索空间大,撞大运的概率会高一筹?不好说。难的不在某一个层面的形式化。

宋: 字形的困难更大一些。

我: 难的是,但不同层面相交的时候,人偶然可以“巧遇”一个最佳组合拿出来说事儿。但机器模型化的时候为了总体效应所给的不同权重,往往在结果中需要排除那种“巧遇”。在所有的路径中,虽然理论上可以把尽可能多的选项输出来,但实际上对于机助系统总要卡一个 threshold,而那些拿出来说事的绝妙好联基本上就淹没在 threshold 下面的某个角落了。不能为了它万分之一的可能性,把一个工具弄得让人受不了,太多的选项人不愿意用或无法穷尽。

宋: 不过这些都是在可以形式化、可以演绎的范围内,困难的只是计算复杂度。真正麻烦的是归纳。现在说的机器学习,都是演绎。

我:比起演绎,归纳不好形式化。

ZhouMing:

双关更难

我: 你那是把已知的 “绝对” 词典化记住了,对未知的 “绝对” 还是留给人玩去吧,不能剥夺人的自我欣赏和惊喜。

准备写篇博文,提出一个新概念 “反Eliza效应”,谈的是人类自我神话的习惯与本能。人类的自我神话表现在读出原来没有的意义和无限夸大人类的灵性。同样一件作品,如果告诉你是机器做的,人会本能地贬低它,以维护万物之灵的自尊或不屑与机器为伍的傲慢。而如果这个作品被相信为文物,便会引来无数解读和赞赏,挖掘出本身完全不具有的各种意义来。文学评论中的一多半都有这种效应的反映。对抽象派的艺术、行为主义的艺术,这类效应被合理化了,读出作品不具有的意义,每个人读出不同的意义,被认为是作品本来的价值。甚至被认为是学养和素质的必需。指出皇帝没穿新衣,作品没有意义,不仅需要勇气,而且也破除不了这个魔咒,因为美学的理论在抽象派中已经无需新衣的装饰。

反Eliza效应是神秘主义的表征,而神秘主义是人类的一种本性。先喷这么多,这是一个巨大的题目,有的可挖。这个效应是一个很好的概念,将来有望成为AI领域的基本概念之一。

不是要否定人类的至高无上,也不是要否定人类的 1% 的灵性和天才。只有最愚蠢的人才会如此自我否定,糟蹋人类。但是,无论科学还是工程,讲的都是丁是丁卯是卯。我们在 AI 的道路上和实践中,第一件要做的事儿就是剥离。把笼统的 “智能” 像外科医生一样用手术刀层层解剖,把 99% 的物质与 1% 的灵性剥离开来,然后我们才会让机器去 AI 99%,在人类日常智能活动中杜绝和取代平庸,并自觉地保持与 1% 的距离及其对真正“人智”的尊崇。

换一个角度,凡是机器可以实现的AI本质上都是水货。很明显,随着时间的推移,越来越多的水货会从我们认为的万物之灵的智能里面剥离出来,一定会有剩下的,永远无法剥离的部分,那就是真实“人智”(同义词是,灵性、灵感、灵魂、悟性、神明)。

宋: 机器智能与人的智能的区别在于,机器只能在有限封闭的范围内进行搜索,这种搜索本质上是演绎。人的智能是归纳,归纳中又使用连想、类比,所涉及的范围是没有边界的,无法形式化。立委说的剥离,就是人找到了解决问题的套路,告诉了机器。至于人没找到套路的,则还属于尚未剥离的部分。但是如何找套路,需要人的归纳,机器没办法。学数学据说是要训练演绎能力,我觉得更重要的培养(不是训练,而是悟)归纳能力,如何在没有套路可循的情况下引入新的概念、新的引理,最终导致解决问题。从这个意义上说,让机器去解高考题,对于人脑智能的研究不会有本质的帮助,因为这个任务的实质是让人找出解答高考题的各种套路告诉机器。

我: 是啊,人找套路或算法的过程需要调用人的“高级智能”,也许这才是 1%。

宋: 人有可能找出各种复杂问题的求解套路,但是找不出“悟”的套路。

我: 但是,套路只要一个个去找,就会像蚕吃桑叶一样,一点点扩大形式化的疆域。疆域的每一步进步,就是智能的一层剥离。也就意味着以前认为的“智能”不再属于人独有的。所以说,如果人是 1%的神 和 99%机器的 杂交物,总有一天会让机器取代人的 99% 知识(智能)活动。

宋: 剥来剥去,还是有极限,“悟”是剥不动的。

雷: 有魂才有悟。

雷: 智能之上。

我: 剥不动就承认其边界,归到 1% 的神手里,供起来。

现在的困难是,每一个具体的所谓 “智能” 任务,大多数还是一坨泥巴,没有被剥离。只有在剥离工作积攒得越来越多以后,再回头看那不可剥离的 1%,才能最后确定到底什么是神圣不可侵犯不可模拟的灵魂或神明。在此之前,我们往往在神话自己的能力。把根本不属于属灵的悟性,归到人类独有的智能里面。看一下历史。

在前电脑时代,计算能力被普遍认为是人的了不起的智能。记忆能力也是不得了的能力。一个人如果有超常的心算能力或过人的记忆能力,很容易成为人中杰,作为高智能的天才被人尊崇膜拜。

计算器和电脑出现以后,打破的第一个神话就是计算。现在就是最反智的人,也把计算排除出智能的外延了。电脑在计算上完胜人,是如此理所当然,没有人因此把机器看成是智能机。

计算之外是记忆。说记忆当然不仅仅是存储能力,还有配套的检索能力。很多的智能在剥离以后,就变成一个 customized 的检索算法加上存贮。

譬如自然语言理解。语言理解是公认的人类关键智能。幸好,我一辈子就做这个活儿,有一点发言权。为了避免无谓的口水战,咱们先把语言理解缩小成语言的结构分析 (parsing)。这种缩小是合理的,因为至少 parsing 被认为是语言理解中的核心的环节,也一关被认为是人的语言能力的一个重要的部分。可以负责地告诉大家,parsing 这种智能里面,最多有 1% 的东西暂时不好剥离,99% 的 parsing 能力不过是语言学算法 + 语言知识库(存贮)。 我现在的 parsers,无论英文中文,就接近或达到这个水平了。特别是开发更久一点的英语 parser,我随机从网上 copy 英语句子,parse 出来的结果,50% 以上的时候,超出了我的预期或我的能力。不到 50% 的时候显示出还有些许的改进余地。99% 的语言现象能结构化。结构化是一个可以测量的目标。

D: parsing只是结构的分析,或者说一种语言学上的结构定义和分析,只是一种识别或者说系列标注方法,这种结构机器无法理解,而理解更多是从语义上来说的,需要支持推理,支持新知识的产生。

我: “这种结构机器无法理解”,很误导。无法理解为什么要做,难道 parsing 做了是就是为了好玩?根本上还是为了机器的使用啊。

理解有不同的定义,在NLP应用的真实世界,理解的落脚点是 grounding,是与特定应用的某个目标接上。接上了就是理解了,接不上就不能认为是理解了,这是自然语言理解的真义所在。针对这个,parsing 提供了理解的坚实基础。

现实地做法是,把理解留到产品语用的层面去定义,因为那是NLU的终极目的,定义不会扯皮。在语用层面定义的理解,可以实现为parsing结构化以后的应用层面的开发。实践表明,这个应用层开发的理解对接是短期可以完成的。也就是说,NLU (自然语言理解)已经到了这个地步,只要产品对理解有一个明确无误的要求,在靠谱 parsing 的支持,一般没有做不成的。包括情感分析,这是我们过去五年的主打。也是 NLU 中几乎是最难的部分了。

从 NLU 或 deep parser 回到形而上,我想说的是,我们原先以为的人的智能,经不起剥离。每次剥离的实践,都让我们一次次有跌破眼镜的体验。很多智能有一种天然的【反Eliza效应】, 不仅是对普罗百姓,而且对我们这些业内人士也是如此。在你没有钻进去之前,你会觉得这个智能很神妙。但你剥离了大部出来以后,开始算法化,形式化,知识存贮化以后,妈呀,原来就是这么个机械玩意儿呀,怎么以前那么神秘它呢?只能说,神秘主义是人类的本性之一。

【相关】