人工智能概论（二）--图灵检验与人工智能

物理科学探疑-网友天空-系统观点-王海滨-人工智能概论（二）——图灵检验与人工智能
wytk-11.gif (489 字节)

人工智能概论（二）
——图灵检验与人工智能

（王海斌吉林 E-mail: h.b.wang@126.com )

摘要：图灵检验作为判别一台机器是否具有思维的一个标准，因相关文献的广泛提及而被熟知。我们这里就试图从构建一台能够通过图灵检验的机器做起，看看它相对于图灵检验的要求倒底还欠缺些什么，以及如何构建这个系统。——那么它最终能够顺利通过图灵检验吗？

关键词：图灵检验专家系统反馈人工智能

1引言

人工智能是研究和模拟人类某些智能行为的基本理论、方法和技术，是计算机科学的一个分支，且逐渐成为一个独立的分支，无论在理论和实践上都已自成一个系统。它企图了解智能的实质，并生产出一种能以人类智能相似的方式做出反应的智能机器。

人唯一了解的是人本身的智能，但我们对我们自身智能的理解都非常有限，对构成智能的必要元素也了解有限，因此人工智能往往涉及对人的智能本身的研究，总的来说，就是让计算机能够象人一样思考，如果希望做出一台能够思考的机器，那就必须知道什么是思考。

2 图灵检验

怎样才能知道一台机器是否真的会思考呢？这显然是一个困难。对此，阿伦?图灵提出了一个标准，说某一台电脑实际上在思考，那么它的行为应与一个人在思考时的行为不能区分。具体的检验方法是，令一个人与一台电脑同时置于一位质问者的视线之外，质问者以向他们提问题的方式来测试并确认哪一边为人体，哪一边为电脑——该检验方法的原理是，在电脑方面的任何真正理解上的缺乏都会因为不断地询问而显露出来——假如在经过了一系列的询问之后，该质问者不能正确地指明真正的电脑，则我们就说它（电脑）的确在思考。

尽管对于图灵检验方法目前也还存有争议，但在没有其他更好的检测方法出现之前，图灵检验无疑是最有效、最简捷的方法之一。而事实上能够真正通过图灵检验的机器或机器人至今尚未出现，可见想要通过该测试也并非易事。

3 专家系统与机器翻译

3.1专家系统

专家系统是人工智能应用最重要也是最活跃的一个领域，其一般由人机交互界面、知识库、推理机、解释器、综合数据库、知识获取等6个部分组成。推理器提供解释问题的思维方式，模拟人的思维过程。知识获取是专家系统知识库是否优越的关键，也是专家系统说设计的“瓶颈”问题，通过知识获取，可以扩充和修改知识库中的内容，也可以实现自学习功能。

存放知识和运用知识进行问题求解是专家系统的两个最基本的功能，被广泛应用在工程、科学、医药、军事、商业等方面，而且成果相当丰硕。专家系统的知识库与推理机的分离，可以使系统不断接纳新的知识，从而确保系统内知识不断增长以满足其更广泛地适用性。

由于专家系统掌握有某一领域的专业知识，甚至在某些应用领域，还超过人类专家的智能与判断。因此从某一专业的角度看，专家系统是最有可能通过图灵检验的应用程序。

但事实却并非如此。由于专家系统的知识获取是由领域专家和知识工程师通过专门的软件工具或编程实现的，规则的建立则是人为的工作和机器自主行为的共同结果。只有样本的捕捉才是机器的自主行为。这其中不难看出，设计者仍然处于整个架构的最顶层（如图4所示），是整个计算机的灵魂。

所以专家系统反应的仍然是程序员的逻辑方式，其自身缺乏自主性，不能够随机应变。

rgzhn01.gif (2649 字节)
图四

3.2机器翻译与自然语言理解

以人类的智慧创造出堪比人类大脑相平行的机器脑，对于人类来说是一个极具诱惑力的领域，人类为了实现这一梦想已经奋斗了近半个世纪。而从一个语言研究者的角度来看，要让机器与人之间自由交流也是相当困难的，甚至可以说是一个永无答案的问题。人类的语言，以及人类的智能是如此的复杂，以至于我们现在的研究可能还未触及其导向本质的外沿部分的边沿。

机器翻译是人工智能的重要分支和最先应用的领域，自然语言理解比机器翻译的过程还略微复杂，它的主要目的是实现人机对话。

总的来看，机译系统可划分为基于规则和基于语料库两大类，其各自的实现方式又有很多种，其中又以基于统计的方法更具优越性，译文质量也相对高些。统计学方法的译文质量主要取决于语料库的规模与质量，许多这类机译系统的语料库都具有自增长功能。

Google在线翻译就是基于统计的机器翻译方法，其基本原理是通过搜索大量的双语网页内容，将其作为语料库然后由计算机选取最常用的词与词的对应关系，给出翻译结果。不可否认google的技术是先进的，但也经常闹出各种翻译笑话。其翻译的准确性直接取决于语料的多少，而翻译的质量高低主要取决于概率模型的好坏和语料库的覆盖能力。基于统计的方法虽然不依赖于大量知识，避开了语言理解的诸多难题，但语料的选择和处理工程量巨大。

基于统计的机器翻译系统实现上也更符合人类学习的特点。如果你认为人类对于语言的学习过程是从学习规则开始的那就错了，我们最初在学习语言时实际上并不会刻意地去记住那些规则，而是以统计的原则来进行语言的模仿练习的，而逻辑上可能是不合语法的。而那些所谓的规则其实也都是人们业已形成的习惯和经验主义的反应。

机器翻译其实也是人工智能领域中实现起来最难的一个科目。语言学家周海中在论文《机译五十年》中指出，机译要想达到“信、达、雅”的程度是不可能的。

4 强人工智能

先来看两个例子，“白蚁可以造出不可思议的构造，以至于我们会以为它们一定是按照图纸造的，而实际上，这是关于什么时候加泥和什么时候去掉泥的简单规则在每只白蚁个体上的物化。”

再比如，“想象你正在观察一个装有轮子的小机器人顺着墙走。它不会撞到墙上或者离墙太远，而是沿着墙的走向蜿蜒而行，在墙角处会转弯。怎样实现呢？它可以存有一个沿墙

---------------------------------------------------
源自百度百科。
同上。
引自《人的意识》苏珊?布莱克摩尔著.耿海燕李奇等译.中国轻工业出版社（174页）。
----------------------------------------------------

走的聪明的程序，为它提供一个墙的形状的内在表征，并且为每种可能事件设计了应对方案。实际上，根本不需要这么麻烦。只要它始终有一个向右转的倾向，再在右边加一个距离传感器，使它离墙太近的时候可以轻微地转向左边就可以了。在这两种倾向性的平衡过程当中，沿墙走这个行为就出现了。”

这两个例子同时说明了一个问题，“智能行为可以产生于简单系统。” 某些简单机械可以产生在我看来可能是有“意识”的行为。

再来看另一组例子，“1979年，人工智能的缔造者之一John McCarthy声称，即使像自动控温器那样的简单机器也可以说是有信念的。John Searle马上诘问：‘John，你的自动控温器有什么样的信念啊？’McCarthy回答：‘我的自动控温器有三个信念。我的控温器相信这里太热了，这里太冷了和这里的温度刚刚好（Searle，1987：211）。’”
“自动控温器是个很好的选择，虽然它极其简单，但它满足了一个自动行为体所必需的两点要求：它感知环境，并依据环境的改变反作用于环境。自动控温器并不是一种抽象概念或者一个非实体化的计算过程。它通过它的行为扎根于现实世界——虽然它们很简单。”

尽管自动控温器不可能是真正地具有这些信念——通常我们说某一个体具有某种信念，是因为我们已经首先认定它是意识的。但是它的确具备了意识活动的一些特征，它说明要么意识是一种自发属性；要么意识是像“信念”一样极其简单的东西。

强人工智能观点认为不仅可以制造出真正能推理和解决问题的智能机器，并且，这样的机器将是有知觉和自我意识的。与之相反，弱人工智能认为仅仅可以使机器看起来像是智能的，而不可能使其真正具有自主意识。目前主流科研都集中于弱人工智能上，强人工智能由于遭遇了瓶颈，目前处于停滞状态。

但有的哲学家认为如果弱人工智能是可实现的，那么强人工智能也是可实现的。比如Simon Blackburn在其哲学入门教材Think里说道，一个人的看起来是“智能”的行动并不能真正说明这个人就真的是智能的。我永远不可能知道另一个人是否真的像我一样是智能的，说她他仅仅是看起来是智能的。基于这个论点，既然弱人工智能认为可以令机器看起来像是智能的，那就不能完全否定这机器是真的有智能的。Blackburn认为这是一个主观认定的问题。需要指出的是，弱人工智能并非和强人工智能完全对立，也就是说即使强人工智能是可能的，弱人工智能仍然是有意义的。

5 具有反馈功能的专家系统

Norbert Wiener是最早研究反馈理论的学者之一。最熟悉的反馈控制的例子是自动调温器。它将收集到房间温度与希望的温度比较，并做出反应将加热器开大或关小，从而控制环境温度。这项对反馈回路的研究重要性在于Wiener从理论上指出，所有的智能活动都是反馈机制的结果。而反馈机制是有可能用机器模拟的。

----------------------------------
同上。
同上。
以上两段引自《人的意识》196页。
源自百度百科。
源自百度百科。
------------------------------------

图5所展示的是具有自我反馈功能的计算机系统结构图，图中的“自观察系统”好比是核心CPU的“内眼”，其作用是对数据处理过程本身（即所谓的“思维”）进行“观察 ”，它与电子眼在功能上类似，是属于并行的系统。所不同的是前者是属于内部感观，主要用来收集并反射CPU内部的（“思维”）信息；后者是属于外部感观，是用于接收外界信息的。另外，自观察系统所提供的一定要是连续反馈，这样才能够有效地保证其“思维”的过程也是连续的。

rgzhn02.gif (4494 字节)

但事实上在人脑中并不存在这样一个“自观察系统”，因为人的记忆本身就已具有自动反馈功能，这里之所以要把“自观察系统”也作为一个单独的组织从记忆中分离出来，其实是为了看上去更为直观，也便于理解。在图5中已将自观察系统与内存（即短时记忆）特别用阴影标注出来，表示它们实际应为一个整体。其中的专家系统则与人体反射系统的功能类似，是用来处理主体CPU所不能及的其他方面的问题的——人体的反射系统实际上也相当于一个大型的综合性专家系统。其内部的规则与专家系统的知识库类似，也多是以“IF…THEN…”的形式出现的。

由于意识本质上也是一种反馈过程。所以说它是充分模拟了人脑的结构特征。A区就相当于人的大脑功能，B区则相当于人体反射系统功能。

rgzhn03.gif (3557 字节)

如果看一看图6的脑结构流程图更是一目了然，其中A区为大脑，是进行意识活动的场所。B区是由小脑及脑间组织（脑干等）构成的人体反射系统，负责意识以外的生命活动及一切生理机能。

为了使我们对于A区与B区的功能差异有进一步认识，我们将就人体的大脑与反射系统的功能及其各自的特点做一番总结与比较。如表1所示，

rgzhn04.gif (4038 字节)
表一

意识与反射系统分别对应于逻辑层与物理层。逻辑层是以感觉等为基础的层面。对于逻辑层发生的事件，我们可以不必再从物理层找原因，就能给出合理的解释。就像是我们要解释计算机的软件流程时不需要说明硬件是怎样工作的一样——尽管硬件是软件存在的基础。

--------------------------------------
观察即反馈，是将“数据的处理过程”本身转译为（如果需要转译的话）可被CPU识别的信息而重新读取。读取即感知，如同其他感观对信息的识别一样。
--------------------------------------

物理层则是为逻辑层提供了一种物理支持，同时也调节逻辑层以外的其他生理功能。

其次，意识与反射系统彼此的行为模式不同，一个是靠记忆（经验）来决策，另一个则是依照算法（程序）来决策。这也使得它们各自扮演着不同的角色，反射系统主要负责非意识区域及掌控习惯性行为。并且它在意识形成之前起着不可替代的作用，随着意识的逐步显现，意识便逐渐占据了主导地位。

由于意识要参照记忆来决策，它依靠的是记忆的积累，因此它的可塑性更强，也更显示出随意性和个性化。意识的另一个主要特点是善于思考和解决问题，相较而言，反射系统则几乎从不思考。

有一个例子可以很好的证明这一点，比如你在吃过晚饭后就到书房里去看书，正看得兴致时，妻子急声催促你去刷碗，你忙应了一声便一边端着书，一边朝厨房走去，当快走到厨房时，却止住了脚步，转而对妻子说“唉？不对呀！不是讲好了一人一天吗？昨天就是我刷的，今天该你了！”

从书房到厨房这段路对于你来说再熟悉不过了，每天你都是从这里走到厨房去刷碗做饭，所以在你从书房走向厨房口的那段时间里，是一种下意识的反射行为（即是一种习惯性行为），当你走到了厨房口时，才转过神来（这时你的意识参与了进来），于是你才说出了上面的话。由此我们得出，反射系统做任何事，都不考虑原因，反而是意识总爱“斤斤计较”，凡事都要问个“为什么”。

反射系统的另一个最主要特点就是“一心多用”。由于意识的工作效率很低，每时只能专注于一两件事情（正所谓“一心不可二用”），相反，反射系统却可以同时处理许多事情。

据研究显示，人的神经中枢（即脑间组织）每秒钟可以接收大约50万至300万件信息，而意识仅可以处理其中的16件（其余均由反射系统处理）。因此绝大多数信息实际上并未被意识所关注。比如，你是否听到了时钟的嘀嗒声，窗外的鸟叫声，以及远处汽车的喇叭声？我敢断言，在我提醒你之前，这些声音你并未全都注意到。但意识以外的其他脑组织（即反射系统）却可以查觉它们的存在，并对其实施过滤。所以你不必担心其他方面会有什么重要的信息不被你知道，因为反射系统会将它们及时地反馈给你。如你此刻正专注于自己的工作，而对旁边其他人的谈话没有在意，可是在其中的某个人提到你的名字时（或者他只是在讲一个与你同名的人的故事），你会立即做出反应，同时你的注意力也跟着转移到这件事上来。

反射系统的“一心多用”还表现在对你身体各器官的控制上，包括生理机能的调节和对肌肉的控制等。

6 自主能力的实现

引入学习和进化机制并不是智能呈现的唯一法宝，除此还应当注重机器的自主能力和创造性思维的塑造与提升。为此不仅要改变所有算法预先植入的做法，同时也要变强制性行为为引导行为——尤其是对智力有影响的相关要素或技能。

以人类为例，这种引导式行为其实是贯穿于从感知到采取行动一系列过程的始终的，那么它又是如何实现的呢？

1、感觉

感觉是生物体接收与传递外界信息（也包括来自自身内部的某些感觉信息）的一个渠道。绝大多数感觉只是一种中性的信息，但也有一些感觉是带有趋势（即方向性）的，例如表示回避或迎合趋势的“苦乐剂”，就是由辅助程序来设定的，例如：

---------------------------------------
由于你已经习惯了在别人叫你的名字时主动应答，因而是一种条件反射。
在我们还没有将人的感觉形成原理完全弄清之前，以下的方法暂且作为模仿感觉的一种简单而有效的途径。或者说，我们没有必要使机器人具有同人完全一致的感觉——这至少在目前是无法实现的。
---------------------------------------

某程序规定，将“疼痛”的感觉按其强度划分为从“0”到“10”十个区间，数值减小表明强度减弱，强度10所在的方向为强度正方向，且10为最高强度，并使机器人总是避免最大值而趋向最小值，这就是一种“趋势” 。这种趋势的作用在于，如果某一行为（外界刺激）使得其苦乐剂的值在逐渐增大，那么它（指趋势）就会转化为一种阻力，迫使反射系统回避这一趋势（施行有助于减小趋势的操作），极端情况下则可能直接引发某种条件反射。而假如某一种行为（如刺激消失）使得这一数值在逐渐变小，那么它将促使反射系统持续并强化这一趋势或操作，从而对其形成一种助力，并且这种阻力或者助力是随着苦乐值的逐渐增大（减小）而减小（增大）的。

事实上感觉与趋势总是“捆绑”在一起的。由于感觉本身只是一种中性的信息，这使得它自己难以独立承担起指向性和目的性的作用。趋势是感觉在物理层的逻辑支持，感觉与趋势可被理解为同一事物在两个不同层面的表现形式。感觉是作为趋势的表观特征出现的，因此它也就具有了趋势的这两个特征：一是方向性。例如，我们总是使自己尽量逃避饥饿与痛苦，而相反却总是向往温馨、快乐的感觉，这就是感觉的方向性。二是目的性。比如我们之所以要吃饭，是因为自己感觉到饿了。所以我们总是把某种感觉的产生或消失，直接说成是我们行动的目的或原因。这也是我们总爱说“人是被欲望趋使”的原因。

2、动机

动机的作用是提供一种动的趋势，就像人饿了就想找东西吃一样，这其实就是一种行为动机。是具有方向性或指向性的特定行为。

但在最开始时，这些行为是由反射系统来控制并完成的，而人只是在被动地执行这些指令。

实际上在你的生命之初，充其量也不过是一部被设计得很好的机器——“饿了要吃东西”，“困了就要睡觉”，所有这些都是一种反射行为，一种本能的反应，并没有意识的参与（意识此时尚在形成中，其顶多只是一个旁观者）。

只是后来随着意识及意识逻辑的逐渐形成，反射系统才不再“一统天下”，它的许多功能都受到了意识的限制——事实上是被意识取代，而它也只在非意识领域或非意识关注的情况下才起作用——于是那些受到限制的行为（即最初的样本）就发展成了现在的动机。

动机已不在具有强制性了。比如现在的你仍旧是感觉到饿时就想吃东西，困了便想睡觉（这已经形成了条件反射），但你可能并不会马上就这样做，或许是因为还有许多其他的工作要做而没有做完，或者也因为还不到吃饭或睡觉的时间，意识不允许你为所欲为，他总是先捡最重要的工作来做。所以当你有了上述那些想法时，也许只是一闪而过，而不是马上就做。这也是为什么称其为“动机”的原因。

动机与趋势的区别：

趋势与动机最大区别在于，趋势仅具有方向性，而动机不仅具有方向性，同时它也是一种方式。因而它的指向性更明确，更具体，也更具有特定性。

趋势仅指明了方向，却没有指明方式方法（即该怎样做），故我们还需要借助一个样本程序来进一步指导其行为。

实际上我们总能够同时感觉到趋势与动机的并存。例如，动机使你在感觉到饿时“知道”该去吃饭了，可是吃多少呢？这一尺度则要由趋势与感觉来把握了。

-----------------------------------------------
事实上我们可以分别用0到10及－10到0表示两种竭然不同的趋势。前者表示我们所向往的（如温暖），后者表示我们想摆脱和逃避的（如寒冷）。这样0就成为了一种中间状态，大于0逐渐感觉温暖；小于0则会逐渐感觉寒冷。
有一些感觉，其阻力或助力是随苦乐值的增大（减小）而增大（减小）的。
指在一定意义上。
-----------------------------------------------

3、样本

尽管动机为我们提供了动的趋势和行为的指向性，但如何行动则是另一个问题。这就需要用到样本程序了。

样本实际上包含两类，一是固化于反射系统内的样本（即现在的动机——反过来讲也依然成立——即动机其实就是过去的样本程序），二是储存于记忆内的样本（后天形成）。

样本的作用在于指明方式与方法，起一种示范作用。最初的样本程序是在反射系统内以强制的方式表现出来的——包括学习都是强制性的。

样本程序按照基本类型分，可划分成全样本和部分样本两种。

以目前用于人机对话的语音机器人为例，此类机器人与人类提问者之间所进行的对话基本上都需要事先录制好，然后再在特定的条件下（例如针对某一问题的回答）将其完整地播放出来，这其实就是一种全样本。

编制全样本是一项繁琐的甚至可能是无穷尽的工作，因为我们需将它可能用到的所有回答方式全部事先录入进去，这样工作量就非常大。

于是人们又想到了编制部分样本的方法，即将每一个字或词的发音都单独录入，然后再将要说的话以文字或其他（非语言）方式录入，让计算机自动识别并找到正确的发音将其组合并完整地表达出来。这在一定程度上可以减少或减轻人工输入的工作量，但它也只对于包含元素较少的某个特定系统适用，如电子报时系统，而对于包含元素很多的大系统及超大系统来说，这仍然是繁琐的。况且这种由计算机自行拼揍起来的语言（实际上是将人工输入的每一个单词的发音按照需要重新组合）不仅显得有些生硬，且不连贯。因为它是将先前录入的发音按每一个字词的位置一个一个的组合起来，所以就不像人平常说话时那样协调、顺畅，一气呵成。语调也显得呆板，缺少生气。

另外，我们还可以从全样本或部分样本中只提取出某些更基本的要素出来，组成一个系列，然后再让计算机按照需要自行进行组合，这种更细化了的部分样本可称其为元素样本。例如我们可以将字词的发音进一步拆分成独立的音节（——或者其他更为基本的形式），并且从根本上改变发音方式，不是人工地来录制声音，而是让它学习并掌握自主发声，

这样的做法不仅是最大限度上减少了人的工作量，也更接近于人类的真实情况。使它可以在学习过程中通过听觉的反馈逐步地校正自己的发音，人类起初也是以这种方式来学习正确发音的。

所以在它模仿教授者（人类）发声的同时，会自觉的将其作为标准音进行对照，以纠正和调整自己的发音，直到一致为止。

由于采取自主发音的方式，语音语调都可以自由调节，这样也解决了原始录入方式机器人说话不连贯，不协调的问题。

前面我们讲了编制元素样本的诸多好处，但它也有一定的局限性，由于绝大多数文字都是组合音，如果每一次说话都需要重新组合成这些音符，势必又是一件麻烦的事，况且那些已经校正过的发音也需要保存，以便今后能正确地使用，这时记忆就派上了用场，它的一个主要作用就是被用来保存一些常用的部分样本或全样本——每一个字或词的读音是什么，或者遇见什么人该讲什么话，以及说话时该用怎样的语气等等，这些实际情况都被作为一种新的样本重新由记忆完整地记录并保存下来，以便下次再遇到类似的情况或需要表述同样语段时，可以直接调用，不必连每个字词的发音都需要重新组合、校对。——比如我们过去曾

-------------------------------------------------------
其实是原来由反射系统掌控的样本，在意识出现后被划分成了两种状态，即动机与样本，动机仍由反射系统掌握，但其已不具有了强制性，而样本则存在于记忆中供意识（与反射系统）提取。
    首先它需要学会如何使用这只发声器，为此我们需要加入一些辅助程序，且将基本的发音方法编入程序，之后它需要通过调整和使用不同发音方法，发出不同的声音及音节组合。
    这里也需要一条辅助程序——使机器人能够“自觉”地完成对比这一功能，当中设立几个对比的标准。
    这并没有改变它们的合成音的性质，只是不再经过意识而直接由反射系统在下意识中完成，就像我们走
-------------------------------------------------------

经背诵过的诗文，其实就是被作为一个全样本由记忆保存下来，为的是再次用到它时，能脱口而出。

从全样本到元素样本，再到被记忆重新保留的全样本，这一过程的变化实际上正体现出了学习的意义。而且这其中最大限度地减少了人为的设计与干预。

那些重新被记忆保留的部分样本和全样本，则要通过我们接下来要讲到的程序起作用。

4、提示（反射）

记忆的提示（或反射）功能是指这样一个过程，即

/“当××时，执行××程序”/

它由两部分构成，前半部分是条件，后半部分则是提示内容（即反射）。而提示的内容（或执行的程序）有可能是过去的某段（与事件相关的）记忆或者是由记忆保存的样本程序。它与我们上节讲到的样本程序在形式上类似，只不过这部分内容是被保存于记忆中的——区别于反射系统固有的样本。

需要指出的是记忆的提示程序也属于反射程序的一种，只不过它从一开始出现就不再具有了强制性。而且，“反射”的内容不一定是某种行为或动机，也可能是某一段记忆。“灵感”其实也是一种反射。

至此，我们已经介绍了全部四种引导程序，接下来再重新作一番梳理。最开始是由反射系统控制的感觉（趋势）、动机与样本占主导地位，但随着意识的逐渐形成，反射系统也不再“一统天下”，至少在意识关注的领域是这样。动机则成为被记忆重新保留下来的样本，并由记忆负责调用——因而提示代替了反射。

人类的情况为例，当你感觉到饥饿的时候，首先想到的是寻找食物，然后你发现远处桌子上摆放着各式各样可食用的东西，接下来问题就是如何拿到食物了（具体地说就是如何行走以及如何跨越各种障碍而找到捷径抵达目标），最后经过逐个尝试，你终于找到了自己

rgzhn05.gif (2218 字节)

最爱吃的那一种食物，当你下次再感觉饥饿时会径直朝它走去。将上述过程归纳出来则为：

这样就形成了一个完整的可持续的行为过程。

7 如何通过图灵检验

之前我们已简要介绍了图灵检验，同时将它作为评价机器人是否真正具有思维的一个客观标准。有人不赞同使用图灵检验方法，认为它并不能从根本上去验证机器背后的思维或者意识的存在，然而有谁不是通过与之进行交谈而是扒开其脑壳来确认一个人是有意识的或者是一个意识正常的人呢？

况且即便你能够深入到某个人的大脑组织中去实际探索一番，除了能够发现一些细胞、原子抑或是电子的流动，你还能够看到什么？

我们前面所做的大量工作都是为了使机器具有同人一样的思维及逻辑推理能力，但要想顺利的通过图灵检验，这还不是一件容易的事。一定要使机器人同人一样也会有说谎、偷懒等类似的行为，虽然这看起来不过人类的某些缺点、恶习，但恰恰是它们体现出了许多人性化的东西，显示了人的灵性，及顽劣不羁的本性。

---------------------------------------------
路时不必考虑每条神经是如何协调的一样。
实际上提示和反射还是有一点区别的，一般来讲，“提示”是记忆的功能（不具有强制性），“反射”是反射系统的功能（通常具有强制性——但不绝对，尤其在意识形成之后）。
---------------------------------------------

为此是否要使机器人在接受图灵测试时，故意做出一些非常规的举动或行为，以显示出人类的某些特点呢？如让它适当地说一些慌话，以说服测试者它反而是人，对方才是机器。或者在接受“心算”测试时（这本是它的强项），不要表现得过于“聪明”，比如不要过早的说出答案，而对于那些较大的数位运算则应主动选择放弃，以防止漏陷。——总之就是不要让它表现得太过于听话了！

尽管我们可以给它设计出一种“说谎”程序，或者利用随机函数来增加其行为的不可测性，但不仅这本身是一个极为复杂的过程，而且这样一来还会降低计算机的精度。我们知道，计算机最重要的特点，就是它的精准性，因而不能以降低其精度为代价，来使它显得更“精明”，那样不仅得不偿失，还会使计算机失去了它最起码的功能和存在的意义，然而这对于一个仿人机器人又是必要的，这的确是一个矛盾。

实质上在人的大脑中并没有什么说慌或者偷懒程序。人类行为中表现出来的不可测性，完全是博弈的结果。例如，说真话会让你感觉有压力，这便会促使你去说假话。心算的成功率不高，则是由于受到了来自某个系统的干扰，因为思维本身是极为敏感的、极易受外界因素的干扰，使得我们难以长时间的集中精力。努力使自己集中精力的过程其实也是一个（与受干扰因素）博弈的过程。并且这一状态（指暂时的精力集中）又是极不稳定的。

因此也要在机器人中引入博弈的概念，这样才能帮助其通过任何条件最为苛刻的图灵检验。那么究竟什么是博弈？为什么我们要称它为博弈的呢？

人际关系或人在社会关系中所显示出的博弈性，是由于人自身的博弈性所决定的。

我们知道，感觉等的方向性是通过趋势表现出来的，趋势又是反应强度变化的一个重要指标。我们发现你越是抵制某种欲望，则它对于你的诱惑也就愈加强烈，相反，如果你顺势而为，那它对你的这种诱惑反而相对地减弱，同时你的抵制力也就越是增强。也就是说，欲望或者其他不可控因素与逆向的抵制力之间存在如下关系：

rgzhn06.gif (5234 字节)

当某一外界因素触发了你的某种欲望或情绪时，首先会产生一个初始强度，而这一初始值又是触发抵制力（逆反心理或情绪）的条件，二者同生同灭，互为条件，如图7-a所示。图7-b则是它的另一种表示形式，阴影表示A的指标强度，空白表示B的指标强度。因在某种欲望值增大的同时，抵制力也同步加强，因而形成一个倒三角形状。

但由于两种因素实际上是一种互相制约的关系，所以实际曾现出来的是如图8所示的正弦形曲线。

------------------------------------------------
虽然理论上讲，随着你的顺势操作，则逆势操作的概率逐渐降低，即所受阻力更小（静态指标——绝对值），但是随着指标值的上升，则逆势压力越大（动态指标——相对值），于是便出现了阶段性回调态势——即曾现出一种类似股指的走势。
------------------------------------------------

rgzhn07.gif (3330 字节)

t₀是触发点——通常情况下欲望（或情绪）是先发因素，所以前半周期欲望是主动因素，带领着被动因素（抵制力）一同上升，我们看到它并没有沿着切线的方向直线上升，而是与之有一间隙，我们称此间隙为阻力空间，同样由于相互的牵制作用，抵制力也有一阻力空间。从图中看出，欲望指数在触发点附近，单位时间内升幅最大，此后逐渐减小，在a点时二者达到了一个平衡点，即阶段性极点（这并非是欲望指数的极值）。此时如果意识不加任何干预，则波形自然回落，并最终到达零点（即转折点——相当于图5-a或图7中的顶点）。后半个周期则为调整期，也称警戒期或警示期，与此前不同，这一阶段是在抵制力的带领下上升和下降的，也即是处于你主动或有意识的抵制阶段。通常来说，后半个周期或（后1/4周期）所持续的时间更长。调整期过后便是另一个周期的开始，t3是下一个周期的始点。

对于意识来说，除了你的肢体是可控的之外，你的大多数情绪都是不可控的，也包括欲望、甚至是记忆等，实际上它们是归于反射系统负责的（即属于条件反射的范筹）。

反射系统总是挟持着与意识对立的情绪或因素（即扮演着你的对立面），当你想努力摆脱某种欲望时，如竭力不使自己去吸烟时，反射系统却总是以各种方式提示你要这样做，而当你忍不住这样做了，反射系统又转而成了正义的化身，充分挖掘你的逆反情绪及提示你这样做的弊端（因为你的记忆实际上也是受反射系统控制的——或者说记忆对于你的提示也一种反射行为）。这时你的自责心理开始占据主导了，进而开始反思，并以此来抵制你的欲望。可是正当你想要放弃时，反射系统及你的欲望又开始重新占据了主导，并引导你想象着吸食香烟这之后飘飘欲仙的感觉。因而这之后你通常总是难以抑制自己的烟瘾，反而是吸食过后微微有一种自责的感觉。反射系统就是这样不断地变换着角色，在两个对立面之间游走，而你也因此总会左右摇摆不定，一时被欲望趋使；一时又被理智所占据。

这里面还存在一个关于宿命与自由的争论的问题。尽管你的欲望是受反射系统控制的，实际上也是它使你的情绪变坏的（进而来左右你的意志），但这不能理解为宿命。就像在前面的例子中，你可能觉得是反射系统迫使你去吸烟的，所以认为你的自由被剥夺了——这里面有一个理解上的错误，事实上并不是××因素使你选择了A 或B ，而是一种力量使你选择A ，另一种力量使你选择B 。因此你要想自己选择A，那么首先你要说服自己放弃B 。

况且这里所谓的“不可控”因素，并非是绝对的不可控制，只是不能直接控制，而且其中绝大多数都有这样一种特点，即总是与你的主观意志相背离，同时又不具有一种持续而有效的可以对其实施间接控制的控制方法，因而我们称它们为博弈的 ——在两种力量（指意识与反射系统）的“较量”中，反射系统仅是作为博弈的一方。〔注释〕

由于你的手和脚对于你来说是可控的，所以你让它往左，它就往左；让它往右，它就往右。但你要想去控制另一个人的手或脚就不那么容易了。比如，你对旁边的人说，帮我把衣服递过来，最开始时，他也许会听你的，但他不可能永远都听你的，所以当你下次再说同样的话时，他可能就会佯装无干，甚至反其道而行之，以此来表示他的不满或抵触情绪。假如这时你换一种方式，对他说，我今天不穿这件衣服，你帮我把它挂起来吧，他倒有可能会将

-----------------------------------------------------------
此时刻是一个关键点，若意识选在此刻为决策点（注：意识的干预会使波形变得紊乱起来），那么结果多半是让你事后极不理智——或者是极为英明的，我们时常说的“成败只在一念间”，往往指的就是这一时刻。如果你的决策点选在极点之后乃至调整期（后半个周期）的某一点（如b点），则通常认为是理智的，因为此刻欲望曾下降趋势，所以选取在此刻决策，通常是因为你认识到了它的某些价值（或弊端）。
意识无法直接调动情绪。
相对而言，那些可控的以及其他可间接控制的也称非博弈的。
-----------------------------------------------------------

衣服扔向你跟前——不过这种方法只能用一次。

显然，你在试图说服他或者在努力达到你的目的的过程，其实就是一种博弈过程，如同你对你的情绪或欲望的控制过程一样，而反射系统就像是存在于你体内的“那个人”，并且它总是扮演着异见者的身份。表面上看它像是一位“搅局者”，总是在与意识争斗，在进与退之间制造矛盾，激化二者间冲突，干扰你的决策。任何的博弈过程不可避免地都存在一定的风险，使你实际上很难保证自己每次都是成功的和正确的。

但它同时也使你看到了事物的两面性，从而也避免了意识的独断与专制。你不得不在这场博弈大战中疲于奔命（即指全力保全自己及自己的利益），不得不仔细思考如何取舍，协调利害关系，慎重决策。

并且这种博弈关系（指意识与反射系统间的博弈）不是一种取舍关系。所谓取舍关系，是指你对两种选择的结果进行比较，之后得出选择。比如经过比对，你认为选择A 更有利一些，得分为51分，而选择B 的话，得分仅为49分，结果你就选择了A 。就像一架天平一样，由砝码的权重来决定指针的指向。但事实上你的选择往往不是由权重主载的（那样无异于宿命论），如你明知道吸烟是不好的，它对你有百害而无一利（即表示在对弊与利的权衡中你会给出100：0的积分比）。但是受着欲望的趋使，你还是会这样做。

然而博弈又不同于简单的赌博。赌博是对于结果完全未知的一种选择或决策。例如一个人一只手中握有十美元，另一只手中则没有，让你来猜，若你猜对了，则十美元归你，否则你便要付他十美元，这显然是一种赌博。但假如这时旁边的一位知情者告诉你，十美元就握在他的右手中，让你选择右手，这时你就要考虑了，要不要信他？他倒底是在帮你呢，还是在骗你？之后你通过对此二人进行察言观色，才做出选择，这时这一过程就成为一种博弈了，因此，博弈与赌博的过程区别是，一则为有迹可循，一则为无迹可循。

说白了，博弈就是博与弈的结合，即在弈的过程中具有博的成分，而弈的过程是以经验为基础的，因此它也是在人及由人构成的群体中所独有的一种现象。

在人类的社会生活中处处都体现着这种博弈关系，如打牌，炒股等。股市就将博弈的特点体现得淋漓尽致，股价的走势其实所反应的就是人的心理对于市场变化的承受能力，信心决定股价走势，所以股价走势图在某种意义上反应的就是人的“心理走势图”。

在人际交往中，以及人的各种社会行为也无疑体现着这种关系。这种博弈还使得你的行为在外界和其他人看来多了一种不确定性，这也是目前人与机器人的一个重要区别。　

8 安全问题：

让机器拥有意识其实是一件很危险的事，除了将挑战人类独有的优越感，还有可能危及人类自身的安全。一旦机器能够顺利通过图灵检验了，不仅意味着它具有了同人一样的智慧，甚至可能像人一样拥有嫉妒、报复和仇恨等，这将使它超出我们可控的范围，从而可能攻击人类。为此，我们应本着严谨的科学及科研为目的，适当地开展试验性研究，阻止人工智能技术被滥用。未来在人工智能上的应用上，则更应谨慎为之，防止真实版的《人工智能》式的泛滥上演。

9 结语：

------------------------------------------
    事实上即便是你做出了某种选择，你自身的这种博弈过程也从未停止过，否则你一旦选择便选择了，那么也就成了宿命的了。
    如果从概念上划分的话，博弈应属于赌博的一种。
    实际上有准备的赌博（区别于盲目的）也是一种博弈，所以说赌博与博弈并没有过于严格的界线。（其中“有准备的”指主动参与的及虽是被动参与但已有了思想准备的）。
    更确切的说应该是在“由生命现象构成的特殊群体中”。
    好莱坞电影，导演史蒂文·斯皮尔伯格。
-------------------------------------------

事实证明使机器人具有意识并非天方夜谭，但实现人工智能仍不是一件容易的事情，而是一项复杂工程。为了使其具备创造性思维，及提升它的自主能力，应改变强制灌输为适度引导。而这也必须要经历像人一样的成长过程，要通过学习完成经验的积累过程。

参考文献：
1. 百度百科。
2.《上帝与新物理学》（英）保罗?戴维斯著.徐培译.湖南科学出版社.
3.《皇帝新脑》（英）罗杰?彭罗斯著.许明贤吴忠超译.湖南科学出版社.
4.《人的意识》[英]苏珊?布莱克摩尔著耿海燕李琦等译中国轻工业出版社。

此外，不可控因素还具有如下一些特点（也即博弈的五大特点）：

⑴阶段性。我们将借用股市的走势为例（图9）来说明，首先我要说的是，股市中股价的走势其实是一种不可控因素，为什么不可控？因为股市是由买方市场与卖方市场构成的，这使得股市上实际上也、存在着两种欲望，即买进欲望与卖出欲望，同时二者又是对立的。

随着股价的上升（这可能是由于公司业绩的拉动作用），越来越多的人看到了它的利润空间，并纷纷将钱投向那里，因而股价不断上扬。然而我们看

rgzhn08.gif (3550 字节)

到它并非是沿着趋线平滑地直线上升的，其中有很多起伏，先是大幅上升，再回落调整——当股价达到了某些人的预期（或心理防线）时，他们便纷纷开始抛售持有的股票，在抛压的作用下股价开始下调，而后由于对其价值的重新认识又使股价重新上扬，并达到了一个新至高点。

所以无论是主波（即五个推动波），还是修正波（a、b、c调整波）都曾现出阶段性上升或下降态势这就是博弈的阶段性特点。

⑵反复性（周期性）。反复性是博弈的另一个重要特点，其最重要的表现特征是振荡，这表明目前形式还不很明朗，市场处于犹豫状态。它实际上反应了参与市场的人的一种矛盾的心理活动。同时博弈还显示出周期性，如果你仔细观察会发现，股价变化图无论从整体或局部大多呈现出如图9所示的波型结构，即通常是五个主波加三个修正波，或反之（倒置图）。

⑶偶然性。市场很容易受消息的影响是常参与股市买卖人士的一种体会，尤其是当市场处于振荡时期，消息的作用更加具有一种导向性。而这其实也反应了博弈过程中的一种偶然性。往往“成败只在一念间”，失败与成功有时就是一纸之隔。

⑷“一边倒”（惯性）。人们常爱说这样一句话，“一步错，则步步错”。如果你做某件事，第一次就犯了错误，那么当你下次再做这件事时，你犯错误的概率就会远大于成功的概率，这是由于受惯性（惯性也即习惯性）或者说是受记忆效应的影响。

而表现在股市中则是“一边倒”，这在跌市中尤为明显。如敢上大跌市（即所谓的“信心危机”），其股指通常是“一落千丈”，近乎直线下降。股市“泡沫”则是它的另一种表现形式。这其实也是股市的一种惯性或记忆效应，因为股市实际上是由人参与的一项活动，因而也必定会受人的情绪等的左右。

所谓“成功是一种习惯”，也是这个道理。

心理障碍（参阅《人工智能概论1》中附录2：心理障碍的产生）、抑郁、失眠等症状的出现，也都与博弈的这一特点有关。

⑸临界性。在博弈中的两个对立面之间，通常不是一种非此即彼的关系——“风险与利润共存”说的就是这一道理。它们（即两个对立面）似乎是同处于一个平面，彼此间却是一种相互渗透的关系。“一只脚尽管已经踏入天堂，另一只脚却仍留在地狱”，优势瞬间就可能变成劣势。“前脚离天堂越近，留在地狱的脚也就踏得愈深”。站在不同的角度，你将得出不同的结论。它使得“自信”与“自负”没有了区别，“冒险”（玩火）与“胆识” 也近乎成了同义词。

返回首页