这并非意味着人们仅仅依靠情绪细胞就够了,多巴胺神经元需要不断接受培训与再培训,否则它们的预测准确率就会下降。跟着感觉走需要时刻保持警惕,直觉的智慧是深思熟虑的结果。塞万提斯说:“谚语是从长期经验中总结出来的简短句子。”这一说法也同样适用于脑细胞,除非我们正确使用直觉。
下面说一说比尔·罗伯蒂(Bill Robertie),他是世界上唯一一个在三种棋牌类项目上都达到世界一流水平的人[想象一下,如果波·杰克逊(Bo Jackson)除了在NFL打橄榄球、在MLB(美国职业棒球大联盟)打棒球外,还在NBA(美国职业篮球大联赛)打篮球]。罗伯蒂是国际象棋大师,获得过美国国际象棋锦标赛超快棋冠军(United States Chess Speed Championship);同时他也是一个广受尊敬的扑克专家,写过几本有关得州扑克的书,这些书非常畅销;然而,罗伯蒂最为出名的还是他的双陆棋棋艺,曾两次获得世界双陆棋锦标赛(World Championship of Backgammon)冠军(世界上包括他在内只有两个人取得这个成就),世界排名一直保持在前20位。20世纪90年代初,特索罗寻找能与TD-Gammon对弈的双陆棋专家时,选择了罗伯蒂。罗伯蒂说:“他想让计算机拜最好的师傅学艺,而我就是最好的。”
现在,罗伯蒂60多岁,头发灰白,戴着厚厚的眼镜。还是孩子时,他就迷恋国际象棋,而且通过下棋赚钱。当罗伯蒂谈论下棋时,他的神情中仍然透露出那种从没想过自己会以下棋为生的人常有的孩童般的迷恋。他说:“第一次与TD-Gammon比赛时,我惊呆了,它比我以往见过的任何一台计算机都要先进许多。那次比赛我赢了。然而,第二年,情形完全不同,TD-Gammon成了一个相当强大的对手。它通过与我下棋学会了下棋。”
通过从预测失误中学习,TD-Gammon把自己变成了一个双陆棋专家。犯过几百万次错误后,TD-Gammon已经成为少数几台能与人类最好的棋手对弈的计算机了,像深蓝一样。但是,这些聪明的机器都有一个严重的缺陷:它们只能掌握一种棋牌游戏。TDGammon不会下国际象棋,深蓝不会下双陆棋,还没有哪台计算机会玩扑克。
那么,罗伯蒂怎么能够精通三种不同的棋牌游戏呢?乍看之下,国际象棋、双陆棋和扑克好像依靠非常不同的认知技巧。这就是为什么大多数双陆棋冠军往往只下双陆棋,大多数国际象棋大师不会劳神玩扑克,大多数扑克选手不知道拉脱维亚弃兵开局和法兰西防御。按照罗伯蒂的说法,他的成功只有一个简单的解释:“我知道怎么练习,我知道怎么让自己下得越来越好。”
20世纪70年代初期,罗伯蒂偶然接触到了双陆棋。当时他还只是一个国际象棋神童,靠赢得超快棋锦标赛冠军赚钱。罗伯蒂说:“我立即爱上了这个游戏,而且双陆棋的奖金比超快棋丰厚。”于是他买来几本有关双陆棋攻略的书,记住开局的几步走法后,就开始与别人下棋了。他说:“你必须钻进去,达到你一直梦想进入的境界。”
经过几年的强化练习,罗伯蒂把自己变成了世界上最好的双陆棋棋手之一。他说:“当瞥一眼棋盘就知道该怎么做时,我知道自己的棋艺越来越好了。下棋开始变成一项艺术,我逐渐根据对棋局的整体感觉做决定,最后能马上知道某步棋会让自己的处境变好还是变坏。你知道艺术评论家只需看一下就知道一幅画好不好吧?我就是这个样子,只是我看的画是双陆棋棋盘。”
但是,罗伯蒂能成为世界冠军,并不仅仅因为他下过很多次双陆棋。“不是练习的数量,而是练习的质量。”他说。按照罗伯蒂的说法,取得进步最为有效的方法就是关注你的错误,换句话说,你要有意识地反思已经被你的多巴胺神经元内化的错误。每次比赛过后,不管是国际象棋比赛、双陆棋比赛还是扑克比赛,罗伯蒂都会努力回忆比赛过程中发生的事情,分析评价自己的每个决定。刚才是否该早点派出皇后?刚才是否该用对7诈唬?刚才是否该统一单子?即使赢了比赛——他几乎总是赢,他也坚持寻找自己的失误,分析哪一步是否有更好的走法。他知道自我改善的秘诀就是自我批评,负面反馈是最好的老师。罗伯蒂说:“TD-Gammon教会了我很多。这台计算机什么都不做,只是检查自己的错误。它所做的就是这些。现在它的棋艺和我一样好了。”
物理学家尼尔斯·博尔(Niels Bohr)曾经将专家定义为“在一个狭小的领域里犯过各种错误的人”。从大脑这个角度来说,博尔绝对正确。专长不过是脑细胞通过不断犯错积累的智慧,犯错不该受到打击,相反,应该受到鼓励,并加以仔细反思。
斯坦福大学的心理学家卡罗尔·德韦克(Carol Dweck)花了几十年的时间证明,教育成功的要素是从错误中学习。让罗伯蒂在三项棋牌游戏中都很出色的训练方法也是一个重要的教学方法。遗憾的是,人们教育孩子的方式却恰恰相反,他们经常表扬一个孩子的先天智力(聪明),而不是后天努力。德韦克已经证明这种鼓励实际上适得其反,因为它引导学生把错误看成愚蠢的表现,而不是构建新知识的基石。最终结果是,孩子永远学不会如何学习。
德韦克的实验是在纽约12所学校做的,参加实验的是400名五年级学生。研究者从课堂上一次请一个孩子出来,让孩子做一个相对容易的测验,这个测验包括数个非语言类题目。孩子完成测验后,研究者告诉他得了多少分,然后简单地表扬他一句。一半的孩子受到的表扬是“你在这方面一定很聪明”,这种说法是称赞他的智力;另一半孩子受到的表扬是“你解题时一定很用功”,这种说法是称赞他的努力。
然后,研究者告诉孩子,他需要再做一个测验,而且可以从两套测验中选做一套。一套测验比较难,但是能从中学到很多东西;另外一套测验比较简单,和刚刚做过的那套非常相似。
最初设计实验时,德韦克预计表扬形式的影响相当有限,毕竟只有简单的一句话。后来她很快发现,表扬形式显著影响了孩子随后的选择。因为在努力方面受到表扬的孩子中90%选择了较难的测验;而在聪明方面受到表扬的孩子则大多数选择了较易的测验。德韦克写道:“当我们称赞孩子的智力时,给孩子传递了一个信号:聪明点,别犯错!”
接下来的一组实验,德韦克向人们演示了害怕失败是如何妨碍学习的。
德韦克让那些五年级学生再做另外一个测验,这个测验非常难,本来是给八年级的学生编制的。她想看看,孩子面对挑战时会有什么反应。先前因为努力而受到表扬的孩子非常专心地解题,德韦克说:“他们很积极,他们当中有很多人无缘无故地说‘我喜欢这个测验’。”而先前因为聪明而受到表扬的孩子遇到难题后很快就气馁了,失败(五年级的学生当然很难完成八年级的测验)对他们来说意味着“或许我实际上并不聪明”。这个较难的测验过后,研究者让孩子选择是否要拿自己的成绩与别的孩子比较。因为聪明而受到表扬的孩子通常会拿自己的成绩与那些表现得比自己差的孩子进行比较,以增强自尊;因为努力而受到表扬的孩子通常会拿自己的成绩与那些表现得比自己好的孩子进行比较,他们想知道自己错在哪里,并从中总结经验,想着如何提高自己。
最后一轮测验的难度水平和第一轮相当,然而,因为努力而受到表扬的孩子有了显著的进步,分数平均提高30%。因为这些孩子愿意挑战自己,即使这意味着最初会失败,但最终他们的成绩提高了很多。与之形成鲜明对比的是,那些被随机分配到“聪明组”的孩子的分数却平均下降20%,对这些孩子而言,失败的体验令人如此沮丧,以致他们退步了。
表扬孩子先天智力(“你很聪明”的称赞)的问题在于它违背了神经元的实际学习模式,这种表扬方式不利于鼓励孩子进行尝试,因此,孩子也不可能从错误中学习。除非我们体验到“做错了”带来的不快,否则我们的大脑绝不会修正它的预测模式。取得成功之前,神经元必须不断犯错,这一过程很痛苦,但是没有捷径可走。
五年级学生解题实验中所发现的规律适用于每个人。随着时间的推移,这些灵活的细胞成为专家智慧的源泉。虽然我们往往认为专家就是一个信息库,他们的智慧依赖于渊博的可外显的知识,但实际上,专家的判断是相当依赖直觉的。分析问题时,专家不会一一分析所有可能性,也不会有意识地加工所有相关信息。专家不会在表格上列出各种选择的优缺点进行比较评价,而是自然而然地依赖他们的多巴胺神经元产生的情绪。他们的预测失误已经转化成有用的知识,使得他们能够仅仅依赖这套准确的情绪情感做出下意识的判断。
优秀专家的思考风格都含有直觉的成分。罗伯蒂下双陆棋时,仅仅“看”一眼复杂的棋局,就会决定怎么走。由于他一丝不苟的训练技巧,他的情绪脑已经内化了最佳走法,因此他十分相信自己的直觉。国际象棋大师卡斯帕罗夫非常喜欢研究自己过去的比赛,从中寻找哪怕是非常细微的不足,但是真正下棋时,他说自己靠的是直觉,“凭嗅觉,凭感觉”。赫布·斯坦拍摄完一集肥皂剧后,会立即回家看粗剪。斯坦说:“我什么都看,一边看一边记笔记。我十分卖力地寻找自己的错误,我总是非常希望能找出30处错误,看看哪30处我可以做得更好。如果我没有找到30处错误,说明我找得不够仔细。”大多数情况下,这些错误都微不足道,别人甚至看不出来,但是斯坦知道避免下次犯错的唯一方法就是研究这次的错误。汤姆·布雷迪每星期花大量的时间观看比赛录像,仔细审视自己的每次传球决定,但是当他处于保护圈里的时候,他知道传球之前自己不能有丝毫的犹豫。所有这些专家都有同样的习惯,这并非巧合,他们都知道怎么利用意识机制,从不可避免的错误中偷得尽可能多的智慧。
然后是迈克尔·赖利少校。在成为一名皇家海军军官之前,赖利已经花费多年时间学习怎么解释雷达屏幕上的模糊亮点。在皇家海军,像赖利这种战争专家的训练过程包含了实战演习,这样他们就能在模拟情境下练习做决定,并从错误中学习,而不用真的击落什么。
海湾战争中,所有这种训练都取得了成功。尽管赖利以前从来没有见过蚕式反舰导弹,但是他的大脑已经学会如何检测它了。连续好几个星期,赖利一直盯着雷达屏幕,观看了几十架返航的A-6战斗机沿着科威特海岸飞行。因此,他的多巴胺神经元开始对事件发生顺序有了一致的预测模式,A-6战斗机的雷达模式已经印刻在他的大脑里了。然后,在地面进攻开始几小时之后的那个拂晓,赖利看到一个稍微有所不同的雷达亮点。来袭的亮点看起来距离海岸很远,雷达扫射三次之后,它才显现。于是,赖利大脑某处的多巴胺神经元感到惊讶,亮点的某样东西不符合先前的预测模式,预测失误出现了。神经元立即对这一异常事件做出反应,改变了放电率,发出电信号。这些电信号在神经元之间传递,直到到达ACC,纺锤体神经元立即将这一预测失误公布于整个大脑。赖利多年的海军训练被提炼成一丝恐惧。它不过是一种感觉,但赖利敢于相信它。“发射两枚海标枪!”他喊道。两枚防空导弹发射到空中,战舰得救了。
到目前为止,我们一直在探讨情绪情感的惊人智慧,看到了多巴胺神经元的变化是怎样转化成恐惧感的。但是,我们的情绪情感也并非完美无缺。情绪情感是一个重要的认知工具,但是即使最有用的工具也不能解决所有的问题。事实上,某些情况下,情绪脑会短路,导致人们做出错误的决定。出色的决定者知道哪些情况下直觉不那么可靠。在接下来的一章,我们将看看那些情况到底是什么。