《决策与判断》第五部分决策与判断中的社会性一面

本书前面几部分关注的主要是单个决策者的行为。但在很多情况下，其他人会对决策者产生很大影响。这一部分就是关于社会因素如何影响人们的决策和判断（第17章），并且比较了群体行为和个体行为的异同（第18章）。

第17章　社会影响

像别人看我们一样看我们自己可能会证实我们对别人最坏的猜忌。

——富兰克林·P.琼斯（cited in Peter， 1977）

正如第16章所说的那样，人们在做归因的时候经常会轻视或忽略多数人的意见。那么这是否意味着决策者不在乎他人的行为和态度呢？正好相反，即使是最独立的决策者都会受到社会因素的强烈影响。

事实上，菲利普·泰特洛克（Philip Tetlock， 1985b）已经指出，社会因素在人们的决策和判断中起着关键作用。泰特洛克（p. 325）说：“过去用认知实验方法研究决策和判断，所关注的焦点是狭窄而有误导嫌疑的。这方面的研究需要得到扩展，把社会和组织的背景因素考虑进去。”泰特洛克建议研究者把决策者视为“政治家”，他必须对自己的“选民”（如他的朋友、家人和同事）负责，并且总是关注“如果我这样做别人会有什么反应”、“如果别人置疑我的观点，我应该怎样说服他们”这样的问题。外部评价的重要性——以及这些评价对人们行为的影响——正是实验社会心理学最早的研究成果之一。

社会易化

社会心理学家戈登·奥尔波特（Gorden Allport）曾经写道（1954， p.46）：“第一个实验研究的问题——实际上也是实验研究头三十年关注的惟一问题——就是：当有其他人在场的时候，个体的行为表现与独处的时候相比会有什么变化？”虽然对这个问题的研究早在19世纪下半叶就已经开始，但是直到1965年才有一个完整的答案。在那一年，罗伯特·扎伊翁茨（Robert Zajonc）发现，对于那些简单的、熟练的行为，人们在有旁观者在场时通常能做得更好；但是对于那些复杂的、还没有掌握好的技能，人们在有他人在场时则会表现得没那么好。扎伊翁茨认为这一被称为“社会易化”（socical facilitation）的效应，至少部分地来自于他人在场时个体产生的唤醒状态。后来的研究则显示，即使其他人并没有实际在场，只要个体预期自己的行为会受到其他人的评价，这种促进或损害的效应也会发生（Henchy&Glass， 1968）。

尽管研究者在各种言语和数学任务中都发现了社会易化效应，但最直接的证据来自于在一个大学撞球室里进行的研究（Michaels， Blommel， Brocato，Linkous，&Rowe，1982）。在这个研究中，一些隐藏的观察者把在玩撞球的人分成技术高于平均水平和低于平均水平两组，然后记录这些球手在有观众和没有观众两种条件下的击球成功率。结果如图17.1所示，观众促进了那些技术高于平均水平的球手的表现，却损害了那些技术低于平均水平的球手的表现。查尔斯·邦德和琳达·泰特斯（Charles Bond&Linda Titus， 1983）在对共涉及20000名被试的超过200个研究的元分析中也得到了（尽管没有那么明显）类似的结论。有观众在场会损害个体完成复杂任务的正确率，同时对完成简单任务的正确率会稍有改善。

社会性懈怠

社会性懈怠（social loafing）并不是他人在场影响个体表现的惟一方式。在社会性懈怠效应被提出约30年以后，沃尔瑟·莫德（Walther Moede， 1927）报告了一个实验，这个实验发现，当人们作为群体的一员做一件事情时，就不会像自己独立完成时那么努力。这是莫德的一个学生林格尔曼（Ringelmann）做的实验，他发现，与参与两人组、三人组或八人组拔河时相比，当个体独自一人与对手拔河时会拉得更卖力。平均而言，两人组的时候单个被试的努力程度只有单人组被试的93％，三人组中单个被试的努力程度只有85％，而八人组中单个被试的努力程度则只有单人组被试的49％。艾伦·英厄姆等人（Alan Ingham， George Levinger， James Graves，&Vaughn Peckham， 1974）巧妙地用不同的方法重复了这个实验，研究者给被试蒙上双眼，使他们相信自己正与同组的其他成员一起与对手拔河，而实际上他们是单人应战。这种不同的实验方法却得到了与林格尔曼的实验相同的结果。比布·拉坦等人（Bibb Latane， Kipling Williams，&Stephen Harkins， 1979）将其称之为“社会性懈怠”效应，而且他们还发现，当要求人们尽可能大声地呼喊或鼓掌时也会出现这样的现象（见图17.2）。

图17.1　观众的在场会提高技术处于平均水平以上的球手的表现，却会损害平均水平以下的球手的表现（摘自Michaels等研究者1982年的研究）。

图17.2　本图表现了社会性懈怠效应。平均而言，随着群体成员的增加，单个个体的贡献下降。从折线的走势来看，单个个体独自呼喊或鼓掌时制造的平均声响（每平方厘米的达因数）约是六人组中单个个体发出声响的2倍。（摘自Latane， Williams和Harkins， 1979）

是什么原因造成这种“社会性懈怠”的现象？目前还没有明确的答案。拉坦，威廉斯和哈金斯认为，社会性懈怠效应的出现是因为处于群体中时人们不会像独自行动时那样直接感觉到自己的努力和最终结果之间的关系。与这个差异相关的是，对最终结果所担负的责任会在群体成员之间分散，而独立行动时个体则要对结果负全部责任。责任分散会对决策和判断产生强有力的影响。下面3个事件就是这种影响力的体现：

事件1：“放开那个女孩！”

这是1964年3月13日凌晨3∶20，纽约Kew Gardens火车站旁边的停车场。基蒂·吉诺维斯（Kitty Genovese），一位28岁的酒吧经理，刚刚下班回家。她把自己那辆红色的菲亚特汽车停好，关了车灯，锁上车门，然后向着自己100英尺以外的公寓走去。

突然她发现在停车场的另一边有一个男人。

基蒂转头就向附近林荫道的一个报警亭跑过去，但是还没有来得及跑到那里，就在一盏路灯下被那个男人捉住了。基蒂尖叫了一声，马路对面一幢10层高的公寓楼里亮起了不少灯，有些窗户打开了，基蒂大声喊：“噢，我的上帝，他刺中我了！救命啊！”

其中一间公寓里有个男人往下喊：“放开那个女孩！”

攻击者畏缩了，扔下基蒂跑了，基蒂在流血。很快公寓楼里的灯又熄灭了。基蒂尽力想回到自己的公寓，但是那个男人又出现了，又刺了她一刀。这一次基蒂发出了惨叫：“我要死了！我要死了！”公寓楼里的灯又亮了起来，邻居们打开了窗户，那个男人吓得钻进自己的车里飞奔而去。

过了一会儿，基蒂挣扎着站了起来。一辆开往肯尼迪机场的公共汽车开了过去。这时候是凌晨3∶35。

最后基蒂总算挣扎着回到她的公寓门口，却在这儿昏过去了。那个男人又折了回来第三次刺中了她——这一次是致命的一击。

关于这个故事的令人心寒的结语是：当这桩谋杀刚刚发生的时候，《纽约时代》杂志对它的报道只有在第26页上的短短5句话。可是两个星期后，这一事件却出现在头版的一篇长篇报道中。为什么？因为警方的调查发现，不少于38名“可敬的、遵纪守法的市民”目睹了这次谋杀，可是却“没有一个人在袭击的过程中打电话报警”（Gansberg， 1964.3.27， p. 1）。警方在基蒂开始遭袭击后30分钟才接到这些证人的第一个报案电话。也就是说，作案者在半个小时的时间里多次来回袭击基蒂，基蒂也不断呼救，但这38名目击者却没有一个人去帮她或者从自己家打电话报警。

事件2：隧道里的故事

1990年7月14日，星期六，意大利佛罗伦萨附近的一条公路。马可·莫雷蒂正开着车带他6岁大的女儿范尼莎到海滨去。正当他驶入一条隧道的时候，马可突然心脏病发作。马可挣扎着把车停在一边，让范尼莎自己设法回家。随后，33岁的马可不幸身亡。

范尼莎挪到车外，走到川流不息的汽车中间求救。飞驰的汽车行驶速度太快，掠过的气流把范尼莎撞倒在地上。但是她没有停下来——她抓爬着、流着血、哭着——绝望地向过往车辆求救。在接下来的30分钟里，范尼莎走了超过一英里的路，期间有数百辆车飞驶过她身边，却没有一个人停下来帮助她。最后终于有一位驾驶员把车开过来帮助她了，很快警察也到了。

就像基蒂·吉诺维斯的故事那样，这个故事也成了全国报纸的头条。意大利人都在扪心自问，为什么连这样的事都能发生？他们都把它视为一种信号，代表着意大利不再是那个曾经是那么温暖、充满同情心的地方了。例如，一位意大利社会学家下面的话就被广泛引用，他说，范尼莎事件“代表了一个我们倾向于视而不见的意大利——那个冷漠的、正处于冰河期的意大利，大部分时候每个人都只会想着自己以及和自己多多少少有密切关系的少数几个人。”（Haberman， 1990年7月19日，p. A11）

事件3：谁会捡起这些东西

这是20世纪70年代早期，美国哥伦布、西雅图或亚特兰大其中一座城市的一部电梯里。就在电梯门关上以后，站在里边的一个黑衣人“一不小心”掉了8～10根铅笔在地上（或者有些情况下是一些便士或镍币——是什么东西并不重要）。

作为比布·拉坦和詹姆斯·达布斯（1975）的一个现场研究的一部分，这样的实验模式被用于1497个不同的场合，有145人在合计4813名旁观者面前掉下不同的东西。拉坦和达布斯对下面的问题感兴趣：“谁会帮丢东西的人捡起这些东西？”他们的发现之一是随着电梯里人数的增加，旁观者帮助丢东西的人的可能性就会减小。

旁观者干预

贯穿于前面每个事件中的共同主线就是：在相对较大的群体中，给予帮助的责任会被分散。当人们面临着是否干预某件事的决策时，他人在场就会影响到他们如何决策。干预与责任分散的这一关系最初是在比布·拉坦和约翰·达利（1969， 1970）的一系列关于旁观者干预效应的精彩实验中被发现的。

在其中一个实验中，拉坦和达利邀请一些学生来参加一个关于“在城市的大学里生活会遇到的一些问题”的访问。学生到达以后首先在休息室里等候，或者独自一人，或者还有两位主试的助手装扮成的参与者（这两位助手在整个实验过程中都要保持被动），或者还有两位真正的参与者。然后，当被试坐在休息室里的时候，一股白烟开始从墙上的一个通风孔里冒出来。拉坦和达利想看看和独自一人时相比，当有他人在场时这些学生被试是否更不那么倾向于报告冒烟一事？

结果拉坦和达利发现，独自一人的情况下有3/4的学生被试报告了冒烟一事，其中一半人是在2分钟内报告的。相反，当与两位不采取任何行动的假扮的被试在一起时，只有1/10的学生被试报告了冒烟的事。其他人虽然咳嗽、揉眼睛甚至打开窗户——但就是不去报告！

至于三名真正的被试一起等待的情形，直接将他们与独自等待的被试的反应作比较并不恰当。如果独自等待时有75％的学生报告了冒烟事件，那么对于三个独立的被试一起等待的情况，相应的比例就应该是98％（因为所有三个学生都不报告的概率是.25×.25×.25=.02，所以1.00-.02=.98）。但实际的情况是，三人组时只有38％的被试报告了冒烟事件。

为了确保这些结果不是由一些无关的外部因素造成的（如独自一人与和他人在一起时对火灾的恐惧感不同），拉坦和达利决定在一个不同的背景下重复这个实验。在一个表面上名为“市场调查”的实验中，研究者让参加的学生独自等待，或者与一个朋友一起等待，或者与一个陌生人一起等待，或者与一个不采取行动的假扮的被试呆在一起。然后在他们正在等待的时候，研究者让他们相信隔壁屋里有一个人跌到并且摔伤了。这是通过播放一段高保真录音带来实现的。录音带里首先传出一阵碰撞声，然后是一个女人的呼喊声：“噢，我的上帝，我的脚……它……它……动不了……噢，我的脚踝！我……不能……不能……挪开这些东西。”

听到她的喊声后，独自等待的学生中有70％的人会跑过去帮忙。这意味着如果两个人中的一个会独立于另一个采取行动，那么至少其中一个人去帮助那位女性的可能性为91％（也是因为每个人都不提供帮助的可能性是.30×.30=.09，这样1.00-.09=.91）。相反，不熟悉的两个人坐在一起时，只有40％的被试主动提供帮助；而认识的两个人坐在一起时，则有70％的被试主动提出要帮忙。这表明，尽管朋友一起等待时比与陌生人一起等待时会有更大的可能性采取干预行为，但是与独自一人的情况相比，朋友之间还是会出现抑制效应。当比较被试独自一人和与假扮的参加者在一起时的行为时，来自他人的抑制效应也清楚地表现出来。在后一种情况下，只有7％的被试采取了干预行为。

拉坦和达利在其他几个研究中也发现了类似的结果。而且自他们最初研究这个问题以来，已经有很多其他研究者也证明了他人在场会抑制帮助行为。实际上，在拉坦和达利最初的那个研究完成后的十年间，研究者做的56个实验中有48个实验结果显示，有他人在场会使被试给予帮助的倾向降低（Latané&Nida， 1981）。对这56个研究的结果求平均，那么当人们独处时会有75％的可能性采取干预行为，而处于群体中时则只有53％的可能采取干预行为。

是否有某类人群能够避免旁观者导致的抑制效应的影响？从比布·拉坦和斯蒂夫·奈达（1981）所做的文献分析的结果来看，在美国社会中只有一类人能有这样的免疫力：9岁以下的儿童。那个阶段以后的人在决策时都会受到他人在场的强烈影响。

社会比较理论

关于社会易化、社会性懈怠和责任分散的研究都倾向于支持泰特洛克关于决策者是优秀政治家的观点。人们经常从他人身上直接获取行动的线索，而且他们非常关注他人对自己的看法。这些研究也显示出，人们通过把自己与他人做比较来评价自己的观点和能力（Suls&Miller， 1977）。描述人们如何进行此种决策判断的最精细的理论就是“社会比较理论”（socical comparison theory）。

社会比较理论是费斯汀格在1954年提出的——他也是认知不协调理论的创立者。费斯汀格认为，人们具有评价自身能力水平和自身观点恰当性的需要。那么在缺乏客观的、非社会性的标准时，人们就会把自己和其他人做比较。费斯汀格尽可能做到详细和严格地对社会比较理论做界定。该理论包括9个假设、8个推论和8个衍生观点，或者说一共有25个主要观点。

大致来看，这些命题最中心的观点是：

假设I：人们具有评价自己的观点和能力的自然倾向性。

假设II：在缺乏客观的、非社会性信息的时候，人们会通过与他人的观点和能力做比较来评价自己的观点和能力。

推论IIIA：在面临选择时，人们更愿意和那些观点和能力与自己接近的人做比较。

最后一个观点已经有丰富的研究成果，而且大部分研究都支持费斯汀格（1954）的看法。人们通常会与那些和自己相似的人做比较，而不是与那些和自己不同的人相比。例如，如果你是一名本科生，你很可能会把自己的学术成就与其他本科生的学术成就做比较，而不是与研究生或者教授做比较。同样，助理教授一般会与其他助理教授做比较，而不会与资深教授做比较。

从那些与自己相似的人身上获取行动的线索

在哈维·霍恩斯坦、伊莱沙·菲什和迈克尔·霍姆斯（Harvey Hornstein，Elisha Fisch，&Michael Holmes， 1968）的一个有趣的现场实验里，社会比较的相似性作用得到了很好的体现。在这个研究里，在曼哈顿中心区有超过100名行人看到路上有一个写着地址却没有贴邮票的信封，信封里有一个遗失的钱包和一封写给钱包主人的信。钱包里有2美元现金，一张签给E.M.H公司（这几名研究者名字的首字母组合！）的支票，一张写着某人电话号码的纸片，以及钱包主人的身份证，上面有钱包主人的姓名、电话号码和地址，以及其他一些东西。钱包主人名叫迈克尔·欧文——这个名字是经过仔细挑选的，以避免含有种族或宗教的暗示——而且在所有情况下，钱包和里面的东西都是一样的。

有变化的是写给钱包主人的信。在某些实验条件下，写信者是与这些路人相似的人（即一个能流利使用英语、像是本地人的写信者），而在其他条件下，写信者则是一个与路人不同的人（即一个几乎完全不懂英语的外国人）。另一个实验条件是不同的写信语气，在1/3的情况下，写信者用一种正性的语气写这封信，在另外1/3的情况下用一种中性的语气写信，在剩下1/3的情况下则是用一种负性的语气写信。例如，一位操流利英语的人（“相似的他人”）用负性语气写的信是这样的：

亲爱的欧文先生：

我找到了您的钱包，如今物归原主。所有东西都在里面。我必须说的是，照看这个钱包和不得不把它还回来确实是一件很不方便的事。归还这个钱包的整个过程实在是很麻烦，我觉得相当恼怒。我希望您会为我付出的努力而感到感激。

另一方面，一位不相似的他人用负性语气写的信是这样的：

亲爱的欧文先生：

我正在你们国家旅行，并不熟悉你们的行为方式。但是我发现了你的钱包，东西都在里面了。

对这个钱包负责并将它物归原主是一件很费劲的事情。其中的过程实在是繁琐，希望你能够对我有所感激。

霍恩斯坦、菲什和霍姆斯（1968）的假设是，当写信者是与自己相似的人时，人们所受到的信中语气的影响会大于写信者是不相似的人的时候（也就是说，他们预测当写信者是与被试相似的人时，正性语气的信会比负性语气的信导致更高的归还率，可是当写信者是不相似的人时，信的语气就不会产生影响）。正如图17.3所示，实际的结果符合研究者的预期。当写信者是本市人时，正性语气的信使人们归还钱包的次数是负性语气的信的7倍。相反，当写信者是一名外国人时，正性语气、负性语气和中性语气的信导致的归还率实际上是一样的。尽管这些结果本身不能说是结论性的，但它们的确支持了费斯汀格（1954）关于人们会从与自己相似的人那里获得行动线索的假设。

社会性痛觉丧失

1978年，肯尼斯·克雷格和肯尼斯·普克钦（Kenneth Craig&Kenneth Prkachin）的研究展示了社会比较能在多大程度上影响人们的知觉。这些研究者发现，当人们把自己与一个有高的疼痛耐受性的人做社会比较时，这种比较实际上会导致人们体验到比其他情况时较少的疼痛感。

在这个研究中，研究者对被试的左前臂进行电击。最开始的时候电击轻微得几乎觉察不到，但随着实验的进行，电击强度一点一点地加大（每次增强0.25毫安）。每次电击后，被试在一个0～100的量表上标出自己觉得不舒服的程度。当他们把某次电击评价为100时，实验就会结束。

这个研究共有2个实验条件：忍耐模范条件和控制条件。在忍耐模范条件下，与每个被试配对的是一名假扮成被试的研究者的同事，他的疼痛评价总是比真正的被试低25％（真正的被试总是先做评价）。在控制的条件下，假扮的被试只是在一旁观察被试，只有真正的被试会评价电击引起的疼痛（这控制了他人在场这一点）。

图17.3　霍恩斯坦、菲什和霍姆斯（1968）进行的研究中，各种实验条件下归还失落钱包的人数百分比。

克雷格和普克钦发现，当被试与忍耐力强的假扮被试一起配对时，被试不仅会有较低的疼痛评价，而且他们真的显得体验到较少的疼痛。在忍耐模范条件下，虽然电击强度提高了，但被试却比控制条件下的被试有较少的心率反应和较低的前臂皮肤电压（这是对生理唤醒的两种测量指标）。因此，社会比较既影响疼痛评价也影响躯体反应（人体真正的生理反应）。

从众

请仔细看看“读者调查”第32题中1、2、3三条线。哪条线的长度与线A一样？如果你和大多数人一样，你会觉得第3条线和A一样长，而且你会几乎毫无疑问地相信自己是对的。

可是如果你是在一个房间里和其他7个人一起判断，而这7个人都一致声称第1条线和A一样长，你又会如何反应呢？你是会坚持自己的判断，还是会屈服于多数人一致的意见？

实际上这就是所罗门·阿施（1951；1955， 11；1956）在他关于从众的经典实验中设计的情境。在他的多数实验里，7～9个男性大学生围着一张桌子就座，然后主试要求他们一起根据一张卡片上的一条“标准”线的长度，从另一种卡片上的三条“比较”线中找出哪一条和“标准”线等长。实验有18轮，每一轮的判断问题都非常简单。一组独立的判断者作为控制组，平均的判断正确率高达99％。被试不知道的是，和他们坐在一起的其他人实际上是主试的同伙。在多数实验中，每组只有一名真正的被试。

在实验的第一轮，标准线的长度是10英寸，三条比较线分别长8英寸、10英寸和8英寸。沿着桌子按顺时针的顺序，每名学生给出自己的判断，每个人都指出10英寸长的比较线与标准线一样长。到这里为止一切都是正常的。

在实验的第二轮，学生看到的标准线是2英寸长，而比较线分别长2英寸、1英寸和1英寸。这次学生们也是毫不费劲地找出了等长的线。

可是到了实验的第三轮，一些奇怪的事情发生了。这一次的标准线长3英寸，但是假扮的被试并没有选3英寸长的比较线，而是一致认为3英寸长的比较线与标准线一样长。那名真正的被试——他总是坐在接近最后发言的某个位置——不知道的是，阿施让假扮的被试在18轮实验中的12轮中都一致地给出错误答案。阿施想看看真正的被试是否会屈服于这种从众的压力。

阿施发现在这12轮实验中，有约1/3轮实验中的被试会从众，即选择主试的同伙一致赞同的错误答案。3/4的被试有不少于一次的从众，而1/3的被试在12轮实验中的一半或更多轮中选择了从众。也就是说，大多数人做出了与自己的判断相反的选择，而且很多人在多数实验中都有从众的表现。

阿施还做了一些略做修改的实验。例如，在一组研究中，他改变了小组的人数（见图17.4）。当被试只与一名主试的同伙一起判断时，他们几乎完全不受同伙错误答案的影响。多数被试几乎在每一轮实验中都回答正确。当被试的判断与2名同伙的意见相反时，被试从众的概率是13％。当被试的判断与3名同伙的意见相反时，被试从众的概率是33％。阿施发现过了这个点以后，从众的概率就不会再上升，尽管后来其他研究者的研究结果显示，在持相反意见的多数被试人数超过3人以后，从众的概率还是会继续上升（Latané&Wolf，1981）。在不考虑这个问题的情况下，一个非常明确的结果就是，当小组人数较少时，多数人的意见已经足以引起较高的从众水平。

在另一组实验中，阿施让另一名真正的、并且一般会给出正确判断的被试坐在第四位发言人的位置上，或者通过让一名会给出正确答案的实验者同伙坐在第四位发言人的位置上，从而打破了多数人一致意见的条件。阿施想看看当多数人的意见不再一致时会发生什么事情。

结果他发现这种做法对被试的反应有很大影响。从众的水平变成原来的四分之一——也就是说，当多数人的意见不一致时，被试从众的次数只是多数人意见一致条件下的约1/4。实际上，阿施发现三个意见一致的多数派对被试判断的影响力，远远超过8个多数派加上一个异议者的条件。这些结果显示，当情境中存在强大的从众压力时，单个异议者会起到较大的作用。

图17.4　在所罗门·阿施关于从众的实验中，他发现三人组的多数意见与大5倍的组的多数意见在导致从众上的效果相似。（Asch， 1951）

少数派影响

1969年，瑟奇·莫斯科维奇（Serge Moscovici）和他的两名同事把阿施的实验范式反转，用于研究少数人对多数人的影响（Moscovici， Large，&Naffrechoux， 1969）。与阿施观察作为多数派的实验者同伙对一两名真正被试的影响不同，莫斯科维奇考察了少数几名实验者同伙对作为多数派的真正被试的影响。莫斯科维奇和他的同事发现，即使在少数派不是特别强大或者没有很高威望的情况下，意见一致的少数派也能产生显著的影响力。

在莫斯科维奇最初完成的一组实验中，每个小组包括2名实验者同伙和4名真正的被试。每个人都坐在一个屏幕前，主试告诉他们这个实验是关于颜色知觉的。然后屏幕上呈现了一系列的幻灯片。在每一轮实验中，小组成员要判断幻灯片的颜色和光强度。所有的幻灯片都是不同强度的蓝色，但是实验者同伙在某些实验中却把它判断为绿色。莫斯科维奇和他的同事发现，被试在8％的实验中做出了和实验者同伙相同的判断，32％的被试把幻灯片颜色判断为绿色的次数不少于一次。相反，控制组的被试在792次判断中只有2次错误地判断为绿色。

因此，莫斯科维奇和他的同事证明了少数人能够对多数人产生显著的影响。但是存在一个前提——少数人的意见必须保持一致和稳定。如果两名实验者同伙随机地把幻灯片判断为蓝色或者绿色（其中1/3次的判断是蓝色），那么被试只在1％的实验中把幻灯片判断为绿色。只有在实验者同伙坚持同一个判断的情况下，少数人才会有显著影响（关于这方面研究的回顾与扩展，见Maass&Clark， 1984；Nemeth， 1986；Nemeth&Chiles， 1988）。

群体盲思

当群体具有凝聚力而且相对不受外界影响的时候，群体忠诚和从众压力会导致欧文·贾尼斯（Irving Janis， 1982）所说的“群体盲思”（groupthink）。贾尼斯对群体盲思的定义是：群体盲思“是指心理活动的效率、对现实的检验以及道德判断的一种退化，这种退化是来自于群体内压力”（p. 9）。群体盲思导致错误决策的最有名的例子就是美国的猪湾事件，在这一事件中，约翰·肯尼迪总统的内阁提出了一个入侵古巴的拙劣建议。更近期一点，詹姆斯·埃瑟和乔安妮·林多尔夫（James Esser&Joanne Lindoerfer， 1989）发现，1986年，美国在不安全的天气条件下发射挑战者号航天飞机的致命决策中就有群体盲思的因素在内。

根据贾尼斯的观点，群体盲思有8个普遍的特征：

群体中大多数或所有成员都抱有一种自己“无懈可击”的错觉，这种错觉导致过分乐观以及过度的冒险。

集体努力对警告采取忽视的态度或者对其进行合理化。

对群体固有的道德观加以毫不质疑的信任。

对提出建议者充满刻板印象，认为他们都太邪恶而不值得与之谈判，或者认为其太弱或太愚蠢而不会构成严重威胁。

任何不赞同多数人意见的群体成员都会感受到压力。

关于全体意见一致的共同错觉。

对与表面上一致的群体意见相背离的想法进行自我审察。

自封的群体“精神保卫者”，使群体远离任何可能破坏群体自满感的信息。

如果一个群体表现出这些迹象，那么它就很有可能受到了群体盲思的影响。关于如何才能避免群体盲思，贾尼斯推荐了几条预防措施。第一而且最重要的是，群体领导应该明确鼓励不同的意见和批评——包括对他们自身观点的批评。第二，群体领导应该避免在一开始就表明自己的个人偏好。杰伊·拉索和保罗·休梅克（Jay Russo&Paul Schoemaker， 1989）观察到一些日本企业正是这样做的，他们开会的时候是由职位最低的群体成员首先发言，然后是职位次低的成员，依此类推。这样一来，群体成员就不会害怕自己的观点与比自己职位高的成员不一致。

第三条预防措施是与其他群体——或者与其他领导——一起考虑同一个问题（这样就可以比较不同的答案）。第四，群体成员应该与受信赖的同事定期对群体进行审议，并且向群体报告讨论的内容。第五，群体应该要求群体外的专家或者有资格的同事参加群体的会议，并且鼓励他们挑战群体的一致意见。事实上，贾尼斯指出，避免群体盲思最好的方法之一就是正式任命某位群体成员担当批评者的角色。每条措施都是使不同的意见合理化，都是在利用持不同意见的少数人所能起到的减少群体盲思的作用。

结论

本章的主题是简单的：由于人类本质上具有社会性，因此他们的判断和决策很容易受到社会因素的影响。即使在独自决策的时候，他们也常常根据他人会做何评价的预期来决定自己的行为。因此，任何时候要对人们的决策和判断作出全面的解释，都必须把社会因素考虑进去。

在某些情况下，这些因素虽然能影响决策，但却没有影响决策背后的判断。例如，很多人会迫于从众压力和群体盲思而做出某个选择，但他们自己本身并不赞同这个选择。在另外一些情况下，判断本身也被歪曲了。例如阿施发现，在他的实验中有少数被试的知觉的确被歪曲了，而且他们并没有意识到多数人的意见影响了自己的判断。类似的，拉坦和达利也发现很多没有做出反应的旁观者，在责任分散的条件下也改变了自己对情境的知觉。正如拉坦和达利（1970， p. 65）所说的：“（这些）被试几乎无一例外地都说如果遇到‘真正’的紧急情况，他们一定会第一个去帮助受害者。”

本章所讨论的社会影响因素只是支配着我们日常生活的很多社会因素中的少数几个。这里只是举例说明，并不是要穷尽所有影响因素。而且，就像在讨论社会性懈怠效应时所显示的那样，社会影响因素既可能妨碍决策与判断，也可能改善决策与判断。第18章将通过比较群体表现和个体表现，继续就这个问题进行讨论。

第18章　群体决策与判断

如果一个群体成功地避免了群体盲思，那么是否就意味着它能比个体做出更好的决策和判断？群体也会和个体一样使用直觉并出现偏差吗？

相对来说，在个体和群体水平上对直觉和偏差进行比较的研究较少，所以没有综述对以上两者加以对比。然而，在已发表的研究中，多数都显示个体和群体在归因和判断时产生的偏差是类似的。本章的第一部分讨论了几种类似情况，接下来的第二部分集中阐述群体和个体的差异。

群体误差和偏差

如第16章所述，基本归因误差是过度地将个体的行为归因于人格或态度等内在特质上。例如，人们通常认为评论反映了作者本人的观点，即使在他们被告知作者是被迫采取这一见解时也是如此（Jones&Harris， 1967）。群体归因误差（group attribution error）是对一个群体做出无根据的内在归因的倾向。首先对群体归因误差这一概念进行阐述的是斯科特·艾利森和戴维·梅西克（Scott Allison&David Messick， 1985， p. 564），他们认为，“基本归因误差和群体归因误差有一个共同的基础，那就是我们倾向于忽略行为的外部决定因素，并且想当然地认为行为和一些内在态度之间存在关联。”他们在研究中发现，被试推断，当一位城市管理者制定出节水措施时，公众会比没有采取措施时更加支持节约用水，尽管几乎没有什么理由可以认为公众立场可被一位政府雇员的决定所影响。黛尼·麦凯（Diane Mackie）和斯科特·艾利森（1987）也报告了类似的发现。

“自我服务”偏差和“群体服务”偏差之间也存在相似的归因。前者指人们把自己的成功归因于内部因素，而把自己的失败归因于外部因素。后者指群体成员把群体的成功归因于群体的内部因素，而把群体的失败归因于群体的外部因素。唐纳德·泰勒和珍妮特·多里亚（Donald Taylor&Janet Doria， 1981）比较了校际运动员的自我服务偏差和群体服务偏差，发现群体服务偏差至少与自我服务偏差程度相当。运动员的群体服务偏差表现为，他们更多地将群体的成功归因于出色的群体合作，而较少将失败归因于糟糕的群体合作。

另一个群体水平的归因偏差是“外群体同质性偏差”（outgroup homogeneity bias）。与人们总是认为自己比别人更具多样性（more varied）一样，群体也认为他们自己的成员比其他群体的成员更具多样性（Mullen&Hu， 1989）。例如，在一个实验中，普林斯顿大学4个学生俱乐部的成员为他们所在群体的成员和其他3个群体的成员打分，评定他们的人格特征，例如内向/外向、傲慢/谦逊、悠闲/紧张等等（Jones， Wood，&Quattrone， 1981）。结果表明，无论哪个群体的学生都把自己群体的成员评价得比其他群体成员更加多样化。

你可能会说：“他们当然会认为自己的群体更加多样化——因为在自己所在的俱乐部里，他们认识更多的成员。”但研究结果表明，外群体同质性偏差与学生认识的群体内和群体外成员数量无关。而且，外群体同质性偏差也发生在那些互相之间有大量接触的群体之间，比如女性和男性之间（Park&Rothbart， 1982）。所以，外群体同质性偏差并不仅仅是熟悉程度不同的结果。

外群体同质性偏差的一个重要结果是加深了刻板印象。由于外群体成员被认为是相对同质的，所以他们的个体性往往被低估了。不幸的是，这种倾向在国际关系中尤为普遍。例如，前苏联领导人安德罗波夫上台时，前美国国家安全顾问布热津斯基写道：“把这些人分为保守派或自由派、鹰派或鸽派、斯大林主义者或非斯大林主义者都是错误的，关键在于他们都是野蛮而且粗暴的”（Schmemann， 1985， March 3， p. 55）。不久以后所发生的事件就证明了布热津斯基犯了多么严重的错误。

很少有研究探讨像可得性和代表性直觉这样的直觉是否也在群体判断中起作用。而在琳达·阿尔戈特等人（Linda Argote， Mark Seabright，&Linda Dyer，1986）的研究中，个体被试和由五人组成的群体解决律师—工程师问题（见第10章），研究者发现，群体比个体更加依赖代表性直觉。斯科特·廷代尔等人（Scott Tindale， Susan Sheffey，&Joseph Filkins， 1990）也发现，当面对类似于读者调查中第1题这样的问题时，四人群体比个体更容易犯连词错误（使用代表性规则的另一个结果）。

所有上述结果意味着什么呢？显然，尽管我们还需要做更多的研究，但这些初步的发现表明，个体水平的直觉和偏差在群体决策和判断中仍然起作用。而且，有时在群体中会出现比个体还大的偏差。以代表性直觉为例，阿戈尔特等人（Argote， Seabright，&Dyer， 1986， p. 74）总结道：“当评定范畴内的全体成员时，群体讨论似乎扩大了个体代表性判断的倾向。”

群体极化

群体讨论容易增强群体成员达成一致的倾向，这种现象称为“群体极化”（group polarization）（Moscovici&Zavalloni， 1969）。首先指出这一现象的研究者是詹姆斯·斯托纳（James Stoner， 1961），他发现，被试在参加群体讨论后，似乎更愿意提倡和拥护冒险的行动了。斯托纳将这一变化称为“风险转移”（risky shift）。在他的实验之后，很多研究对此进行了探索。毕竟，如果群体极化使得群体的冒险性比个体更高，那么这一发现对国家安全、商业和其他由群体做出重大决策的领域都具有深远的意义。

大概有4/5的风险转移实验是这样进行的：首先，被试要完成一份问卷，用于评估他们的冒险倾向。问卷通常选用由内森·科根和迈克尔·沃勒克（Nathan Kogan&Michael Wallach， 1964）编制的“两难选择”问题，问卷描述了12个模拟情境，情境中的主人公需要在冒险行为和保守行为之间做出选择。例如，在一道题目中，一位45岁的会计师要决定是冒心脏外科手术的风险还是让心脏的病情继续恶化（见图18.1）。

在两难选择情境中，被试需要决定当成功概率达到多少时，他们将建议主人公选择冒险行为。这次测量称为前测。然后，大约5名被试组成一个群体，讨论这12个情境，并就每个情境的概率选择达成一致意见。这一阶段称为操作测验。操作测验的平均分与前测平均分的差值就是风险转移的测量值。

虽然这一范式有很多变体，但研究结果相当一致。群体讨论通常使人们提倡更冒险的行为。但当最初的倾向是保守的时，群体讨论有时就可能引起“保守转移”（cautious shift）。因此，很多研究者现在采用“选择转移”（choice shift）这一更加概括的词汇来描述这个现象。

与选择转移研究一样，群体极化研究也延伸到了冒险以外的问题。例如，戴维·迈尔斯和乔治·毕晓普（David Myers&George Bishop， 1970）发现，对种族问题怀有偏见的学生互相讨论了这一话题之后，偏见变得更为强烈；而相对来说对此没有太多偏见的学生相互讨论以后偏见更少了。类似的，迈尔斯（1975）发现，“沙文主义者”和“女权主义者”在各自群体内讨论了女性问题以后，两者间的分歧增大了。这类研究基于“群体构成”（group composition）范式，即群体由具有相同倾向的人构成（这一倾向在群体讨论后得到增强）。

图18.1　内森·科根和迈克尔·沃勒克（1964， pp.256-257）编制的两难选择问卷中的一道题目。

另一类群体极化研究使用这样的范式：问题本身产生了一种倾向，群体讨论使这一倾向极端化。例如，戴维·迈尔斯和马丁·卡普兰（Martin Kaplan，1976）发现，当模拟陪审团仅得到较弱的犯罪证据时，群体讨论使判决更轻；而当陪审团得到确凿的证据时，群体讨论后判罪更重。可见，基于法律证据的初始倾向在经过群体讨论后极端化了（关于群体极化及其原因的综述见Myers，1982；Myers&Lamm， 1976）。

卖马问题

“有人以60美元的价格买了一匹马，并以70美元卖出。然后，他又花80美元钱买回了这匹马，再以90美元卖出。在这匹马的交易中，他共赚了多少钱？”

读者调查中的第20题最早出现在诺曼·梅尔和艾伦·索利姆（Norman Maier&Allen Solem， 1952）的经典研究中。梅尔和索利姆发现，独自解答这个问题时，只有45％的大学生被试能够得出正确的答案。但当学生们组成5人或6人小组时，这一比率有所提高。在领导者不活跃的群体中（领导者仅是观察成员们的讨论），回答的正确率是72％；而在鼓励型领导者的群体中（领导者鼓励所有成员表达想法），正确率是84％。

为了了解一个有效的群体可能如何解决这一问题，让我们来听听发生在梅尔和索利姆实验室中的一次假想的群体讨论吧：

温迪[群体领导]：我想这个问题可能有些迷惑性——也许不像表面上这么简单，而且我不信任心理学家。我们每个人都来讲讲想到的答案吧，再说说为什么这个答案是对的。

贝内特：我非常肯定答案是10美元。我解决这个问题的方法是假定这是股票交易。如果我以60美元一股的价格买进并以70美元的价格卖出，那我就赚了10美元。然后，如果我改变了主意，以80美元一股的价格买进了同一种股票，我就比卖出时的70美元多花了10美元，把先前赚的钱亏掉了。再以90美元的价格售出让我又赚了10美元，所以我得到这个答案。

吉尔：我的答案是20美元，因为这个人第一次卖马赚了10美元，第二次又赚了10美元。但听了贝内特的解释，我不敢肯定我的答案是对的。

温迪：不必担心你是不是对的——我们只是希望听到所有可能的答案。你呢，史蒂文？

史蒂文：我认为正确的答案是30美元。他开始时花60美元买进，最后以90美元卖出，那他的利润不是30美元还会是多少呢？

埃米：如果他不需要借钱的话就确实赚了30美元，但他卖马得到70美元以后，要花80美元买回这匹马，就需要额外的10美元。这样剩下了20美元利润——30美元减去他额外借的10美元。

温迪：这么说你同意吉尔的答案？

埃米：是的。实际上，我想这个问题之所以让人困惑，原因就在于两笔交易用的是同一匹马。如果这道题里有两匹马，答案就很明显了。

贝内特：你的意思是？

埃米：是这样，假设他以60美元买进了A马，又以70美元卖出，他赚了多少钱？

贝内特：10美元。

埃米：现在假设他又买了第二匹马——B马——花了80美元，再以90美元的价格卖出，他赚了多少钱？

贝内特：又是10美元。

埃米：对，所以他最后一共赚了20美元。他的利润与交易的是一匹马还是两匹马无关——无论怎样他都赚了20美元。如果你喜欢用股票交易来想这个问题，那就假定交易的是两种股票而不是一种。不应该认为买进第二种股票花80美元意味着亏掉10美元——卖出比买进的价钱低才是亏了钱。

我们先听到这儿，现在请想像你就是这个群体的一名成员。埃米总结了她的发言以后，轮到你解释你的答案。你发言结束后，整个小组花几分钟来讨论这个问题。然后实验者询问每一名小组成员并记录下最终答案。你可以选择是保留做读者调查时的答案还是改变答案。你会怎样做呢？

大多数人在这样的情况下都会给出正确的答案——20美元。那些在一开始就得出正确答案的成员在后来的讨论中很少改变想法，而其他人通常在群体讨论后改正了答案。虽然梅尔和索利姆（1952）发现，无论群体领导者是否活跃和具有鼓励性，群体表现都胜过个体，但当群体领导者积极地鼓励所有成员与大家分享他们的见解时，正确率是最高的。

当讨论开始时群体里只有一名成员持有正确答案时，鼓励型领导者的作用是最明显的。在这样的情况下，群体中有76％的学生回答正确，而不活跃群体中答对的比率仅为36％。这一发现与上一章的两个结论一致：（1）避免群体盲思的最好方法是明确地鼓励成员发表不同见解（Janis， 1982），以及（2）在这一见解正确的情况下，少数人可显著地提升群体判断的正确率（Nemeth，1986）。

梅尔和索利姆（1952）的研究表明，开放性的讨论可大幅度提高正确率。但在他们的实验中，如果群体中没有一个人的答案是正确的，那么群体讨论也无济于事。开始时，在参加实验的67个群体中，有63个群体内至少有一名成员持有正确答案，但大概有五分之一的被试在群体讨论后仍然回答错误。埃德温·托马斯和克林顿·芬克（Edwin Thomas&Clinton Fink， 1961）用同样的卖马问题做实验也得到了相似的结果。在他们的研究中，群体讨论前，44个群体中有29个群体至少有一位成员持有正确答案，但只有15个群体在讨论后达到了全体正确。所以，群体讨论可以使正确率显著提高，但并不能保证所有群体成员都回答正确。

人多智慧多吗

群体判断在某种程度上比个体判断更为准确，尽管并非一贯如此。群体判断的准确性取决于很多因素，包括任务的性质和难度、群体成员的能力、成员间的互动方式等等。里德·黑斯蒂（Reid Hastie， 1986）发表了一篇综述，对很多影响群体判断的因素进行了总结，并比较了群体和个体在3种不同类型判断任务中的表现：（1）判断数量和大小，例如罐中豆粒的数量；（2）判断逻辑问题，例如卖马问题；（3）判断一般知识性问题，例如“苦艾是一种酒还是一种宝石？”

黑斯蒂总结出，对于数量判断，群体通常比个体稍微准确一些（黑斯蒂估计这一差别大约是1/8个标准差）。珍妮特·斯尼泽克和贝姬·亨利（Janet Sniezek&Becky Henry， 1989， 1990）的研究显示，在某些情况下，群体判断的优势可能比黑斯蒂的估计数要大。他们运用了“标准化偏差”的测量方法，发现3人群体比个体的准确性高23％～32％——是黑斯蒂总结的研究中差别的2～3倍。

对于逻辑问题，黑斯蒂发现，群体通常比个体表现更好，但是群体中最优秀的成员独自解决问题的结果往往好于群体整体。同样，他总结出，在回答一般知识性问题时，群体通常比水平中等的成员表现更好，但群体中最优秀的成员往往超过群体的成绩或与之相当。通过总结这3种判断任务，黑斯蒂发现，群体比其水平居中的成员做出的判断更为准确，但群体中最好的成员经常胜过群体整体。

盖尔·希尔（Gayle Hill， 1982）在一篇题为《群体与个体表现：N＋1是否大于1？》的综述中，也得出了类似的结论。在这篇文章里，希尔总结了50年来关于个体和群体表现的研究。她不仅讨论了二者在判断与决策上的表现，范围还涉及创造力和问题解决等方面。她的结论是，群体通常胜过其中一般的个体，但是群体经常不如其中最优秀的个体。希尔发现，对于容易的任务，增加群体的人数只能增加一个人能独立解决问题的可能性；对于困难的任务，群体合作的主要优势在于，群体成员能够汇聚所有人的资源并纠正他人的错误。

希尔还讨论了头脑风暴法。她比较了群体讨论中产生的想法和同样多的人独自进行头脑风暴得到想法的总和。希尔发现，独自产生想法后汇总要比群体会议更加有效。[1]她总结道，群体讨论的优越性主要在于汇集的功能（也就是仅仅让更多的人来解决问题），而不是实质上的群体互动。从实际的角度来看，这意味着解决难题的最好方法是让几个人独立思考问题然后汇集他们的想法。

独裁的益处

虽然群体判断往往比个体判断准确，但这种准确性部分地取决于群体成员如何整合他们的答案（Davis， 1973）。斯尼泽克（1989）对此进行了探讨，并发表了相关的研究报告，斯尼泽克比较了5种群体决策技术：（1）“一致意见”（consensus），即面对面的讨论，直到形成所有成员都接受的意见；（2）“辩证”技术，即要求群体成员讨论可能导致判断偏差的因素；（3）“独裁者”技术（也称最佳成员技术），即面对面的讨论选择出一位成员，他的判断代表了整个群体；（4）“德尔菲”技术，即群体成员不直接见面，而是以某种顺序循环匿名提供答案，直到形成一致意见或稳定看法（这一技术的优势是避免了个别成员或对自己的判断过于自信的成员垄断讨论）；（5）“集体”技术，即禁止群体成员有任何形式的互动，只是把成员们的判断平均化，得到“群体”判断（在斯尼泽克的研究中，集体技术仅是缺乏社会互动的简单汇总，因而其结果可作为准确性的基线水平）。

每个群体由5名大学生组成，而且每个群体使用全部5种决策技术。从集体技术开始，然后以不同顺序采用其他决策技术。学生们的判断任务是估计一个校园商店下个月将售出多少商品，即服装、杂志、贺卡礼品和健康美容用品的营业额各是多少。斯尼泽克用与实际销售额的“绝对偏差”，来衡量判断准确性。

她发现，前4种技术（一致意见、辩证、独裁者、德尔菲）都比简单汇总（集体技术）的判断准确性高，其中独裁者技术的准确性最高，这一技术降低的绝对偏差是其他技术的3倍。有趣的是，在每个群体中，“独裁者”最后都修改了答案使其更接近集体平均数而使偏差值提高。也就是说，群体能够选出一个判断相当准确的独裁者，但这位独裁者总是变得更加民主，结果反而降低了最终判断的准确性。

当然，斯尼泽克的发现仅是基于来自特定群体（大学生）的特定人数群体（5人）解决特定的判断问题（销量预期），将独裁者技术最优的结论推广到所有情境是不适合的。但斯尼泽克的实验表明，群体判断的准确性部分取决于群体采用的决策规则。她的研究结果也证明，在某些情况下，互动的群体胜过没有互动的群体。所以，至少在有些情境中，群体的优势不仅仅在于“更多的人”而在于“更多的人在一起工作”。

结论

由于群体表现取决于很多不同的因素，所以难以进行高度概括（Tindale，1989）。也是出于同一原因，这些不一致的和相反的研究结果难以综合。哪些因素引发了这些矛盾？是不同的任务，群体人数，还是决策规则？丰富的研究反而使结果的解释更加复杂。

另外的问题是，群体决策和判断没有受到像个体决策和判断那样的重视，尽管委员会、专家小组、董事会、陪审团和其他决策群体极其普遍。而且，个体和群体研究之间的界限常常因群体是由个体组成的而模糊不清。例如，研究群体归因错误的实质上是探讨个体如何对群体进行归因。类似的，选择转移也用群体决策和个体决策的差别加以测量，或对群体讨论前后的个体决策进行比较。只有前一个例子才是真正的群体决策。

尽管如此，群体决策和判断的研究暂有如下结论：

很多个体水平的直觉和偏差在群体中发挥了同样的效力。

群体讨论通常会加强已有倾向。

群体通常比一般的个体表现好一些，尤其是在一名指定的领导者鼓励全体成员发表见解的情况下。

群体中最好的成员通常比群体表现更好（有时可使用独裁者决策技术来利用这一点）。

几个人独自使用头脑风暴法比群体会议更为有效。

上述结论都得到了大量研究的支持，但由于群体表现受多种因素影响，在特定情境中应用这些一般性的结论仍需多加考虑。尽管决策者经常通过会竭尽所能，但合作并不一定是成功的保证。

[1]尽管希尔没有明确指出这一可能性，但社会性懈怠可能部分地导致了这一结果。伊莉莎白·韦尔登和吉纳·加格诺（Elizabeth Weldon&Gina Gargano， 1985， 1988）发现，当人们一起解决复杂的判断任务时，会出现社会性懈怠现象。

《决策与判断》第五部分 决策与判断中的社会性一面

第17章 社会影响