首页   >   新闻   >   文章

《思考快与慢》读书笔记之三:用贝叶斯避免谬误
- 2021 -
07/03
00:00
零号员工
发表时间:2021.07.03     作者:Jingyi Li     来源:ShoelessCai     阅读:1990


摘要

本人于2021年6月读完《思考快与慢》,一方面出于重新整理思考快与慢的思路,整本书对于人类大脑的活动有很多启发示的见解,但由于作者写作习惯,使得这些观点备嵌在叙述中,不利于记忆;另一方面,通过整理笔记的方式,真正达到读懂书,运用其中观点的程度。

关于作者。丹尼尔·卡尼曼(Daniel Khaneman)普林斯顿大学心理学及公共事务的荣誉教授,2002年获得诺贝尔经济学奖。

下载全文


9.可得性启发、焦虑情绪、效用层叠

第12、13章提出了三个概念,为后续理论铺垫。基于启发性问题的感知力、具体性,可得性启发仍然是用更加简洁、可被感知的问题,替代原来的目标问题。可得性启发的提出,用以解释人们在搜集资料时,更关注资料内容本身,还是关注搜集资料的轻松程度。

悖论案例一,依据做事难易程度判断。被试者要求列举自己果断行事的案例,列举6个或者12个。结果,列举12件果断案例的人比列举6件事的人,觉得自己更不果断。列举12件表现不够果断案例的被试者,觉得自己非常果断。这个悖论在于,被试者依据搜集资料的难易程度,判断自己的果断程度。虽然无法保证列举12件果断行事案例的被试者会比列举6件的更加果断,至少能列举出12件果断行事案例的人,实际上果断的概率更高。同样地,列举出12件表现不够果断案例的被试者,显然是不够果断的(如果对果断定义没有误解的话),而受试者却认为自己很果断。都证明了,该调查中,被试者依据做事的体验来判断自己果断的程度。

悖论案例二,依据搜集资料的内容判断。实验要求被试者列举生活中对心脏不好的危险事件(回想危险性行为),以及避免心脏健康问题的安全做法(回想保护性行为)。有意思的是,对于没有心脏病家族史的人来说,回想危险性行为的受试者认为自己更加安全,回想保护性行的受试者认为自己处于危险之中。而有心脏病家族史的受试者,回想危险行为让他们觉得危险,回想保护性措施让他们觉得安全。联系系统1和系统2理论,通常调取经验进行判断,几乎不加思考地做出决断是系统1的任务,此时获取资料的内容影响着决策者,这可以解释为什么有心脏病史的人在回想危险案例时候觉得更加危险,因为体验和经验很容易被系统1调取并还原。然而,应对未知问题,则需要系统2出面进行计算和推演,因为系统1无法从经验中直接获取资料。系统2是复杂的、统筹的、懒惰的。对于没有心脏病史的受试者,搜集危险案例时候的经验是无实际体验的,是需要系统2外推的,而系统2则认为已经处理了危险情绪,原本的危险警报解除了,从受试者的整体体验来说,就会觉得更加安全。

情绪方面,人们形成观点和做出的选择,直接表达出情感的基本取舍,这些行为是完全无意识情形下做出的。情感启发为替代的一种,而决策前不考虑情感因素的决策者,可能大脑有损伤。

何为效用层叠(Availability Cascade)?简言之,可以总结为媒体与社会情绪不断相互作用,使得认知偏见产生。由于焦虑情绪会产生传染效应。对风险带有偏见的反应是导致公共政策中优先处理权不稳定和错位的重要原因。立法者和监管人员对民众的无理要求很可能会反应过度,因为他们有很强的政治敏感性,也因为他们和其他民众一样,容易抱有同样的认知偏见。法学家Timur Kurnan将偏见嵌入政策机制的现象起了名字,叫效用层叠。

举个例子,1989年有一种叫做艾拉的化学品,被用于喷洒苹果以挑战苹果的成长周期,还能改善外观。而媒体的报道则称,该化学用品用量大,可导致大老鼠和家鼠得癌症,恐慌便由此引发。报导引发公众恐慌情绪,这些恐慌继续促使媒体争相报道,这就是效用层叠的基本机制。作者关于政府风险政策的观点是,除了保护民众不受到危害之外,也需要努力保护公众不受恐慌情绪影响。


10.让直觉更有效:用贝叶斯公式估测,因果关系,回归效应

第14-17章,用贝叶斯公式解释了人们如何出现估测谬误,一是忽略基础比例,二是形成合取谬误。第18章解释了让直觉更有效的机制。

作者提出人们总是喜欢忽略基础比例,即公式中的P{第i个学院人数},割裂地判断某个人的专业。Tom,智商高、干净整洁、缺乏创造力,摆放物品规规矩矩。如果互联基础比例,人们很容易联想Tom属于计算机系或者图书馆系,但如果Tom属于文科学校,计算机系招手人数只有全校的5%,Tom属于计算机系的概率仍然是最高的吗?贝叶斯公式告诉你,未知,需要计算。下列公式中CS表示计算机系。





作者在哈佛大学做的实验显示,在对系统2进行干预之后,可以提高回答Tom院系的准确率。实质上,是增强系统2的作用,减少人们对直觉的依赖,避免忽略基础比例。如何激活系统2呢?用一个实验说明。作者要求学生一半鼓起腮帮,一半皱起眉头,结果皱起眉头的受试组对基础比例更加敏感,更少学生忽略关键因素,皱眉头可使认知紧张,可以激活系统2。

论证一名普通职员的社会效应,作者发现,人们很容易犯合区谬误(Conjunction Fallacy)。简言之,就是人们会认为两个事件联合出现的概率,高于某个事件单独出现的概率。而统计学知识告诉我们,显然前者的概率更小。作者以琳达为例,琳达是一名普通的银行出纳员吗?抑或,琳达是一名银行出纳员,同时还积极参与女权运动?作者对几所重点大学的学生进行调研,其中85-90%的学生选择了后者——合取谬误,有悖于逻辑。



深入研究之后,得出两个初步结论。第一,人们对于更详细、内容更丰富的事件,会给出更高的主观概率,即便不符合逻辑。第二,只有在另一个事件与社会活动相关时,才会出现合取谬误,如果合取的另一事件为“有金色头发”或者“走路上班”都无法使得受试者犯合取谬误,作者给出的解释是,另一个事件并未提供更详细、更丰富的信息。

要少而好,无需多余的破损。芝加哥大学Christopher Hsee在清仓大甩卖时出售两套餐具:A套,三个器件完好,两个破损;B套,三个器件完好(与A的一模一样)。你猜学生们会怎么标价?答案是,A套23美元,B套33美元。显然,人们宁愿要完好的,也不愿多几个破损的器件,这个定价是直觉反应。这个实验引出一个很有意思的结论:“对于贵重的产品,如果还附上一个便宜的小礼物,这样整套产品就不那么吸引人了”。作者称之为,少即是多。

丹尼尔认为,人们的思维定势通常在因果关系里,所谓思维定势,可以认为是人们关于不同范畴事物的看法。社会规范往往反对思维定势,包括对整体概述的否定,对于建立一个更文明、更平等的社会大有益处。

另有一项实验,让耶鲁大学学生预测每个学生考试通过率,被试者分为两组,控制的变量是关于通过率的基础比例(先验概率),一组被告知考生有75%可通过,另一组被告知只有25%可通过。结果,高成功率情境(75%通过率),被试者估算每个学生的考试通过概率要高于高失败情境(25%通过率)被试者估算的概率。作者认为,这是基础比例的不同,影响了被试者估算过程,换言之,在高失败情境下,做出估算本身就很难。将这个问题变为统计学问题还是很好理解的,在标记为1的样本中,在标记为1的比例很小的时候,测准标记为1的概率会降低。

关于技能训练,相较于对表现良好的奖励,对错误的惩罚显得更有用。作者基于研究给出一个反直觉结论,从统计学角度看,人们却因为对人友好而受到惩罚,因为举止无礼而受到嘉奖。这段文字,作者阐述各种表现回归均值的现象。回归现象看似很像因果关系实则不是。试想某记者杜撰标题如下:

抑郁儿童喝了某种功能饮料,其情况在3个月内得到很大改善


而事实上呢?事实上,让这些抑郁儿童每天倒立10分钟,抑或抱着猫20分钟,一段时间之后这些儿童情况也会好转。而不知道具体措施的读者,会认为功能饮料和抑郁情况好转之间,具有某种因果关系,但是实则只是一种相关关系。因此,回归也是相关关系。

现在,我们已经知道大脑如何运作,知道大脑如何出现错误直觉(自我认知和自我损耗、理性和智力,联想让直觉出现偏差,隐藏选择),也看到丹尼尔从概率统计的计算角度,用数值证明了人们如何出现估测谬误(小数定律、锚定效应,贝叶斯公式,因果关系,回归效应),加之情绪影响,使判断和决策出现偏差(可得性启发、焦虑情绪、效应层叠)。

第18章,作者提出直觉有两种类型,涉及系统1的共同合作。有些直觉依靠反复训练获得技能,例如象棋高手。有些直觉起初难以进行归类和区分,受启发较多,通常用简单问题替代较为复杂的问题。作者将预测和估测区分开来,而很多通过数据认知世界的其他书籍作者,并没有将预测和估测区分。在被问及预测问题时候,许多人会将预测替代对原问题的估测。既然很多问题都有回归现象出现,那估测原问题最好的方式,是用回归均值的方式。笔者注,均值是估测问题的一种方式,虽然超过一半的问题,利用线性回归确实也能解释。

直觉性预测总是过于自信、过于极端。而修正直觉性预测(系统1几乎不分析而得出的结论)是系统2的任务。然而,对于未知事物找到参照物,找到标杆修正自己的认知,实际上是非常困难而且耗费精力的,除非非常必要,通常人们都不会这么做,因此便接受了极端的、过于自信的直觉,而对事物产生错误的认知。

作者提出了一个解决方案。首先,理解“无偏见预测”,特征是只有在信息非常有效时才允许人们对罕见或极端的事件做出预测。其次,如果你希望预测有效,那你的预测一定不会太离谱或偏离平均值太多。对理性人来说,无偏见且适度的预测不该引发问题,毕竟理性的风险资本家知道,即便最有前景的新建公司,其成功率也只是中等水平而已。预测公司不应该受到某个数字约束,如果风险资本家认为项目成功率极高,回报足够大,那他便会在该公司快倒闭时投一大笔钱,而不是修改和提高项目的成功率。

一如前述,小样本更容易发现极端结果,也更容易出现和大数据相反的结果。然而,信息不足时候,极端预测和预测罕见事情的意愿都源于系统1。有意思的是,系统1形成过于自信的判断似乎是正常的事,自信是源于判断者从可得的信息提炼出的最合理部分所拼凑出故事的连贯程度决定的,当信息有限且出现极端情况时候,再连贯的故事也只是构造出错误的判断,而判断者却会对此坚信不已。


11.可知与不可知,直觉判断与公式计算

纳西姆·塔勒布在畅销书《黑天鹅》中提出“叙事谬误”:人类常常为过去的憾事编造牵强的解释并信以为真,以此来蒙骗自己。丹尼尔认为,谷歌(或其他上市企业)的成功具有偶然性,运气成分更多——创始人是没有机会学习建立公司的,更少有机会学习如何避开潜在风险,公司能成功应该更多归因于运气。然而,如果一件事成功过程中运气成分更多,是很难从中学习的。

后见之明对决策者的评估有负面影响。“我早知道”现象就是后见之明,让旁观者不以过程的合理性判断决策者行为,而是以结果好坏作为判断标准。举个例子,一件很简单的事情没有做成的时候,人们倾向于认为这件事本身很难,而不是执行有问题。

结果偏见。结果很糟糕时,客户会责备代理人没有看清墙上的笔迹——却忘了这笔迹原是用隐形墨水写的,只有在事后才能变得清晰可辨。事前感觉很谨慎的行动,在事后看也显得很不负责,这是由于过程中带入了新信息,而非决策者的决策或统筹能力有问题。

结果越糟糕,后见之明偏见就越严重,所产生的社会成本不容忽视。遇到诸如911这类重大灾难,人们尤其容易相信,是因为未能预见这场灾难的官员玩忽职守,却没人能证明造成重大事件的要素能在事前被感知。当然,后见之明也有正面效应。例如,某将军在几次冒险获得成功后,被称为“极富远见,英勇果敢”。

“光环效应”让人们把因果关系抛诸脑后,作者认为这使得商业传奇类书籍似乎不那么起作用。丹尼尔更加看重运气的重要性,人们很难从运气中学习。那些非常成功和不怎么成功的公司在对比过程中体现的高度一致模式,不存在不可测因素,对这些公司建立有规律的模型本身就是无从谈起。柯林斯忽略了运气的决定性力量和回归不可避免性,过去20年里(2016年起),评级最差的公司比最受推崇的公司股票收益更高。

丹尼尔论述那么多上市或未上市公司,是否有规律去找一条成功之道?关于这一点,笔者还是有不同见解。第一,作者仅以“赚钱”为衡量维度,对于企业来说太单一了,许多企业在决策过程中纳入许多其他考虑因素。第二,丹尼尔在论述如何对比成功与不成功的公司的时候,并没有阐明体现高度一致的是什么?仅仅把企业成功因素归结于运气,事实上是很不合适的,当然商业书籍是否有用是另一个命题。

有效性错觉。人们在判断错之后,不会削减自己对未来预测能力的信心。自信是一种感觉,反映出信息本身和人们处理信息时认知放松的一致性。例如,信息内容越积极且认知放松程度越高,人们会感觉判断越自信。也因此,有人声称自己对某项事件预测信心满满,只能说明在他脑海里已经构建了连贯的情节,虽然该情节未必真实。

上文提到的后见之明、结果偏见、光环效应、有效性错觉,都为了说一件事情,很多时候,复杂的模型不如回归本质。在论述为什么专家预测有时候还不如简单运算准则?保罗·米尔(Paul Meehl),明尼苏达大学心理学家,猜测其中一个原因是专家试图变得聪明,试图跳出思维局限,考虑不同复杂特征——越是复杂的描述,越容易降低准确性。专家预测不准确的另一个原因是,越复杂的模型,人们对模型的理解越难以达到一致。在一些实验之后研究者认为,想要预测准确,最终结果应该由公式给出,在低效的情况下越是如此。

盲审,笔者所起的名字,丹尼尔成为“闭上眼睛”的直觉。案例是,以色列国防军试图测是新兵综合素质总是不得要领,作者发展了一套测试系统,评估几个相关特征,每个特征单独打分。评价系统是一张二维表格,表格中的分值1-5表示程度。行要素体现士兵作战能力特征,例如责任心、社交能力、男子气概等;列要素体现士兵生活维度,例如之前做过几份工作、工作学习是否准时、和朋友交往频率、兴趣爱好、参加过的运动。为了消除第一印象偏见,作者说行要素(作战能力特征)按照一定顺序进行测试,评价分值范围1-5。



面试官打分的时候,被要求别担心新兵未来发展,闭上眼睛,没有偏见地打分,再等权相加。多年之后,不但发现评分体系几乎和现实一致,面试官“闭上眼睛”的直觉也很准,即便是非正式遴选,面试官也能依据直觉选出合适的人选——不要简单地相信直觉,无论是自己的还是他人的,也不要完全抛开它。


12.如何相信直觉,外部意见,谨慎乐观

直觉获得。丹尼尔认为直觉涉及系统1和系统2,直觉来自于经验,来自于自己的认知。直觉可以通过练习习得,可习得希望,也可习得恐惧,而习得恐惧更容易被感知。以象棋选手为例,各项研究表明,想要达到高水平至少需要10000小时的专注练习,大约是6年里每天练习5个小时,并保证注意力高度集中。

自信并不意味着可以测准。丹尼尔研究人们自信的来源,一是认知处于放松状态,二是预测与真实具有一致性。考察人们自信的原因来自于哪个要素,可以判断这种自信的可靠程度。另一种判断自信(直觉)准确的方式,也是考察两个基本条件,一是环境是可预测的、有规律可遵循的;二是可通过长期训练学习这些规律,至少有一次学习这类规律的机会。满足上述两个条件,便可培养较为准确的直觉判断。

环境缺乏规律时,不要相信直觉。在一个不可预知的世界里,出现预测错误是无可厚非的。无规律的环境,其意外要素所起的作用更大,使得人们无法判别造成结果的原因是什么。在有序环境中,意外要素会被刻意的人类活动所消除。因此,环境缺乏规律,别信直觉,信数据。一致性判断,需关注样本是否有偏。判断者自信满满时,往往能测准,但需要警戒一种情况,即主体只记得测准案例,而忽略的测不准案例。丹尼尔称,临床心理学家、股票投资者、经济学者都掌握了各自领域的直觉性技能,却不能鉴别因直觉错误导致的情境和任务。

为了更好的决策,需要积极采纳外部意见。作者在采取意见的时候,并不是通过公开会议的形式,而是通过私下搜集意见,再统一汇总到黑板上进行讨论。总结三个结论,一是意见搜集形式有内部意见和外部意见;二是作者花了8年完成一本从未被使用的书,而起初的估计是2年;三是基于第二点,作者花的8年属于“非理性坚持”。

谨慎乐观心态。爱丁堡的新苏格兰大厦从1997年预算4000万,到2003年以4.31亿英镑竣工,该事件表明,人们对于现实状况的判断会过度自信,由此造成的成本高昂。作者看来,时间超支和预算超支都属于“非理性坚持”的后果,而造成这种情况,一方面由于心态过于乐观,另一方面,由于缺乏计划,如果项目组制定现实的计划并严格按照计划执行,最终就不会花那么多钱了。

乐观主义陷阱。作者引用塔勒布的话,对环境的不确定性了解不足,必然导致经济行为人承担原本不必要的风险。积极心理学之父塞利格曼的观点:乐观包括对成功嘉奖和对失败少加指责,这是可以被训练出来的。另外,不爱夸大自己重要性的人,在反复面对失败和挫折面前会一蹶不振,这也是许多研究人员的结局。总得来说,乐观使得一些原本小概率事件的成功率增加。自信来源于人们构建的连贯故事,而非支持故事真实性的证据数量和质量决定的。决策者对于未来有自信和事情真正能落实,仍然有相当长的距离。

事前验尸。流程十分简单,一个机构即将做出重要决定但尚未下达决定时,召集涉及决策所有人开一次简短会议。开启简短演说,如果一年之后项目组实施了现有计划,并且失败了,用5-10分钟写下惨败的理由。这种方法的优点是,引发了怀疑,刺激决策支持者去探寻他们未考虑到但可能存在的情况。



原文链接



长按/扫码,有您的支持,我们会更加努力!









TOP 5 精选

       



回到顶部   回上一级
写文章

最新资讯




直播笔记


热点话题


精品论文


有你的鼓励
ShoelessCai 将更努力





文档免费。保护知识产权,保护创新。