第35章两个自我

第 3 5 章

两个自我

“效用”一词在其漫长的历史中有两种不同的含义。在《道德与立法原理导论》一书中，杰里米·边沁开篇第一句就是名言：“大自然将人类置于两位君主的统治之下，他们就是痛苦和快乐。只有他们才能指示我们应该做什么，并决定我们将要做什么。”在一个令人尴尬的脚注中，边沁为他用“效用”一词来表达苦乐体验而致歉，说他找不到更确切的词了。为了与边沁对该术语的解释区分开，我称其为“体验效用”。

Irving Fisher,“Is‘Utility'the Most Suitable Term for the Concept It Is Used to Denote?”American Economic Review 8 (1918): 335.

在过去的100年里，经济学家一直用“效用”表达其他意思。经济学家和决策理论家用这个术语表达“想要性”，我则称其为“决策效用”。 Irving Fisher,“Is‘Utility'the Most Suitable Term for the Concept It Is Used to Denote?”American Economic Review 8 (1918): 335. 二者的含义并不完全相同。例如，期望效用理论讲的都是支配决策效用的理性规则，与快乐的体验毫不相干。当然，如果人们想要自己的心仪之物，并喜欢自己的所选之物，效用的这两个概念就有了相同的含义——概念重合的假设隐含在一个普遍观念中，即经济主体是理性的。理性的主体应该知道自己现在和未来的偏好，也应该做出使利益最大化的明智决策。

体验效用

我痴迷于探索体验效用和决策效用之间可能的差异，这种痴迷由来已久。在和阿莫斯研究前景理论时，我就构想出一个迷题：想象有个人每天都要打一次很痛的针，这种痛没法适应，每天的痛感都一样。现在出现两种情况，第一种是将计划注射次数从6次减少到4次，第二种是从20次减少到18次，人们会认为这两种改变有同样的价值吗？如果答案是否定的，有合理的理由解释这种差异吗？

我没有收集数据，因为结果显而易见。你可以自己验证，你为注射次数减少1/3（从6次到4次）支付的费用比减少1/10（从20次到18次）要多。在第一种情况下，避免两次注射的决策效用比第二种情况大。相比第二种情况，所有人都会为第一种情况支付更多的费用。但这种差异是荒谬的。如果每天打的针都一样痛，有什么理由依据之前的注射次数，为减少两次疼痛分配不同的效用？以我们现在所用的术语说，这个问题引入了一种观点，即体验效用可以通过注射次数来测量。它还暗示，至少在某些情况下，体验效用是评估决策的标准。决策者为获得相同的体验效用（或避免相同的损失）而支付不同的费用是错误之举。你可能会认为这一观察结果显而易见，但在决策理论中，判断决策有误的唯一依据是与其他偏好不一致。阿莫斯跟我讨论过这个问题，但没有深入研究。多年后，我重新开始研究这个问题。

体验与记忆

Francis Edgeworth, Mathematical Psychics (New York: Kelley, 1881).

如何测量体验效用？我们应该如何回答此类问题，比如“海伦在治疗中受了多少苦？”或“她在海滩上的20分钟享受了多少快乐？”19世纪，英国经济学家弗朗西斯·埃奇沃思曾思考过这个问题，并提出“快乐测量仪”的想法。这是一种想象中的仪器，类似于气象局使用的设备，可以随时测量人们体验的苦乐程度。 Francis Edgeworth, Mathematical Psychics (New York: Kelley, 1881).

Daniel Kahneman, Peter P.Wakker, and Rakesh Sarin,“Back to Bentham? Explorations of Experienced Utility,”Quarterly Journal of Economics 112 (1997): 375-405.Daniel Kahneman,“Experienced Utility and Objective Happiness: A Moment-Based Approach” and “Evaluation by Moments: Past and Future,” in Kahneman and Tversky, Choices, Values, and Frames, 673-92, 693-708.

就像每天的温度或气压一样，体验效用会发生变化，人们可以将其结果绘制成时间函数图。海伦在治疗过程中或度假期间体验了多少痛苦或快乐，“曲线下的面积”就是答案。时间在埃奇沃思的概念中起着关键作用。如果海伦在海滩上度过40分钟，而不是20分钟，她仍感觉很享受，那么在海滩上的总体验效用就会翻倍，就像注射次数翻倍会使注射过程的痛苦加倍一样。这就是埃奇沃思的理论，我们现在已理解了其理论成立的条件。 Daniel Kahneman, Peter P.Wakker, and Rakesh Sarin,“Back to Bentham? Explorations of Experienced Utility,”Quarterly Journal of Economics 112 (1997): 375-405.Daniel Kahneman,“Experienced Utility and Objective Happiness: A Moment- Based Approach” and “Evaluation by Moments: Past and Future,” in Kahneman and Tversky, Choices, Values, and Frames, 673-92, 693-708.

Donald A.Redelmeier and Daniel Kahneman, “PatientsMemories of Painful Medical Treatments: Real-time and Retrospective Evaluations of Two Minimally Invasive Procedures,”Pain 66 (1996): 3-8.

图35-1显示了两名患者接受结肠镜检查时的痛苦体验，来自我和唐·雷德曼尔为一项研究共同设计的实验。雷德曼尔是多伦多大学的医生和研究员，这项实验是他在20世纪90年代初进行的。 Donald A.Redelmeier and Daniel Kahneman, “PatientsMemories of Painful Medical Treatments: Real-time and Retrospective Evaluations of Two Minimally Invasive Procedures,”Pain 66 (1996): 3-8. 现在的结肠镜检查通常使用麻醉剂和失忆药物，但我们收集数据时，这些药物尚未普及。每隔60秒我们会提示患者，让他们表示当时体验的疼痛程度。疼痛程度以0～10来表示，0代表“完全不痛”，10代表“无法忍受的痛”。你可以看到，患者在检查过程中的体验有很大差异。患者A持续了8分钟，患者B持续了24分钟（最后一次0级疼痛是在检查结束后记录的）。共有154名患者参与了实验，检查时间最短4分钟，最长69分钟。

接下来，请思考一个简单的问题：假设两位患者使用相似的疼痛量表，哪位患者更痛苦？答案毫无争议。人们普遍认为患者B更痛苦。在任意等级的疼痛中，患者B忍受的时间至少与患者A一样长，而且患者B的“曲线下的面积”明显大于患者A。当然，关键在于患者B的检查时间要长得多。我将多次短暂疼痛的报告总量称为“快乐测量仪总值”。

图35-1

检查结束后，我们要求所有参与者为其体验的“疼痛总值”打分。这样的措辞是为了鼓励他们考虑自己所报告的疼痛的整体体验，回想快乐测量仪总值。出乎意料的是，患者并没有这么做。统计分析揭示了两个发现，说明了我们在其他实验中观察到的一种模式：

· 峰终定律：通过在最痛时和结束时报告的疼痛程度平均值，我们可以准确预测整体回顾性评估。

· 时长忽视：检查的时长对疼痛总值的评分没有任何影响。

现在，你可以将这两个规则运用于患者A和患者B。两位患者的最差评分（10分制中打了8分）相同，但在检查结束前，患者A的最后一次评分为7分，患者B只有1分。因此，患者A和患者B的峰终平均值分别为7.5分和4.5分。不出所料，患者A对检查的记忆比患者B痛苦得多。患者A的运气不好，检查在痛苦的时刻结束，给他留下了不愉快的记忆。

现在我们陷入了“富裕的困境”：测量体验效用的两种标准（快乐测量仪总值和回顾性评估）的差异是系统性的。快乐测量仪总值是由观察者根据个人对多次瞬间体验的报告计算得出的。我们将这些判断称为“时长分量”，因为在计算“曲线下的面积”时，我们为所有时刻分配了相等的分量：两分钟9级的疼痛是一分钟9级疼痛的两倍。然而，该实验和其他实验的结果表明，回顾性评估对时长不敏感，而两个特殊时刻（巅峰和结尾）的分量远大于其他时刻。那么，应该看重哪一个？医生应该怎么做？这个选择对医学实践具有启示意义。我们注意到：

· 如果目标是减少患者的疼痛记忆，那么降低疼痛的峰值可能比缩短检查时间更重要。同理，如果目标是给患者留下较好的回忆，那么逐渐缓解疼痛可能比突然终止疼痛要好，这样，检查结束时的疼痛是比较轻的。

· 如果目标是减少患者实际体验的疼痛总量，那么快速完成检查可能比较好，即使这样会增加疼痛的峰值，给患者留下痛苦的回忆。

你觉得哪个目标更令人信服？我没进行过调查，但我的印象是，绝大多数人倾向于减少疼痛的记忆。我发现，将这种困境视为两个自我之间的利益冲突是有帮助的（这两个自我与我们熟悉的系统1和系统2没有对应关系）。体验自我回答的是：“现在疼吗？”记忆自我回答的是：“总体感觉怎么样？”记忆是我们保存的所有生活体验，因而，在想到自己的生活时，我们可以采用的唯一视角是记忆自我。

我主持过一个讲座，说明记忆和体验的区分困难。讲座结束后，一位听众发表了自己的看法。他说，自己曾全神贯注地听唱片里播放的交响乐，接近尾声时，唱片因刮痕发出刺耳的声音。他说，糟糕的尾声“毁了全部体验”。但实际上毁掉的并不是体验，而是与它有关的记忆。体验自我有过一段近乎完美的体验，糟糕的结局无法将其抹去，因为它已经发生了。这位听众给整段经历打了一个不及格的分数，因为它的结尾很糟糕，但这个分数忽视了前面40分钟的音乐享受。实际体验难道毫无意义吗？

将体验与对体验的记忆混为一谈，这是难以抵御的认知错觉——正是这种替代让我们相信过去的体验可以被毁掉。体验自我没有发言权。记忆自我有时是错的，但它负责记分，掌控我们的生活经验，也是最终的决策者。我们从经历中学到的是，最大限度地提高未来记忆的质量，而不一定是未来体验的质量。这就是记忆自我的蛮横之处。

哪个自我重要？

为了展现记忆自我的决策力，我和同事们设计了一个稍微有些折磨人的实验，我称之为冷手情境（它有一个令人不快的专业术语：冷加压）。我们要求受试者将一只手浸入冷水中，水要没过手腕，直到接到指令才能将手拿出来，然后递给他们一条温热的毛巾。在我们的实验中，受试者用另一只手控制键盘上的箭头，连续记录他们所忍受的痛苦，这是其体验自我的直接表达。我们选择的水温能引起中等强度的疼痛，但可以忍受。当然，志愿加入的受试者随时可以把手拿出来，但没有人这样做。

每个受试者都忍受了两次冷手经历：

短时经历是把手浸泡在14摄氏度的水中60秒，这种寒冷体验令人痛苦，但可以忍受。60秒结束时，研究人员告诉受试者把手从水中拿出来，然后递给他们一条温热的毛巾。

长时经历持续了90秒。前60秒与短时经历完全相同。60秒结束时，研究人员什么也没说，而是打开水龙头，让温度稍高的水流入盆中。在后30秒内，水温上升了约1摄氏度，刚好能让大多数受试者感到痛苦稍微减轻了些。

Daniel Kahneman, Barbara L.Frederickson, Charles A.Schreiber, and Donald A.Redelmeier,“When More Pain Is Preferred to Less: Adding a Better End,”Psychological Science 4 (1993): 401-405.

我们告诉受试者，要进行三次冷手实验，但事实上，他们只体验了短时和长时经历，两次浸入水中的是不同的手。实验间隔7分钟。第二次实验后7分钟，受试者可以选择第三次实验。受试者被告知，前面两次实验中的某一次要被准确复制，他们可以自由选择以左手还是右手重复这次体验。 Daniel Kahneman, Barbara L.Frederickson, Charles A.Schreiber, and Donald A.Redelmeier,“When More Pain Is Preferred to Less: Adding a Better End,”Psychological Science 4 (1993): 401-405. 当然，一半受试者用左手进行短时实验，另一半受试者用右手；一半受试者先进行短时实验，另一半受试者先进行长时实验；等等。这是一个精心控制的实验。

该实验旨在创造体验自我和记忆自我之间的利益冲突，以及体验效用和决策效用之间的冲突。从体验自我的角度来看，长时实验显然更糟糕。我们期望记忆自我会有另外的看法。“峰终定律”预测短时实验的记忆体验比长时实验差，“时长忽视”预测90秒和60秒之间的疼痛差异会被忽视。因此，我们预测受试者会偏好（或不那么讨厌）长时实验的记忆，并选择再次体验它。果然如此。80%的受试者报告说，在其选择重复体验的长时经历中，他们的疼痛在最后阶段减轻了，因而表示自己愿意在第三次实验中承受30秒不必要的痛苦。

偏好长时体验的受试者不是自虐狂，也不是故意让自己处于较差的体验中，他们只是犯了一个错误。如果我们问他们：“你选择将手浸在水中90秒，还是只在前60秒把手浸在水中？”他们肯定会选择时间较短的选项。然而，我们没有这么问，受试者随性而为，选择重复负面记忆较少的经历。受试者非常清楚两次经历哪次较长（我们问过他们），但他们没有运用这一认知。他们的决定取决于简单的直觉选择规则：选择自己最喜欢的或最不讨厌的。记忆规则决定了他们讨厌这两个选项的程度，继而决定了他们的选择。就像我之前提到的打针难题一样，冷手实验揭示了决策效用和体验效用的差异。

前面的章节提到了“少即是多”效应，我们在冷手实验中观察到的偏好是该效应的另一个例子。有个例子来自奚恺元的实验，在24个盘子的套装中添加盘子会降低其总价值，因为添加的几个盘子有破损。另一个例子是琳达问题，她是一位激进的女士，人们认为她更可能是女权主义的银行出纳员，而不是银行出纳员。这三种情况的类似结果并非出于偶然，它们都可以用系统1运作的同一个特征来解释：系统1通过平均值、常态和原型表示集合，而不是通过总和表示集合。每次冷手经历都是一组瞬间，记忆自我将其储存为一个典型瞬间，这导致了冲突。对客观的观察者来说，依据体验自我的报告评估这一经历，重要的是“曲线下的面积”，那是全部时间内所有的痛苦，具有总和的性质。相反，记忆自我留住的记忆是代表性时刻，受到巅峰和结尾的强烈影响。

Orval H.Mowrer and L.N.Solomon,“Contiguity vs. Drive Reduction in Conditioned Fear: The Proximity and Abruptness of Drive Reduction,”American Journal of Psychology 67 (1954): 15-25.

当然，进化本可以将动物的记忆设计为整体存储的形式，在某些情况下也确实如此。对松鼠来说，“知道”储存的食物总量很重要，而坚果平均大小的表征并非好的替代选择。然而，从生物学角度看，痛苦或快乐随时间推移产生的整体体验可能不那么重要。例如，我们知道，老鼠对快乐和痛苦都表现出“时长忽视”。在一项实验中，老鼠一直暴露在事件依次发生的环境中——光一出现，电击随即就到。老鼠很快学会对光产生恐惧，其恐惧强度可以通过几种生理反应来测量。实验的主要发现是，电击的持续时间对恐惧几乎没有影响——重要的是痛苦刺激的强度。 Orval H.Mowrer and L.N.Solomon,“Contiguity vs. Drive Reduction in Conditioned Fear: The Proximity and Abruptness of Drive Reduction,”American Journal of Psychology 67 (1954): 15-25.

Peter Shizgal,“On the Neural Computation of Utility: Implications from Studies of Brain Stimulation Reward,”in Well-Being: The Foundations of Hedonic Psychology, ed.Daniel Kahneman, Edward Diener, and Norbert Schwarz (New York: Russell Sage Foundation, 1999), 500-24.

其他经典研究表明，对老鼠大脑中特定区域（以及人脑中相应区域）的电刺激会产生强烈的快感。在某些情况下，这种快感非常强烈，以至于老鼠不停地按压杠杆来刺激大脑，最后活活饿死。愉快的电刺激可以有不同的强度和时长。再说一遍，只有强度才重要。在某种程度上，延长刺激出现的时间似乎不会增强动物对刺激的渴望。控制人类记忆自我的规则有着悠久的进化史。 Peter Shizgal,“On the Neural Computation of Utility: Implications from Studies of Brain Stimulation Reward,”in Well-Being: The Foundations of Hedonic Psychology, ed.Daniel Kahneman, Edward Diener, and Norbert Schwarz (New York: Russell Sage Foundation, 1999), 500-24.

生理与理性

几年前困扰我的打针难题中最有用的想法是，对于多次同样痛苦的注射，其体验效用可以用注射次数来测量。如果所有的注射都一样令人厌恶，那么20次的痛苦程度是10次的两倍，从20次减少到18次和从6次减少到4次具有同样的价值。如果决策效用与体验效用不符，那么决策就有问题。同样的逻辑在冷手实验中也得到了验证：90秒的痛苦比60秒的痛苦更糟糕，如果人们自愿选择忍受更长的经历，那么他们的决策就有问题了。在我早期的打针难题中，决策和体验之间的差异源于敏感性递减：相比6次和4次的注射差异，18次和20次的注射差异没有那么令人印象深刻，价值也显得较低。人们在冷手实验中的错误选择反映了记忆的两个原则：时长忽视和峰终定律。它们的机制不同，但结果是一样的：决策与体验背道而驰。

对于理性选择的信徒来说，无法带来最佳体验的决策和对未来感受的错误预测都是坏消息。冷手实验表明，我们不能完全相信偏好会反映自身利益，即使偏好基于个人体验，即使对体验的记忆是在前15分钟内形成的！偏好和决策是由记忆塑造的，而记忆可能出错。理性主体模型的基础是，人的偏好是一致的，而且人知道如何充分利用这些偏好。证据对这一观点提出了重大挑战。不一致性深深根植于我们的大脑。我们对苦乐的时长有强烈的偏好。我们希望痛苦稍纵即逝，快乐悠远绵长。但进化让我们的记忆（系统1的功能）留住的是苦乐的巅峰时刻，以及体验结束时的感受。记忆不重视持续时间，不会让我们偏好长期快乐和短期痛苦。

谈谈两个自我

“你完全从记忆自我的角度看待失败的婚姻。离婚就像尾声刺耳的交响乐——结局糟糕并不意味着一切都很糟糕。”

“这是时长忽视的糟糕案例。你赋予好坏体验同等的分量，尽管好体验的时长是坏体验的10倍。”

第35章 两个自我

第35章两个自我