一个孤独的科学家在自己的实验室一直工作到深夜,不断地组装着自己的创造物,然后面向全世界发行这一富有影响力的作品!

游戏奖励的心理学原理

来自 游戏邦 2013-12-20 深度

——学习笔记:斯金纳箱

他并不是一个科学怪人,他只是在研究行为游戏设计!

[ 转载自 游戏邦 ]

澳门太阳集团 1

在过去2年里,我有幸在Tiltfactor与Geoff
Kaufman博士一起工作,他是社交心理学领域的哲学博士,也是我们的实验室研究的的领导者。除了具有一些独到的见解外,他也对我们所开发的一些游戏进行了正式的研究,我也学到了许多有关心理学的内容,并形成了许多有关它是如何影响游戏的理论,同时还列出了游戏设计师们必须牢记的一些要点。最近我投入了大量时间去研究游戏设计中一个备受争议的心理话题,即奖励安排,以及这与心理学家所谓的“过度合理化效应”有何关系。如果你从未听说过这些内容也没关系!我将在讨论它们对于游戏设计师的意义前先进行解释。

显然这些理论都适用于数字游戏和桌面角色扮演游戏,所以所有类型的游戏设计师都需要理解它们,特别是在传统桌面游戏和纸牌游戏日趋数字化的时代里。

奖励安排

在20世纪30年代,哈佛大学的一位心理学家Burrhus Frederic B. F.
Skinner创造了一个操作性条件反射室(游戏邦注:也就是著名的“斯金纳箱”)。该理念很简单:将一只老鼠放在箱子里。让老鼠拉动箱子里的杠杆。有时候提供给老鼠一些食物让它去拉动杠杆。研究怎样的条件能让老鼠更频繁地拉动杠杆。

澳门太阳集团 2

当然,斯金纳箱也包含冲击生物的能力,因为科学家就是这样的。

当你着眼于斯金纳箱与其它心理学家发现什么时,这一应用在游戏设计中将变得更加明确。在鸽子身上做实验的时候,研究者发现当鸽子只有一次接收奖励的机会时,它们会更频繁地推动刚刚。当它们获得奖励的机会是50%时,它们是最活跃的。这是一种间歇式奖励安排:这将给予任何特定的行动一次回报机会。研究中发现最有效的奖励安排是基于可变比例的奖励安排-即将随机性插进等式中,如存在许多没有报酬的拉杠杆行动,但平均报酬却是固定的。

如果这一行为能够延伸到人类身上,那么基于获得奖励的机会而不是有保证的奖励,我们便会更频繁地去执行一个活动。我们将会凭借直觉去掌握这点:这也是我们为什么会赌博。许多游戏已经使用了这些原则。举个例子来说吧,老虎机便是将“斯金纳箱子”理念带到了人类身上。Zynga因为在像《FarmVille》等社交游戏中使用可变比例的奖励安排而出名。甚至连《魔兽世界》也使用了这一理念,即让玩家不时杀掉mob而获取任务中所需要的战利品。

游戏设计众多
可变比例奖励安排的使用经常因为太过“邪恶”而遭遇批评。批评者的观点是:如果游戏设计师选择使用简单固定的奖励安排(即每个行动都伴随一个承诺奖励),玩家将只会玩一阵子。而面对可变比例奖励安排,玩家将更加活跃。因此游戏设计师是在“欺骗”玩家去玩更多他们真正想要玩的,并为此花更多钱。

在正式进入游戏中使用的可变比例奖励安排前,我想要说说在道德和奖励安排讨论中经常被忽视的另一个主要现象:过度合理化效应。

过度合理化效应

1973年,心理学家Mark Lepper和Richard
Nisbett与幼儿园教师合作组织了一次有趣的实验。他们观察到孩子们会受到内在的激励去画画-孩子们喜欢根据自己的想法去画画而不需要获得任何额外的报酬。他们将孩子们分成三个群组。他们承诺给予第一个群组的孩子缎带作为画画的奖励。也给予第二个群组的孩子缎带奖励,但却未事先说明。而第三个群组的孩子则独自在那边画画。尽管使用了缎带奖励,但所有三个群组的孩子们都交出了基本上相同数量的图画。之后他们不再提供缎带奖励。第三个群组的孩子就像他们预期的那样继续画出同样数量的图画(毕竟对他们来说什么都未发生变化)。而第一个群组的孩子在图画数量上却出现了大幅度的下降。

于是心理学家推断出,当第一个群组的孩子接收到缎带奖励时,他们的动机便从“我是因为喜欢画画而画画”转变成“我是因为想得到缎带而画画”。只要他们仍能收到缎带,他们就会继续画画,但一旦不再受到奖励,他们也不会再回到原先的想法了。

这是许多游戏类型经常忽视的情况。我只想分享自己亲身经历的一个例子,但如果你玩过许多电子游戏,我敢保证你将能够识别何时出现过度合理化效应。

对于我而言,在《暗黑破坏神3》中获取胜利后,我仍继续游戏,并在拍卖行中卖掉了我的稀有道具。我创建了一个出售稀有道具的商店,并在此慢慢将道具卖掉。基于这种方式我玩了好几周的游戏,但之后情况开始发生改变:暴雪发行了一个补丁,让新掉落的稀有道具变得更加强大。这让我所收集的所有道具都变得不再那么有价值,于是在阅读了这一补丁说明后我便退出了游戏。并到现在都未曾再接触游戏。这里所出现的情况是,我的动机从“我希望玩《暗黑破坏神3》”转变成“我喜欢在拍卖行中出售道具。”所有的一切在暴雪剥夺了我通过自己的努力赚钱的机会前都是很完美的。

在另外一个例子中,我玩的是《英雄联盟》,即始终致力于打开一个召唤师咒语:有名的“Flash”咒语。一旦我打开它,我便退出游戏。甚至在那之后我都未曾再玩过一次游戏。我的游戏动机从单纯地玩游戏变成了“想要打开Flash”,而一旦我做到了这点,我便发现自己不再有游戏动机了。

在这两个例子游戏,游戏都呈现给我一个目标,并逐渐破坏我玩游戏的最初想法。从设计师的角度看来这是合理的,即只要仍保留着外在动机就足够。只要我能继续在《暗黑破坏神3》的拍卖行中出售道具,我便会继续游戏。但不幸的是,这里存在两个显著的情况将带走玩家的奖励。最简单的一个例子便是我在《英雄联盟》中的遭遇。另外一个问题就是我在《暗黑破坏神3》中经历的,即奖励逐渐过时。在这两个问题间,设计师很难在避免过度合理化效应的情况下将固定奖励安排带进游戏中。

提供奖励

在游戏中提供奖励是受欢迎的。设计师会因为各种理由给予玩家奖励,包括讲话他们的行为,提供玩家的精通感,在某一游戏过程中提升难度,支撑游戏机制和玩家能力等等。所以设计师该如何在冒着过度合理化威胁日常开支并有可能导致玩家失去对游戏兴趣的风险下提供奖励?Lepper和Nisbett在幼儿园实验中的第二组孩子便为这一问题提供了一个暗示。这一群组将在画画后获得缎带奖励,但之前却不清楚奖励的存在。在之后一旦奖励被删除,这一群组将与第一个群组基于同样的速度画画。

这能让设计师在避免将玩家动机转变成想要奖励的前提下知道该如何提供奖励。不要让玩家知道他将获得奖励-这也被称为一种可变的奖励安排。这很直接:当玩家知道自己将获得奖励时,他便只会为了奖励而游戏。这比当奖励是不确定时转变动机更加困难。这也是为何像《魔兽争霸2》等游戏会在一些难以预测的时候给予玩家道具作为奖励的主要原因:如此玩家便可以无需依赖于奖励而好好享受游戏乐趣了。

在这里我的要点不只是澄清可变比例奖励安排不是一种内在的邪恶方法,同时还想说明它们其实是一种优秀的游戏设计实践。可变比例奖励安排并未欺骗玩家去尝试更多他们并不想玩的内容,它们是通过欺骗玩家的大脑而阻止他们从原本的游戏理由转变成外部元素。这便意味着这些奖励安排将保持玩家继续游戏,并且是因为他们发现了体验本身的乐趣,而不只是为了获取奖励,这才是真正的游戏设计!游戏设计是创造玩家能够与乐趣互动,并且无需外部理由便能够呈现出价值的系统的过程。当能够包含可变比例奖励的时候却忽略它们便等于忽略了其它已建立起来的设计理论:这只是一种卑劣的设计实践。

设计师是否能够滥用奖励安排的心理学原理?当然!大多数人的心理原理通常都会被滥用。甚至在使用心理学原理“欺骗”玩家去感受更多乐趣也算是给予玩家更多乐趣。

澳门太阳集团 3

当我在十年前撰写那篇文章时,我还是一名心理学研究生,并且也是一名从未真正接触游戏产业的业余游戏设计师。但是不可否认的是,那篇文章对于整个网络来说的确是一个非常特别的存在。随后它被翻译成多种语言版本,甚至被当作学生们的研究内容。不仅被各种学者所引用,还出现在了《赫芬顿邮报》和《Cracked》(游戏邦注:美国最畅销的漫画杂志)上。

游戏心理学——斯金纳箱

而今天,作为那篇文章发表10周年纪念日,我更是有必要对这一主题进行反思。自从2001年以来,整个游戏产业发生了巨大的变化,而我想在此重新思考这过去十年的发展是如何慢慢背离之前文章提要的要点。

斯金纳(Burrhus Frederic
Skinner)认为,我们可以决定别人的选择意愿(volition),即改变人们做决定的方式。

强化学习被公认为游戏设计中的一个强大力量。

斯金纳箱实验

澳门太阳集团 4

斯金纳做了一个箱子,里面有一只老鼠和一个简单的通电按钮,这个箱子叫做斯金纳箱。

reinforcement learning(from cns.atr.jp)

澳门太阳集团 5

这十年来最大的变化莫过于,如今我们已经难以找到不重视内部奖励结构的游戏。十年前,那种认为游戏是否包含奖励机制,以及这些奖励的分配方式将影响玩家游戏体验的说法很荒谬。但现在看来,奖励已经成为游戏中一种理所当然的内容。

斯金纳箱

增强(Reinforcement,又称强化)已经被游戏设计所接纳的一个明显例子就是成就系统的广泛使用。成就系统是一种非常有趣的研究案例,因为除了成就本身之外,游戏实际上并没有提供什么实质的奖励。像《魔兽世界》等游戏便是通过使用成就系统而引导玩家尝试其他游戏模式,如探索或PvP模式。我也认为,帮助玩家在他们所接触的游戏中找到更多乐趣便是一种强化运用的表现。

1. 积极强化

实验1:将一只很饿的小白鼠放入一个有按钮的箱中,每次按下按钮,则掉落食物。

结果:小白鼠自发学会了按按钮。

奖励可以培养行为习惯。

通过掉落食物的奖励,让小白鼠学会了主动按按钮这一行为,这并不是单纯由刺激产生的自动反应,包含了做选择的过程。

Facebook等平台上社交游戏的崛起也说明了强化已成为游戏产业中不可忽视的一大核心要素。的确,早前的这类型游戏基本上是用图像去呈现出强化元素。而游戏的简单性也让人们很容易就明白其受欢迎的原因。

2.消极强化

实验2:将一只小白鼠放入一个有按钮的箱中。每次小白鼠不按下按钮,则箱子通电。

结果:小白鼠学会了按按钮。

但遗憾的是,一旦箱子不再通电,小白鼠按按钮的行为迅速消失。

惩罚也可以培养行为习惯。

但其也具有一定的副作用:通过惩罚建立起来的行为模式,来得快,去得也快。一旦惩罚消失,则行为模式也会迅速消失。

其中包括三大要素:组织有序的奖励机制,强大的病毒式传播渠道以及易用性。它们的成功也意味着别人不能再轻易贬低这些力量。随着社交游戏间的竞争日趋激烈,这类型游戏虽然变得更加复杂,但比起其他游戏类型,它们的行为对刺激的附带性(Contingency)则多停留于表面。

3.固定时间奖励

实验3:将一只很饿的小白鼠放入斯金纳箱中,由一开始的一直掉落食物,逐渐降低到每1分钟后,按下按钮可概率掉落食物。

结果:小白鼠一开始不停按按钮。过一段时间之后,小白鼠学会了间隔1分钟按一次按钮。

固定时间奖励并没有培养起行为者不停按按钮的行为,反而是行为者知道短期内行为不会再得到奖励,从而减少行为。

成功地在游戏中使用这种附带性也能够帮助我们更好地明确如何在游戏之外的领域运用这些元素,例如医疗健康、安全驾驶等。“游戏化”的确与游戏没有多大关系,而是与附带性更有关联。虽然我们不是很理解为何要借游戏这种轻松的娱乐领域,让人们严肃对待严肃事件中的奖励结构,但是我们也很庆幸这种现象最终还是成了现实。

4.随机时间奖励

实验4:将一只很饿的小白鼠放入斯金纳箱中,多次按下按钮,概率掉落食物。

结果:小白鼠学会了不停按按钮。

通过随机奖励,支配了行为者作出特定的选择,比方说连续按按钮,这就叫做操作性条件反射(Operant
Conditioning)。

由于概率性给予结果,行为者很难直观地判断机制是否失效,所以单次的失败不会给予明显的“惩罚”效果,终止行为者的习惯,从而行为者的学习行为会一直持续下去。

除了行为心理学,游戏中的所有心理学话题都成了主流趋势。我看过许多关于心理学与游戏互动这一话题的博文,甚至有一些工作室还拥有自己的全职心理学家。

5. 迷信行为

实验5:同实验4

结果:这些小白鼠有很多培养出了奇特的行为习惯,比如撞箱子、比如作揖、比如转圈跳舞。

这是一个非常有趣的实验。这是因为掉落食物前,小白鼠正好在进行这些行为,于是产生了“迷信”。

这也是游戏中常谈到的:玄学。比方说玄学抽卡:“中午的时候抽中SSR的概率比较大”、玄学打书“晚上的时候学习这本技能书成功概率会比较高”等,其原理与之相同。

支持者和批评者都夸大了这种技巧的影响力。

游戏设计

斯金纳箱的实则是研究奖励与行为之间的关系。那么它是如何指导设计师在运用于游戏设计上呢?这主要有两点:

❀人类也吃操作性反射这一套。

❀简单重复的奖励一个人做一件事,并不是使他们保持做那件事情最好的方法;反而如果你随机奖励一个人,就在他执行一个动作若干次后,这个方法对于让一个人保持做那件事更加有效。

斯金纳通常通过赌博来解释操作性条件反射。

大多数赌博游戏并不是设计的那么让人痛快的,而且很脑残的是,大多数赌棍都体会得到这点,但是他们还是走上了赌博这条不归路……

又比如,下面两件事情哪件更好玩?

花8小时在赌场玩老虎机赢得100块

花8小时在工厂按同一个电钮为了最后能赚100块

相关文章