点赞(0)

点赞(0)

【学术推送】问题行为的功能分析—30年研究进展（上篇）

来源：孤独症儿童教育研究中心

2019-09-12 15:41 1048 0 0

孤独症以及其他发展障碍人群普遍表现各种行为问题，对自己对他人造成伤害。如何对问题行为进行精准评估，依此制定有效的干预治疗措施？这是应用行为分析（ABA）长期来研究的重要课题。1948年，B.F. 斯金纳首先运用“功能分析”的术语来解释行为与环境变量之间的关系（Schlinger&Normand，2013)。1970年代，临床上开始出现对问题行为进行分析的文献。1994年，Iwata, Dorsey, Slifer, Bauman和 Richman 在《应用行为分析》上重新发表他们1982年的论文《通向自伤行为的功能分析》，随后作者在1982/1994论文中发表了一组关于儿童自伤行为（SIB）的功能特征数据，据此提出一种基于实验模式的行为功能分析方法（functional analysis, FA）。自此问题行为功能分析（FA）方法被广泛地复制，应用，延伸，发展和讨论。截至2012年，FA研究发表在2000多篇期刊学术论文和书籍章节中。在临床上FA被公认为对问题行为进行评估的黄金标准，并被写入美国特殊教育法（IDEA），确定为制定学生个人教育计划（IEP）问题行为干预的依据。

2003年，Hanley， Iwata，McCord发表了一篇关于FA的文献综述，调查统计从1961年到2000年发表的277篇应用功能分析（FA）方法的研究论文，这些研究都满足以下5个条件：①在治疗之前对问题行为做评估；②评估建立在直接观察和测量基础上；③问题行为在实验条件下表现；④实验者至少操纵两个环境变量；⑤实验的目的是演示环境事件和问题行为之间的关系。作者对这些研究的受试对象，操作环境，问题行为形态，实验方法，以及实验结果等方面的变量做了综合性归纳与分析。2013年，Beavers，Iwata 和Lerman 发表第二篇关于FA的文献综述，扩展了Hanley等人的研究，增加了从2001年到2012年新发表的158篇论文中的445个FA研究，以及2013年在《应用行为分析学报》FA专辑发表的论文。在全面归纳分析的基础上，作者就FA 30年来的进展和未来发展趋势做了讨论。

本文分6个部分介绍这两篇综述文献的主要内容：①功能分析的对象与环境；②问题行为形态；③实验方法；④分析结果；⑤最佳实践建议；⑥方法的改进，延伸和治疗分析（2013年《应用行为分析》FA专辑论文讨论）。

一、功能分析的对象与环境

从1985年到2000年，在刊物上发表的FA研究论文数量迅速上升，达到每年平均15篇左右以后稳定下来。发表FA研究的学术刊物也从一家上升到27家。在所有FA研究中，以儿童为FA分析对象的占大多数（74.9%）。以成人为分析对象的占少数，其中三项研究对65岁以上老年人进行问题行为分析。大多数FA研究的分析对象存在某种程度上的智力障碍（87.8%），其中对象被诊断为孤独症谱系障碍的占26.7%。有7位受试对象没有发展性智力障碍，但是分别有老年智力减退，托瑞氏综合症，精神分裂症和创伤性脑损伤等诊断。

大多数FA是在医院环境（41.2%）或者学校环境进行（36.1%）的。在门诊室和家庭环境做的FA 占15.3%。有一个FA是在公共社区环境进行的。近十年来，在门诊和家庭环境进行FA 的研究呈现上升趋势（分别从7.6% 上升到 21.5%和15.3%）。这一变化可能体现了近年来对于问题行为诊断治疗典型环境的变化。

二、问题行为形态

被分析的问题行为形态主要包括自伤,　进攻，破坏，扰乱，发声，和毁坏器物（分别各占实验总数的25%，其中自伤和进攻行为超过25% ）（译者注：被分析对象可能同时表现多种问题行为，所以行为的总百分数超过100%）。对于自伤行为的FA研究数量下降（从64.4% 下降到37.3% ），而对于发声，毁坏器物，逃跑，不服从，发脾气，重复行为，吞食异物等其他问题行为的FA数量上升。FA分析的问题行为还包括：舔物，舔手咬手，闻物，反刍，呕吐，自我刺激引起恶心呕吐，含着食物不吞咽，吐唾沫，憋气，脱光衣服，不恰当性行为，和咬指甲等。还有几个FA研究针对学生上课时离开座位和注意力走神，不关注学习任务（off task）。

三、实验方法

（一）实验模式

大多数FA研究（89%）采用ABC模式（Iwata 等人，1982/1994），即在实验中同时呈现和操纵问题行为的前事刺激（A）和后效（C）。少数研究（12%）采用AB 模式（Carr & Durand, 1985）, 在实验中只呈现和操纵行为（B）的前事刺激（A）。少数研究同时采用ABC和AB两种模式（4.4%)。与2003年的调查相比较，采用ABC 模式的研究呈上升趋势（从87%到92.4%）。以此看来，同时操纵前事刺激和后效可以使得环境对行为的制约关系表现得更为明显，减少了产生不确定分析结果的可能性，而在实验中所增加的努力微不足道。ABC模式带来的利益要超过企图减少时间与努力的AB 模式。

（二）附加评估

62个研究（14.3%）报告了在FA实验之外还做了描述性评估（没有实验控制的直接观察，即ABC分析），44个研究（10.1%）在FA之外还做了非直接观察评估（护理人员报告，问卷调查）。58个研究只做了一种附加评估（13.3%），28个研究同时做了两种附加评估（6.4%）。与2003年调查相比较，2013年调查中增加附加评估的研究呈上升趋势。如果第一次FA实验能够产生清楚的结论，需要做附加评估的可能性就很低。研究者做附加评估可能是为了帮助弄清第一次FA 产生的不清楚结论，或者拿附加评估结果与FA 做比较。

（三）测试条件

1. 社会正增强

2013年的调查中有149个研究（94.3%）在FA实验中测试社会正增强条件。146个研究（98%）测试了关注对问题行为的影响，80个研究（54%）测试了实物（食物，玩具，活动）对问题行为的影响，77个研究同时测试了关注和实物的影响。两次调查总共386个FA实验（88.7%）测试了社会正增强条件。

2. 社会负增强

2013年调查中有145个研究（91.8%）在FA实验中测试社会负增强条件。两次调查总共392个研究（90.1%）测试了社会负增强测试（通常是逃避任务）。

3. 自动增强

243个研究（55.9%）测试了自动增强（automatic reinforcement）条件（即行为在没有社会制约条件时持续表现）。

4. 控制条件

2013年调查中有150个研究（94.9%）在FA测试时用了控制条件（control condition），即让测试变量在控制条件中消失。有8个研究没有包含特别的控制条件，其中5个研究运用了制约逆反的测试策略，2个研究没有足够信息说明是否测试了控制条件，一个没有测试控制条件。

5. 测试条件的数量

90.6%的研究包括2个或者更多的测试条件，15.4%的研究至少在一个FA中用了一个测试条件。

（四）测试时长与测试单元（session）时长

测试时长：多数（89%）研究采用标准的全FA分析，即每一个测试条件重复测试3次以上。少数（12.9%）研究采用短暂FA分析，每一个测试条件重复测试2次以下。5.3% 研究没有说明测试时长。采用全FA分析的研究略呈上升趋势。

测试单元时长：大多数研究（48.3%）运用传统的10分钟FA测试单元，或用较短的5分钟测试单元（20.7%），少数（7%）运用15分钟的长FA测试单元。有12.7% 的研究运用其他长度的FA测试单元，这些研究常常是以反应回合为基础（trial-based）的FA 测试。有9.4% 的研究没有说明FA测试单元时长。

在测试单元时长方面总趋势是运用5分钟FA测试单元的研究在增长，运用10分钟和15分钟测试单元的研究减少。这可能反映了研究者对于FA实验效率的强调和追求。但是较短的FA测试单元是否会造成不清楚的FA结论增加，降低了FA测试的准确性，这一点尚需进一步研究。

（五）实验设计

大多数研究（80.5%）的实验设计运用多因子设计（multielement design）。运用返回设计(reversal design) 和配对设计(pairwise design) 的研究分别占14.3% 和4.1%。有少数研究（7%）混合运用上述三种实验设计。与2003年的调查相比，运用多因子设计和返回设计的研究数量有所下降，而运用配对设计和混合设计的研究数量有所上升。有4.8% 的研究没有说明运用什么实验设计，也没有提供FA结果的线图，只是在文中笼统指出 “FA实验根据Iwata 等人（1994）”。

在125个运用多因子实验设计的研究中，有113个研究（90.4%）的测试条件按照随机排序，21 个研究（16.8%）的测试条件按照 Iwata 等人 1994 年建议的固定排序（单独，关注，游戏，要求）。16 个研究（12.8%）还增加一个后续测试条件，用来测试在没有社会后效制约时持续的行为，被称为延长的单独或无接触条件（extended alone or no‐interaction phase ）（Vollmer et al. (1995）。在初期FA结果不能确定行为功能时，这一延长的单独条件常常被用来区辨维持问题行为是自动增强还是多重制约增强。

（六）数据显示和分析

大多数研究（80.5%）用线图表示测试单元的值来呈现FA数据，有一个研究显示了测试单元内的测试值。81个研究（18.6%）用条状图，表格，或者论文正文中的数字来呈现FA数据。与2003年调查相比较，用单元值呈现FA 数据的研究增加（从75.1% 到 89.9%），而用单元平均值呈现FA数据的研究相对减少（从26.7% 到4.1%）。

91个研究运用连续数据记录：其中90.7% 用频率或者比例测量（ frequency or rate），9.3% 用时间长度或者时间延宕（duration or latency）测量。72个研究 (45.6%) 报告用非连续方法记录，其中大多数（94.4%）运用部分时距记录（partial-interval）。一个研究用全时距记录（whole interval）。3个研究用瞬间时间取样（momentary time sampling）记录FA数据。除了行为的频率和时间，没有一个研究测量报告问题行为的强度或力度。

有三个研究在对FA数据做视觉分析时还参照了其他标准。Paclawskyj et al.（2001）和 Langthorne et al. (2011) 参照了Hapopian et al.（1997）描述的标方差估计方法，Asmus et al. （2004）在确定功能时依据三个连续数据的上升或稳定趋势与控制条件的数据比较。

（七）刺激条件参数

Hanley et al. （2003）总结了作为FA的测试条件和控制条件的一般刺激条件参数，描述了一些可以操纵的前事和后效事件变量，包括建立性操作（EO），区辨性刺激(SDs), 和对于问题行为呈现或不呈现制约。从2001年到2012年的十年中，研究者继续运用Hanley 等人描述的这些操纵。

然而，有一些不寻常的变异值得加以评论。两个研究包括了这样的测试条件：治疗师行为的部分改变而测试结果不变。Northup（2004）比较了标准FA的逃避条件与另外2个测试条件：隔离与无指令。逃避测试的程序与标准FA相同（即当问题行为表现，任务指令终止）。测试隔离条件时，治疗师在测试开始前告诉受试，问题行为发生会被隔离，并且在问题行为出现开始实施间隔时，治疗师对受试者说：“间隔“（time out”）；无指令条件时，问题行为发生后治疗师停止发指令也不发声。Kuhn et al.（ 2009）的研究也在FA 中通过改变治疗师行为来操纵前事：对一位受试做的改变的实物条件（食物），治疗师当着受试者的面吃受试的偏好食物，改变的实物条件（娱乐），治疗师在测试开始收回杂志之前对受试者说杂志属于受试者。对另一位受试者做的改变的关注条件，治疗师的助手示范受试表现的问题行为，然后治疗师给予关注。尽管作者说明了运用这些条件的理由，但是这些改变是影响了区辨刺激还是建立性操作并不清楚。

在同一个测试条件中合并变量是另一种变异（即给予关注同时保持任务要求不变，Carr & Durand, 1985）。有些研究在一个测试条件中合并多个后效。例如，Mueller et al.（2005）和 Sarnoe et al.（2011）设计的要求条件，问题行为发生时不但给予逃避，同时给予关注。同样，Kurtz et al. ( 2003 ) 还允许受试在逃避任务的间隙看电视，作者注明这在受试家庭环境中通常会发生。更不寻常的是LaBelle et al. (2002) 设计的要求条件，治疗师在测试中根据受试的行为来改变后效，如果受试表现问题行为并且离开治疗师，治疗师忽略受试30秒钟（逃避）；如果受试表现问题行为同时想要玩具，治疗师给予玩具。尽管测试中任何刺激条件参数都可以变化，有些变化可能会产生问题。当在一个测试条件中合并多种后效时，一个增强源的影响与其他增强源的可能变得难以区分。

四、分析结果

981 张线图呈现了所有受试个体FA测试的结果。这一数目只是对所有受试者测试总数的粗略估计，因为可能有些受试者参与多项FA 实验。依据这些研究报告作者的解释，94%的FA测试获得区分（功能）的结果。其中，32.2% FA测试显示问题行为是由社会负增强功能控制，32.7% 测试研究显示问题行为是由社会正增强功能控制。在2013年的调查中，29.2% 测试结果显示社会正增强功能控制，其中17.2% 由关注控制，12% 由实物或活动控制。16.3% 测试结果显示自动增强控制。18.9% 测试结果显示行为由多种增强控制。大多数结果为多种增强控制的FA，测试针对的是包括多种形态上不同的问题行为，例如自伤行为和进攻行为。

五、最佳实践建议

2003年，Hanley等人在文献回顾基础上，提出了以下FA最佳实践的建议。

A）把测试的行为反应群限制于一个或者少数行为形态；B）针对目标行为设计后效制约；C）在测试之前和测试过程中加入建立性操作（EO）；D）加入区辨刺激帮助区辨测试的条件；E）运用相对较短的测试单元（10分钟）；F）加入测试条件确定自动增强控制的行为；G）解读分析结果时考虑增强的相对时长；H）只有当初步信息提示行为和实物可能存在功能关系时才测试行为和实物的关系；I）从简单短暂的测试（相对少的条件）开始，根据需要进展到较长或复杂的测试；J）运用其他信息源（如，开放式问卷，直接观察）来构建更为复杂的分析。

2013年的调查结果表明这些建议大多数被研究者采用。例如，大多数研究采用 ABC 的FA 模式和较短的测试单元（10分钟）。也有一些建议在研究中没有体现，也许最引人注目的是实物条件测试的加入。2003 年调查的研究中实物条件占所有FA大约三分之一，2013年调查上升到所有研究的一半以上。只有80个测试实物条件的研究（占全部实物条件测试研究41.3%）的作者报告了间接问卷或者直接观察的初始信息提示有可能存在实物控制功能。其他多于一半研究的作者，或者不说明为什么加入实物测试的原因，或者是没有特别原因地加入这一测试。

好几个研究结果表明加入不必要的实物功能测试条件有可能会增加假阳性结果，即不存在实物功能但是数据显示实物功能 (Galiatsatos & Graff, 2003; Rooker, Iwata, Harper, Fahmie, & Camp, 2011; Shirley, Iwata, & Kahng, 1999)。从2001年以后发表的数据来看，Hanley et al. (2003) 限制加入实物测试条件的建议更加适合今天的情况。

Smith & Churchill （2002）对四位受试者的自伤和进攻行为进行FA分析，因为有理由相信目标行为也表现在前驱行为（precursor behavior ，即在目标行为发生以前的前导行为）中，作者对前驱行为和目标行为分别进行FA测试。结果发现所有的受试者前驱行为与目标行为的功能一致，而且在前驱行为测试中观察到的目标行为发生率较低。这一研究被Borrero & Borrero, 2008; Dracobly & Smith, 2012; Herscovitch, Roscoe, Libby, Bourret, & Ahearn, 2009 等研究者复制和发展，作者建议通过对前驱行为进行分析来减少FA 可能产生的危险（如，SIB造成自伤，进攻造成他伤等）。这当然是减少FA分析中可能产生危险的进步，但是FA分析是否真的对受试者造成危险，这是一个只能凭经验来回答的问题。尽管FA在设计上就是要引发问题行为，但是在FA分析的一个或多个测试条件的测试单元中观察到问题行为，是否比在FA测试外观察到的问题行为更为危险，或者比干脆不做FA测试制定的治疗方案更为危险？这些问题的结论至今尚不清楚。评估这些危险需要有进一步的测量，在测量行为频率之外，还需要有对行为严重度（强度）的测量，以及不依据FA 制定的治疗方法所产生的远期后果的数据。

*版权说明：感谢每一位作者的辛苦创作与付出，“融教之家”均已备注文章作者及来源。本网转载目的在于更好地服务读者、传递行业信息。文章仅代表作者个人观点。如因作品内容、版权和其它问题需要同本网联系的，请发送消息至 “融教之家(rhjyzone)”公众号后，非常感谢！