博文

目前显示的是 七月, 2009的博文

用IAT测谎

图片
上一个帖子讲到了用内隐联系测验 (IAT)测量人们对性别和学科之间的刻板印象。其实IAT还有很多有趣的应用,比如测谎。

    这种测验被称为自传体内隐联系测验 (autobiographical IAT)。假设你做了一件错事,比如开着时速70码的车撞了人,但你却不承认。这时可以用aIAT技术来检测你是否说谎。测验给你呈现一句一句的陈述句。陈述句包括两类。一类是真实的或者错误的陈述:比如“你正在电脑前做实验”就是真实的,而“我现在正在喝咖啡”就是错误的陈述。另一类是承认或否认要测试的事实:比如“我确实开车撞人了”就是承认事实,而“我根本就不会开车”就是否认事实。测验的目的是看被测者对这两类陈述的结合的反应速度的差异。首先,你需要按一个键对真实陈述或者承认事实陈述进行反应,而用另一个键对错误陈述和否认事实陈述进行反应。然后,颠倒两类陈述的结合模式,在真实陈述或否认事实时用一个键反应,而在错误陈述或者承认事实时用另一个键反应。

    如果被测试者却是开车撞过人,那么他在对真实陈述-承认事实配对时会无意识的反应更快。根据两种配对反应的反应时的差别,就可以判断被试是否说谎。在Sartori等人2008年的研究中,研究者报告测谎的准确率高于91%。

    但问题是,测谎是否容易被作弊。这一点 Psychological Science 的一篇新文章提出了质疑。

    研究者先让一半的被试去教授房间偷一份含有考试题目的CD,而另一半人则留在实验室看报纸。随后对两组被试进行了aIAT测谎测验。测验分数中正分表示被试更容易把“偷CD”和真实陈述联系在一起,即测试认为其“犯罪”。在下图左侧的正常情况下,真实偷了CD的人确实得到正的分数,而看报纸的人则得到负的分数。



    接下来研究者给被试看一页纸的指导语,教被试如何作弊,随后进行第二次aIAT测验。测验的结果如右侧,从测验分数无法区分哪些被测者说谎。在另外的实验中,即使在被试第一次aIAT测验前就告诉他们如何作弊,同样可以改变测谎结果。

    IAT虽然是测量内隐态度的很好的工具,但如果被试知道原理,刻意的操纵结果,还是很容易欺骗测谎工具的。

Sartori, G., Agosta, S., Zogmaister, C., Ferrara, S., & Castiello, U. (2008). How t…

男生的理科成绩比女生好么?

图片
一般人都会有这样的印象,认为男生的理科成绩比女生好。而且在大学中,理工科专业男生大都比女生多;而文科专业则是女生占多数。男性对数学和理工课程有更好的天赋么?要说明这个问题,需要从两方面考虑。

  从实际的学习成绩来看,似乎男生更好些。在全世界范围的调查发现,男中学生的理科成绩比女生好。但不同国家理科成绩的男女差异的差别很大。比如在一项国际数学和科学学习趋势 报告中(Trends in International Mathematics and Science Study, TIMSS),在所研究的34个国家中有3个国家的女生的理科成绩显著高于男生。这似乎说明一些社会文化因素会影响男女生在理科成绩上的差异。  另一个因素是心理上的,即人们对性别-学科关系的看法。如果人们认为男性更适合理科而女性更适合文科,那么男生可能就会更有兴趣学习理科,从而导致成绩更好。那么,男女生理科成绩的差异是由人们对性别-学科刻板印象造成的么?最近一篇发表在PNAS的文章研究了这个问题。

你是这样想的吗?
  但是,研究人们的态度有一个困难。如果直接问对某一件事情的态度,人们通常不会回答自己的真实想法;而是按照社会的期望来回答。比如很多人其实是反对同性恋的,但如果问他们对同性恋的态度,很少有人会直接表明他们是反对的。

  因此作者使用了一种内隐联系测验 (implicit association test, IAT)。测验给被试一组概念和态度的配对,让被试对特定的配对进行反应,并记录反应的快慢。比如,在性别-学科内隐态度测验中,首先让被试对男性与理科配对或女性和文科配对反应,比如“男孩”和“生物学”,或者“阿姨”和“文学”;如果相反则不反应,如“叔叔”和“哲学”,或者“女儿”和“工程学”。在接下来的实验中,再将要求反应的配对颠倒,即男性和文科配对时反应,女性和理科配对是反应。实验的目的是比较两种配对反应时的差异:如果被试对男性-理科、女性-文科配对的反应时快于男性-文科、女性-理科配对的反应,则说明被试存在内隐的男性-理科刻板印象。通过这种方法测量的内隐态度有时会与被试报告的态度存在差别,比如这项研究中性别刻板印象的内隐测量与主观报告的相关只有0.22。

研究结果
  研究者将内隐联系测验放在了网上,你可以在这里参加测验。网络化测验可以让研究者收集一个很大的样本,比如,这篇PNAS的文章共收…

国内医学期刊论文的可信性

图片
最近又有一个研究在网上掀起波澜。这篇发表在Trial杂志上的研究 (pdf) 表明,国内医学期刊发表的试验报告中只有7%的研究符合随机对照试验标准 (RCTs)。也就是说93%的研究或多或少存在研究设计上的问题,其结论的可靠性存在疑问。

随机对照试验 (randomized controlled trial, RCT) 是检验医疗手段或药物有效性的科学实验程序。主要包括将被试随机分配,设置治疗组、控制组和安慰剂组,控制病人和研究者的双盲等等。这些标准都是最基本的和必需的。比如要验证一种药物是否有效,很多病人不需要药物仍然会自动好转,因此需要设置没有接受任何药物治疗的病人作为控制组。还有所谓的安慰剂效应 (placebo effect),就是给病人吃没有任何作用的维生素丸,但是告诉病人这是可以治愈他们疾病的药物,病人的病情同样会得到好转。安慰剂效应也需要在试验设计中排除。另外,还要将病人随机的分配到不同的试验组中,并采取双盲的方法操作试验。

可以想象,如果不采用严格的随机对照试验,就会人为的使一种治疗手段看上去更有效。这类怀疑经常发生在国内的医学期刊上,因为国内医学试验报告中得到阳性结果 (治疗有效果)的比例超高,使人不得不怀疑试验程序是否可靠。Trials杂志上的这篇文章搜索了1994年到2005年间发表在中文期刊上涉及20种常见疾病的37313篇文章,并对作者进行了电话采访。在接受采访的2235篇文章中,只有207个研究采用了可以接受的随机方法 (原文写的是6.8%,但207/2235!=6.8%)。研究人员还对比了常规医学与中医试验,研究可信度的比率并没有统计差异。

这并不是第一篇涉及此问题的研究。但这篇文章调查了一个更大的样本,并采用了电话采访的方式,更全面的反映了国内医学期刊的糟糕状态。当然这不代表国内医学的研究水平不高,因为真正高水平的研究都会发表在国外期刊上。医学不同于心理学,很多试验证明了的方法可能就会直接用到临床上。即使不能应用临床,仍然可能会在日常生活中见到,比如一些保健品或医疗设备等。这些东西有了“科学”的标签真是祸害无穷。以后对待这些东西还是小心为妙。

还有一个令我惊讶的是,按照作者的说法,国内目前有1100种医学期刊。我不知道中国的医学界发达到了什么程度,究竟可以培养出多少人来做出符合规范的研究。是不是因为期刊太多,而目前没有足够多的高水平…