Never

博文

目前显示的是七月, 2009的博文

用IAT测谎

七月 30, 2009

上一个帖子讲到了用内隐联系测验 ( IAT )测量人们对性别和学科之间的刻板印象。其实IAT还有很多有趣的应用，比如测谎。这种测验被称为自传体内隐联系测验 (autobiographical IAT)。假设你做了一件错事，比如开着时速70码的车撞了人，但你却不承认。这时可以用aIAT技术来检测你是否说谎。测验给你呈现一句一句的陈述句。陈述句包括两类。一类是真实的或者错误的陈述：比如“你正在电脑前做实验”就是真实的，而“我现在正在喝咖啡”就是错误的陈述。另一类是承认或否认要测试的事实：比如“我确实开车撞人了”就是承认事实，而“我根本就不会开车”就是否认事实。测验的目的是看被测者对这两类陈述的结合的反应速度的差异。首先，你需要按一个键对真实陈述或者承认事实陈述进行反应，而用另一个键对错误陈述和否认事实陈述进行反应。然后，颠倒两类陈述的结合模式，在真实陈述或否认事实时用一个键反应，而在错误陈述或者承认事实时用另一个键反应。如果被测试者却是开车撞过人，那么他在对真实陈述-承认事实配对时会无意识的反应更快。根据两种配对反应的反应时的差别，就可以判断被试是否说谎。在Sartori等人2008年的研究中，研究者报告测谎的准确率高于91%。但问题是，测谎是否容易被作弊。这一点 Psychological Science 的一篇新文章提出了质疑。研究者先让一半的被试去教授房间偷一份含有考试题目的CD，而另一半人则留在实验室看报纸。随后对两组被试进行了aIAT测谎测验。测验分数中正分表示被试更容易把“偷CD”和真实陈述联系在一起，即测试认为其“犯罪”。在下图左侧的正常情况下，真实偷了CD的人确实得到正的分数，而看报纸的人则得到负的分数。接下来研究者给被试看一页纸的指导语，教被试如何作弊，随后进行第二次aIAT测验。测验的结果如右侧，从测验分数无法区分哪些被测者说谎。在另外的实验中，即使在被试第一次aIAT测验前就告诉他们如何作弊，同样可以改变测谎结果。 IAT虽然是测量内隐态度的很好的...

阅读全文

男生的理科成绩比女生好么？

七月 21, 2009

一般人都会有这样的印象，认为男生的理科成绩比女生好。而且在大学中，理工科专业男生大都比女生多；而文科专业则是女生占多数。男性对数学和理工课程有更好的天赋么？要说明这个问题，需要从两方面考虑。从实际的学习成绩来看，似乎男生更好些。在全世界范围的调查发现，男中学生的理科成绩比女生好。但不同国家理科成绩的男女差异的差别很大。比如在一项国际数学和科学学习趋势报告中(Trends in International Mathematics and Science Study, TIMSS)，在所研究的34个国家中有3个国家的女生的理科成绩显著高于男生。这似乎说明一些社会文化因素会影响男女生在理科成绩上的差异。另一个因素是心理上的，即人们对性别-学科关系的看法。如果人们认为男性更适合理科而女性更适合文科，那么男生可能就会更有兴趣学习理科，从而导致成绩更好。那么，男女生理科成绩的差异是由人们对性别-学科刻板印象造成的么？最近一篇发表在PNAS的文章研究了这个问题。你是这样想的吗？但是，研究人们的态度有一个困难。如果直接问对某一件事情的态度，人们通常不会回答自己的真实想法；而是按照社会的期望来回答。比如很多人其实是反对同性恋的，但如果问他们对同性恋的态度，很少有人会直接表明他们是反对的。因此作者使用了一种内隐联系测验 (implicit association test, IAT)。测验给被试一组概念和态度的配对，让被试对特定的配对进行反应，并记录反应的快慢。比如，在性别-学科内隐态度测验中，首先让被试对男性与理科配对或女性和文科配对反应，比如“男孩”和“生物学”，或者“阿姨”和“文学”；如果相反则不反应，如“叔叔”和“哲学”，或者“女儿”和“工程学”。在接下来的实验中，再将要求反应的配对颠倒，即男性和文科配对时反应，女性和理科配对是反应。实验的目的是比较两种配对反应时的差异：如果被试对男性-理科、女性-文科配对的反应时快于男性-文科、女性-理科配对的反应，则说明被试存在内隐的男性-理科刻板印象。通过这种方法测量的内隐态度有时会与被试报告的态度存在差别，比如这项研究中性别刻板印象的内隐测量与主观报告的相关只有0.22。研究结果 ...

阅读全文

国内医学期刊论文的可信性

七月 06, 2009

最近又有一个研究在网上掀起波澜。这篇发表在Trial杂志上的研究 ( pdf ) 表明，国内医学期刊发表的试验报告中只有7%的研究符合随机对照试验标准 (RCTs)。也就是说93%的研究或多或少存在研究设计上的问题，其结论的可靠性存在疑问。随机对照试验 (randomized controlled trial, RCT ) 是检验医疗手段或药物有效性的科学实验程序。主要包括将被试随机分配，设置治疗组、控制组和安慰剂组，控制病人和研究者的双盲等等。这些标准都是最基本的和必需的。比如要验证一种药物是否有效，很多病人不需要药物仍然会自动好转，因此需要设置没有接受任何药物治疗的病人作为控制组。还有所谓的安慰剂效应 (placebo effect)，就是给病人吃没有任何作用的维生素丸，但是告诉病人这是可以治愈他们疾病的药物，病人的病情同样会得到好转。安慰剂效应也需要在试验设计中排除。另外，还要将病人随机的分配到不同的试验组中，并采取双盲的方法操作试验。可以想象，如果不采用严格的随机对照试验，就会人为的使一种治疗手段看上去更有效。这类怀疑经常发生在国内的医学期刊上，因为国内医学试验报告中得到阳性结果 (治疗有效果)的比例超高，使人不得不怀疑试验程序是否可靠。Trials杂志上的这篇文章搜索了1994年到2005年间发表在中文期刊上涉及20种常见疾病的37313篇文章，并对作者进行了电话采访。在接受采访的2235篇文章中，只有207个研究采用了可以接受的随机方法 (原文写的是6.8%，但207/2235!=6.8%)。研究人员还对比了常规医学与中医试验，研究可信度的比率并没有统计差异。这并不是第一篇涉及此问题的研究。但这篇文章调查了一个更大的样本，并采用了电话采访的方式，更全面的反映了国内医学期刊的糟糕状态。当然这不代表国内医学的研究水平不高，因为真正高水平的研究都会发表在国外期刊上。医学不同于心理学，很多试验证明了的方法可能就会直接用到临床上。即使不能应用临床，仍然可能会在日常生活中见到，比如一些保健品或医疗设备等。这些东西有了“科学”的标签真是祸害无穷。以后对待这些东西还是小心为妙。还有一个令我惊讶的是，按照作者的说法，国内目前有1100种医学期刊。我不知道中国的医学界发达到了什么程度，究竟可以培养出多少人来做出符合规范的研究。是不是因为期刊太...

阅读全文