该相信什么，该怀疑什么？

三月 06, 2012

事情的起因是我在微博上推了一篇关于通过走路姿态判断性经验的研究。因为只是猎奇，我只写了一句话，并没有做过多的解读。但这是一个话题性的研究，必然很吸引眼球。目前已经被转发600多次，并引来了果壳性情站的评论《高潮有没有，咱们走着瞧？》。文章的中心思想是这个研究不靠谱，可是反驳的论点都站不住脚，而且在我看来这样的文章在实际上造成了很坏的影响。

一，研究靠谱么？
这个研究 (A Woman's History of Vaginal Orgasm is Discernible from Her Walk)发表在学术期刊The Journal of Sexual Medicine上。是一篇通过严格同行评议程序发表的文章。Peer review是科学交流的一个重要的环节。所有要在学术领域交流的实验报告和学术观点，都要先通过几个同行的匿名评审，经过几次修改，才能最后在学术期刊上发表。这个期刊的影响因子为3.957，虽然不高但也不低，不能说它是一个不靠谱的期刊。当然，一些烂文章也可能侥幸被同行接受发表。那就要看的是这篇文章发表之后被引用的情况。根据Google scholar，这篇文章已经被引用19次。3年的时间里相比于期刊影响因子，被引次数并不少。总之，从学术发表和引用方面看，这篇文章是靠谱的。
再来看果壳这篇质疑文的论据。一是样本量。该研究采集了16名志愿者走路的录像进行判断，按照冷月如霜的观点样本量太少。在实际研究中使用多大样本量是一个需要权衡的问题。样本量大，结果固然可靠，但是同时成本会提高，可操作性变差，投资收益比降低。当然，样本量小，变异就会变大，结果就会不可靠。但要注意的是，在根据实验数据得出结论时，是同时考虑到观测误差以及实验效应两方面因素的，这就是统计的作用。误差小，观察到的效应不需要很大就能得到统计上的显著结果；误差大，则需要效应很大才能统计显著。但不管误差有多大，在得到p < 0.05 的显著水平时，都表明如果完全随机，得到观测数据的概率小于5%，是小概率事件，观测结果不太可能是由随机误差造成的。因此，所谓样本小，并不是一个靠谱的指控，更不能就说明研究的结果错了。
另外，我们需要的是有实际意义的实验效应，而不是通过增加样本量而得到的本来很小但统计上更显著可靠的效应。比如，判断16个人可以得到81.25%的正确率，这个正确率其实很高，在实际操作中是有意义的。而如果增加到比如160个人的样本，那么也许正确率只有60%就会在统计上显著的高于随机猜测概率50%。但后者的实际操作意义却很低。
第二个所谓阴蒂性高潮和阴道性高潮，原文作者只是想区分有无阴道性高潮，而并不是想区分阴蒂和阴道性高潮的差别。这个理由有点莫名其妙。第三个指控只是针对原文作者对结果的解释，根本无法推翻研究的结果和结论。
总之，冷月如霜的质疑并不都站得住脚。充其量只能说原研究可能存在一些问题，但完全没有办法证明原研究是错的。

二，更坏的影响是什么？
任何一个单独的研究都会有漏洞，特别是行为科学的研究。质疑研究存在的问题其实并无不妥，但这篇质疑文在果壳发表后却产生了一些很不好的影响。简单来说，很多人看到果壳发表了质疑文，并不看质疑论点是否站得住脚，就得出结论原研究是错的，是“民科”。还有很多人在微博上AT我这篇文章。虽然果壳是以热爱科学的名义召集来了很多读者，但说实话，很多人的判断力并不高。他们不是为了用科学更新自己的观念，而是为自己现有的观念找“科学”的注脚。最后导致了一个非常可笑的结果，很多人不相信发表在学术期刊上文献的结论，却相信非相关领域研究生的“解读”。
大多数人都是带着预设的观点读文章。特别是对于是否能通过步态看出性经验的敏感问题，很多人会感到不适，并先入为主的排斥。他们一旦看到果壳发表了“辟谣”文，他们甚至不会去看文章的内容就会认为自己的观点是对的。但是，这并不是科学的态度，甚至与科普的宗旨相悖。

三，该相信什么，该怀疑什么？
谣言粉碎机是果壳的招牌之一。其他主题站也会有一些“粉碎”性质的文章，比如这篇性情站的文章。这些粉碎谣言的文章在很多时候起到了好的作用，比如日本地震后的盐恐慌等。但什么要质疑，什么要相信，要根据质疑对象的来源有所不同。第一类是流传的科学谣言，比如吃茄子可以减肥。对这类问题要通过科学证据来反驳。第二类是媒体报道中对学术研究的过度解读。比如有调查发现喝红酒的量与寿命成正相关，媒体就得出结论多喝红酒就会导致长寿。对这类问题需要用科学的方法解释数据，告诉大家相关性并不代表因果关系。第三类是发表在学术期刊上的研究，对它的质疑则最好慎重。前面已经说过，学术文章都经过严格的同行评议。像样本量之类的小问题，如果该领域的专家认为是可以接受的，你拿来质疑的分量有多大？
那么，如果是在学术界如何质疑这个研究？只有通过发表新的论文。用更可靠的实验设计和数据表明之前的研究结果是错的，比如通过增加样本量，采用更客观的测量指标等等。通过这种同行评议的论文发表机制，才能保证科学理论的不断自我修正。而对于非学术界的人来说，更简单的方法自然是搜索是否有新的研究已经否定了前面的研究。而如果还没有反驳的文章发表，我的建议是保持怀疑的态度接受该研究的观点。因为只有这个研究才是在当前阶段最“可靠”的。

总之，质疑很容易，但论据充分有理有力的质疑却很难。特别是对于在学术期刊发表的文章，质疑更要谨慎。而对于果壳网的读者，培养科学的思维方式，能够判断哪些是可信、哪些是不可信的，才是最重要的。

Nicholas, A., Brody, S., de Sutter, P., & de Carufel, F. (2008). A Woman's History of Vaginal Orgasm is Discernible from Her Walk Journal of Sexual Medicine, 5 (9), 2119-2124 DOI: 10.1111/j.1743-6109.2008.00942.x