数据的严谨性、研究的可重复性和研究本身——这三大支柱构成了扎实的学术研究。而正确使用和解释统计数据对于构建第一个支柱至关重要。
统计错误比我们大多数人认为的更常见,遑论日常生活中的电视广告,即便严谨如学术论文也不可避免。有些是无意造成的,有些是为了引导读者故意造成的。它们是导致文章难以理解和造成误读的主要原因。
在本期研究者学院专栏中,我们重点介绍了科研论文中常见的统计错误及其示例,并提供了如何避免这些错误的提示与建议。
1、对照组的重要性
当我们需要观察实验中某干预措施在多个时间点内对受试者的影响时,对照组是必不可少的工具。忽视个别因素可能会对试验结果造成影响。这其中就包括,随着实验的逐渐开展,研究人员对试验流程更加熟悉,从而相较于实验刚开始时,试验数据的记录也会更加顺手和高效。同样,当受试者在参与试验时,受试者也会学习新技能,随着时间的变化他们在试验中的表现也会提高。低响应率或高拒绝率可能表明受试者或许存在一定程度的偏见。对于临床试验来说,随访次数也可能会严重受到主要终点的影响,导致组别之间的脱落率的失衡。我们还需要额外注意实验组受试者的知识水平导致的影响。每项研究都有潜在的偏倚,对照组可以减少这些无意的错误和偏倚,并验证试验结论。
2、重复实验的力量
重复的实验越多,统计分析就越准确。为了夸大他们的样本量,科学家们经常倾向于使用观察次数而不是受试者数量。为了得出一个合理的结论,样本量和观察次数之间应该有一个合理的平衡。另一个需要避免的错误是比较不同时间点的群组,应该寻求更合适的试验方法进行代替。
3、报告异常值的意义
在分析数据时剔除夸张的异常值是另一个典型的错误,因为它理所当然地默认这项数据有问题。人们普遍认为,一两个异常值不太可能推翻大数据得出的结论。然而,异常值很可能也是真实的观察结果。如果确实决定剔除某组数据,则必须注明并解释剔除的原因。科学想要进步,就必须确保科学实验的公开透明。
4、理解神秘的p值
还应注意P为0.05时所代表的显著性水平存在任意性。P值表示发生偶然情况的可能性。统计效应(Effect Size)和95%置信区间必须与P值一起呈现才可以让数据具备解释结论的能力。这可以帮助读者判断该结论结果是否适用于相关人群。P值(假设检验)通常在没有参考置信区间的情况下被过度使用,从而导致了误导性结论。另一个常见错误是子数据之间P值的比较。在这种情况下,需要进行交叉检验以避免得出错误的结论。
5、正确利用统计检验的优势
正式的统计检验有时不适用于某些数据。例如,拒绝零假设并不表示结果与零分布不同——这就是统计检验的用途。一组有序变量(如某个年龄组)需要进行趋势检验,才能得出一个真正有效的结果。参数统计方法(例如ANOVA或线性回归)通常在不适用的情况下被过度使用,例如当结果或残差未被验证为正态分布时。这些行之有效并复杂的统计检验看上去非常诱人,但需要在正确的场景中被使用。
6、正确解释统计检验的必要性
“相关性并不意味着因果性”这种说法我们大家已经很熟悉,但它源于一个重要且常见的统计错误。相关性经常用于评估两个变量之间的关系。找到两个变量之间的相关性并不一定意味着一种效应会导致另一种效应。为了证明因果关系,应进行额外的检验。
除了这些关键点之外,学者们还应该记住在进行实验时提供他们的样本和变量的明确定义。
数据的严谨性、研究的可重复性和研究本身——这三大支柱构成了扎实的学术研究。而正确使用和解释统计数据对于构建第一个支柱至关重要。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您