(知识点)T检验公式两样本检验

t 检验是一种统计检验,用于比较两组的平均值。它通常用于假设检验,以确定一个过程或治疗是否真的对感兴趣的人群产生影响,或者两组是否彼此不同。

您想知道鸢尾花的平均花瓣长度是否因品种而异。您会在花园中发现两种不同种类的鸢尾花,并测量每种鸢尾花的 25 片花瓣。您可以使用 t 检验以及零假设和替代假设来检验这两组之间的差异。

何时使用 t 检验

只有在比较两组的平均值时才能使用 t 检验(也称为成对比较)。如果要比较两个以上的组,或者要进行多个成对比较,请使用ANOVA 检验 或事后检验。scribbr.com/statistics/one-way-anova/

t 检验是差异的参数检验,这意味着它对您的数据做出与其他参数检验相同的假设。t 检验假设您的数据:

是独立的是(大约)正态分布的。在被比较的每个组中具有相似的方差量(即方差同质性)

如果您的数据不符合这些假设,您可以尝试 t 检验的非参数替代方法,例如对方差不等的数据进行 Wilcoxon 符号秩检验。

我应该使用什么类型的 t 检验?

选择 t 检验时,您需要考虑两件事:被比较的组是来自单个总体还是两个不同的总体,以及您是否要测试特定方向的差异。

单样本、双样本还是配对 t 检验?一尾或二尾t检验?

在您测试花瓣长度是否因物种而异时:

执行 t 检验

t 检验使用组均值差异与两组合并标准误差的比率来估计两组均值之间的真实差异。您可以使用公式手动计算,或使用统计分析软件。

T 检验公式

两样本 t 检验(又名学生 t 检验)的公式如下所示。

在这个公式中,t是 t 值,x 1和x 2是被比较的两组的均值,s 2是两组的合并标准误差,n 1和n 2是在每个组。

较大的t值表明组均值之间的差异大于合并的标准误差,表明组之间的差异更显着。

您可以将计算出的t值与临界值图表中的值进行比较,以确定您的t值是否大于偶然预期的值。如果是这样,您可以拒绝原假设并得出两组实际上不同的结论。

统计软件中的 T 检验功能

大多数统计软件(R、SPSS 等)都包含 t 检验功能。这个内置函数将获取您的原始数据并计算t值。然后它将它与临界值进行比较,并计算一个p值。通过这种方式,您可以快速查看您的组在统计上是否存在差异。

在比较花瓣长度时,您决定使用 R 执行 t 检验。代码如下所示:

t.test(Petal.Length ~ Species, data = flower.data)

对正在比较的内容的解释,称为输出表中的数据。t值:-33.719 。请注意,它是负数;这可以!在大多数情况下,我们只关心差的绝对值,或者与 0 的距离。不管是哪个方向。自由度: 30.196 。自由度与您的样本量有关,并显示您的测试中有多少“自由”数据点可用于进行比较。自由度越大,您的统计检验就越有效。p值:2.2e-16(即 2.2 ,前面有 15 个零)。这描述了您偶然看到与此一样大的t值的概率。备择假设(H a )的陈述。在这个测试中,H a是差异不为 0。95% 的置信区间。这是一个数字范围,其中 95% 的时间均值的真实差异。如果您想要更大或更小的间隔,这可以从 95% 更改,但 95% 是非常常用的。每组的平均花瓣长度。展示 t 检验的结果

报告 t 检验结果时,要包括的最重要的值是t值、p值和检验的自由度。这些将向您的听众传达两组之间的差异是否具有统计显着性(也就是说,这不太可能是偶然发生的)。

您还可以包括被比较组的汇总统计数据,即均值和标准差。在 R 中,用于计算数据平均值和标准差的代码如下所示:

flower.data %>%

group_by(Species) %>%

summarize(mean_length = mean(Petal.Length),

sd_length = sd(Petal.Length))

相关阅读

添加新评论