Skip to main content

A/B 测试统计学显著性计算器 使用 p 值、置信水平和提升度来计算 A/B 测试的统计学显著性。

A/B 测试计算器 illustration
📱

A/B 测试计算器

使用 p 值、置信水平和提升度来计算 A/B 测试的统计学显著性。

1

输入变体 A 数据

输入控制变体的访客数和转化率。

2

输入变体 B 数据

输入处理变体的访客数和转化率。

3

查看结果

查看置信度、p 值、提升度和获胜变体。

Loading tool...

What Is A/B 测试计算器?

A/B 测试计算器可以判断两种测试变体之间的差异是否具有统计学意义,还是由随机机会引起的。输入每个变体的访客数量和转化率,即可获得:统计置信度、p 值、相对提升、z 得分,以及一个明确的判决结果,表明您是否拥有显著的获胜者。该工具使用双比例 z 检验,这是比较转化率的标准统计方法。在 95% 的置信水平下(p < 0.05),被认为是显著的,这意味着差异发生的概率小于 5%,可以排除偶然性的影响。

Why Use A/B 测试计算器?

  • 标准双比例 z 检验方法论
  • 95% 置信度下的明确显著性判决
  • 显示 p 值、z 分数和转化率
  • 变体之间的相对提升度计算
  • 视觉置信指标

Common Use Cases

着陆页测试

比较不同页面版本的转化率。

电子邮件营销

测试主题行、CTA 和电子邮件设计。

广告创意

确定哪个广告创意带来更多转化。

社交媒体

比较不同帖子格式的参与度。

Technical Guide

计算器使用双比例 z 检验来比较两个独立群体的转化率。检验统计量 z = (p1 - p2) / sqrt(p_pooled × (1 - p_pooled) × (1/n1 + 1/n2)),其中 p_pooled = (x1 + x2) / (n1 + n2)。p 值是使用正态分布近似从 z 得分中计算出来的。为了获得可靠的结果,请确保每个变体至少有 1,000 名访客,并让测试运行至少 1-2 个完整的业务周期(通常为 1-2 周)。在开始测试之前,预先计算所需的样本大小,以确保足够的统计学力量。

Tips & Best Practices

  • 1
    目标至少每个变体 1,000 名访客以获得可靠结果
  • 2
    让测试运行至少 1-2 周,以考虑日常和周模式
  • 3
    一次只改变一个变量,清晰的因果归属
  • 4
    不要提前查看结果 -- 这会膨胀假阳性率
  • 5
    95% 置信度意味着仍然有 5% 的机会结果是随机的

Related Tools

Frequently Asked Questions

Q 什么是统计学意义?
这意味着观察到的差异不太可能由于随机机会。 在 95% 置信度下,差异是巧合的概率小于 5%。
Q 我需要多少访客?
目标至少每个变体 1,000 名访客。预期差异越小,所需样本大小越大。
Q 什么是好的 p 值?
p 值低于 0.05(5%)是行业标准的统计学意义。

About This Tool

A/B 测试计算器 is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.