Что такое A/B тест
A/B тест - это эксперимент, где пользователей случайно делят на две группы: контрольную (A) и тестовую (B). Группа A видит старую версию, группа B - новую. Сравниваем метрики и делаем выводы.
Ключевые понятия
Статистическая значимость (p-value)
Вероятность получить такой же или более экстремальный результат, если на самом деле разницы между группами нет. Стандартный порог: p-value < 0.05 (95% уверенность).
Простыми словами: если p-value = 0.03, то вероятность, что результат случаен - всего 3%.
Статистическая мощность (Power)
Вероятность обнаружить эффект, если он реально существует. Стандарт: 80%.
Минимальный детектируемый эффект (MDE)
Минимальное изменение метрики, которое мы хотим обнаружить. Чем меньше MDE - тем больше нужна выборка.
Как рассчитать размер выборки
Размер выборки зависит от:
- Базовая конверсия - текущее значение метрики
- MDE - какой эффект хотим поймать
- Значимость (α) - обычно 5%
- Мощность (1-β) - обычно 80%
Типичные ошибки
❌ Остановка теста раньше времени
Если остановить тест, как только p-value < 0.05, вероятность ложноположительного результата резко возрастает.
Не подглядывай! Не останавливай тест раньше времени, даже если видишь "хороший" результат.
❌ Множественные сравнения
Если тестируешь 20 метрик, одна из них покажет значимость просто случайно.
❌ Игнорирование новизны
Пользователи реагируют на новое. Эффект может быть временным.
AA-тест
Тест, где обе группы получают одинаковый опыт. Нужен для проверки системы сплитования. Если AA-тест показывает значимую разницу - проблема в методологии.
Хочешь научиться проводить A/B тесты?
Разберём реальные кейсы и научимся анализировать эксперименты
Узнать про менторство →
💬 Комментарии
Будьте первым, кто оставит комментарий!