Топ-50 вопросов с собеседований
Реальные вопросы с интервью на позиции Data Analyst и Product Analyst. Кликни на вопрос, чтобы увидеть ответ.
SQL
1. В чём разница между WHERE и HAVING?
WHERE фильтрует строки до группировки (до GROUP BY), а HAVING фильтрует группы после агрегации. WHERE работает с отдельными строками, HAVING - с результатами агрегатных функций (COUNT, SUM, AVG и т.д.).
2. Объясни разницу между INNER, LEFT, RIGHT и FULL JOIN
INNER JOIN возвращает только совпадающие строки из обеих таблиц. LEFT JOIN возвращает все строки из левой таблицы + совпадения из правой (NULL если нет совпадения). RIGHT JOIN - наоборот. FULL JOIN возвращает все строки из обеих таблиц.
3. Что такое оконные функции? Приведи пример
Оконные функции выполняют вычисления по группе строк, связанных с текущей строкой, без свёртки данных. Пример - ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY date) для нумерации заказов каждого пользователя.
4. Как найти дубликаты в таблице?
SELECT column, COUNT(*) as cnt
FROM table
GROUP BY column
HAVING COUNT(*) > 1;
5. Напиши запрос для расчёта накопительной суммы
SELECT date, revenue,
SUM(revenue) OVER (ORDER BY date) as cumulative_revenue
FROM daily_sales;
6. Чем отличается UNION от UNION ALL?
UNION объединяет результаты и удаляет дубликаты. UNION ALL объединяет всё, включая дубликаты. UNION ALL работает быстрее, так как не тратит ресурсы на удаление дубликатов.
7. Как работает GROUP BY с несколькими колонками?
Группировка происходит по уникальным комбинациям значений всех указанных колонок. Например, GROUP BY city, product создаст отдельную группу для каждой комбинации город + продукт.
8. Что такое CTE и зачем он нужен?
CTE (Common Table Expression) - временный именованный результат запроса, определяемый через WITH. Делает сложные запросы читаемыми, позволяет переиспользовать подзапросы и упрощает отладку.
Продуктовые метрики
9. Что такое Retention и как его считать?
Retention - процент пользователей, вернувшихся в продукт через N дней после первого визита. Retention Day 7 = (пользователи, вернувшиеся на 7 день / когорта первого дня) × 100%. Ключевая метрика для оценки "липкости" продукта.
10. В чём разница между ARPU и ARPPU?
ARPU (Average Revenue Per User) = Выручка / Все пользователи. ARPPU (Average Revenue Per Paying User) = Выручка / Платящие пользователи. ARPPU всегда выше ARPU и показывает средний чек платящих.
11. Как рассчитать LTV?
LTV = ARPU × Lifetime (средний срок жизни клиента). Для подписочных моделей: LTV = ARPU / Churn Rate. Важно: LTV должен быть минимум в 3 раза больше CAC для здоровой экономики.
12. Что такое когортный анализ?
Группировка пользователей по дате первого действия (регистрации, покупки) и отслеживание их поведения во времени. Позволяет сравнивать поколения пользователей и видеть тренды.
13. Метрика DAU упала на 20%. Как будешь искать причину?
1) Проверить технические проблемы (баги, падение серверов). 2) Сегментировать по платформам, странам, источникам трафика. 3) Посмотреть на новых vs старых пользователей. 4) Проверить изменения в продукте или маркетинге. 5) Сравнить с историческими данными (сезонность).
14. Что такое North Star метрика?
Главная метрика продукта, которая отражает ценность для пользователя и коррелирует с ростом бизнеса. Примеры: для Spotify - время прослушивания, для Airbnb - количество забронированных ночей.
A/B тесты и статистика
15. Что такое статистическая значимость?
Вероятность того, что наблюдаемый результат не случаен. Обычно используют порог p-value < 0.05 (95% уверенность). Если p-value меньше порога - результат статистически значим.
16. Что такое ошибки I и II рода?
Ошибка I рода (False Positive) - нашли эффект там, где его нет. Ошибка II рода (False Negative) - не нашли эффект там, где он есть. Уменьшение одной ошибки увеличивает другую.
17. Как определить размер выборки для A/B теста?
Зависит от: 1) базовой конверсии, 2) минимального детектируемого эффекта (MDE), 3) статистической мощности (обычно 80%), 4) уровня значимости (обычно 5%). Есть калькуляторы: Evan Miller, Optimizely.
18. Что такое AA-тест и зачем он нужен?
Тест, где обе группы получают одинаковый опыт (без изменений). Нужен для проверки корректности системы сплитования. Если AA-тест показывает значимую разницу - проблема в методологии.
19. Когда нельзя использовать A/B тест?
Когда: 1) мало трафика для достижения значимости, 2) изменение влияет на всех пользователей (например, цены), 3) есть сетевые эффекты между группами, 4) нужны долгосрочные выводы, а времени мало.
Кейсы и задачи
20. Конверсия корзины упала. Как найдёшь причину?
1) Сегментация по устройствам, браузерам, платформам. 2) Анализ воронки - на каком шаге отваливаются. 3) Проверка технических ошибок. 4) Сравнение новых и старых пользователей. 5) Анализ изменений в продукте/маркетинге в этот период.
21. Как бы ты измерил успех новой фичи?
1) Определить цель фичи и целевую метрику. 2) Выбрать guardrail-метрики (что не должно упасть). 3) Провести A/B тест. 4) Дождаться статистической значимости. 5) Проверить долгосрочный эффект (новизна может искажать).
22. Пользователь говорит, что фича не работает, но данные показывают рост. Что делать?
1) Проверить сегменты - возможно, проблема у части пользователей. 2) Убедиться в корректности метрики. 3) Провести качественное исследование (интервью). 4) Возможно, метрика не отражает реальную ценность.
Общие вопросы
23. Расскажи о себе / своём опыте
Структура: 1) Кратко о бэкграунде (30 сек). 2) Релевантный опыт с конкретными достижениями. 3) Почему интересна эта позиция/компания. Не пересказывай резюме - выдели главное и покажи результаты.
24. Почему хочешь работать аналитиком?
Расскажи про интерес к данным и решению бизнес-задач. Приведи примеры, когда анализ данных тебя увлекал. Покажи, что понимаешь суть работы аналитика - не просто считать, а влиять на решения.
25. Расскажи о сложном проекте
Используй STAR: Situation (контекст), Task (задача), Action (что делал), Result (результат с цифрами). Покажи свой вклад и чему научился.
Хочешь подготовиться к собеседованиям?
Ментор проведёт mock-интервью и поможет подготовиться к реальным собеседованиям
Узнать про менторство →