Python для аналитика | data.hub
← Вернуться

Python для аналитика - с чего начать и что учить

Pandas, NumPy, визуализация - минимум для старта в аналитике данных.

Зачем аналитику Python?

Python расширяет возможности аналитика: автоматизация рутины, сложный анализ, машинное обучение, работа с API. Это не замена SQL и Excel, а мощное дополнение.

Что учить в первую очередь

1. Pandas - работа с таблицами

Pandas - это Excel на стероидах. 90% работы аналитика в Python - это Pandas.

import pandas as pd # Загрузка данных df = pd.read_csv('orders.csv') # Фильтрация df_paid = df[df['status'] == 'paid'] # Группировка revenue_by_day = df.groupby('date')['amount'].sum() # Новые колонки df['month'] = pd.to_datetime(df['date']).dt.month

2. NumPy - работа с числами

NumPy нужен для математических операций и статистики.

import numpy as np # Статистика mean = np.mean(data) median = np.median(data) std = np.std(data) # Перцентили p95 = np.percentile(data, 95)

3. Matplotlib / Seaborn - визуализация

Для построения графиков и визуального анализа.

import matplotlib.pyplot as plt import seaborn as sns # Простой график plt.plot(dates, revenue) plt.title('Revenue by Day') plt.show() # Seaborn - красивее sns.lineplot(data=df, x='date', y='revenue') sns.barplot(data=df, x='category', y='sales')

Совет: Начни с Jupyter Notebook - это интерактивная среда, где удобно экспериментировать с данными.

Практические примеры

Расчёт Retention

# Когортный анализ cohorts = df.groupby(['cohort_month', 'activity_month']).agg({ 'user_id': 'nunique' }).reset_index() cohorts['retention'] = cohorts.groupby('cohort_month')['user_id'].transform( lambda x: x / x.iloc[0] )

A/B тест

from scipy import stats # t-тест для сравнения групп control = df[df['group'] == 'control']['metric'] test = df[df['group'] == 'test']['metric'] t_stat, p_value = stats.ttest_ind(control, test) print(f'p-value: {p_value:.4f}')

Ресурсы для обучения

  • Stepik - курсы по Python на русском
  • Kaggle Learn - бесплатные курсы с практикой
  • DataCamp - интерактивные уроки
  • Практика на Kaggle - реальные датасеты

Хочешь освоить Python для аналитики?

На менторстве разбираем реальные задачи и строим проекты для портфолио

Узнать про менторство →

💬 Комментарии

Будьте первым, кто оставит комментарий!