Как с помощью когортного анализа определить — чего хочет пользователь?

Ася Тихомолова, руководитель отдела медиапланирования
2 ноября 2018

Каждый день мы оставляем за собой след, путешествуя по просторам всемирной паутины. Пользователи ежеминутно генерируют неисчислимое количество информации, делая вклад в формирование биг даты, работа с которой сегодня является необходимостью для большинства онлайн-бизнесов.

Из-за обилия данных становится сложнее определить пользу информации для принятия окончательного решения. Нужно заручиться определённым набором инструментов, чтобы оперативно ориентироваться в массивах даты и эффективно работать с ними. Один из них — когортный анализ, об особенностях которого я расскажу в этой статье.

Что это такое

Когортный анализ — подраздел поведенческой аналитики, направленный на получение информации о паттернах и тенденциях поведения пользователя на протяжении определённого промежутка времени в рамках его жизненного цикла. Современный когортный анализ помогает не только обрабатывать данные, но и наглядно их визуализировать.

  1. Как покупатели взаимодействуют с сайтом на протяжении длительного промежутка времени?

  2. Какие паттерны пользовательского поведения существуют и в чём могут быть их причины?

  3. Какой эффект имеют на пользователей разные рекламные кампании?

Если вы задаётесь этими вопросами и не знаете, как быстро найти на них ответ — поможет когортный анализ.

Основной принцип когортного анализа — разделение данных на родственные группы (когорты) на основе перформанс-метрик или бизнес-показателей. Это отличается от классического подхода, когда массив данных рассматривается и анализируется целиком.


Чаще всего пользователи делятся на когорты в зависимости от времени целевого действия — посещение страницы, регистрация, заполнение формы, загрузка, покупка и т.д. Другими словами, когорта — это сегмент пользователей, которые совершили определённое действие в заданный интервал времени.

Простой пример деления покупателей на когорты на основе даты первой покупки:


Когортный анализ позволяет сконцентрироваться только на тех данных, которые имеют значение для определённых целей. Мы можем быстрее выявить поведенческие тренды и определить факторы, влияющие на эти тренды, рассматривая пользователей в рамках когорт на конкретных промежутках времени.

Этот метод анализа помогает определить причины оттока пользователей, оценить эффективность рекламных кампаний в долгосрочной перспективе и стратегии удержания клиентов, узнать их покупательские привычки.

Алгоритм когортного анализа

Клиент — региональный интернет-магазин профессиональной косметики.

Цели анализа — определить, как пользователи взаимодействуют с интернет-магазином на протяжении времени и выяснить причины паттернов покупательского поведения, если такие будут обнаружены.

Для анализа использовались данные из CRM: дата и сумма заказа, order ID и client ID, а также канал, по которому клиент пришёл на сайт.


Взяли интересующий нас отрезок времени, чтобы определить, к какой когорте относится пользователь. Отрезок, в нашем случае год, разбили на равные интервалы — месяцы. Когорты пользователей строили на основе даты первой покупки.


Благодаря этим данным удалось определить, сколько прибыли принесла каждая когорта в течение года.


Диаграмма помогает лучше понять информацию.


На основе полученных данных можно сделать выводы:

  • Члены каждой когорты приносят клиенту наибольшую прибыль в течение первого месяца, затем количество покупок существенно снижается;

  • Клиенты позитивно реагируют на «техники удержания», например, ремаркетинговые кампании или приуроченные к праздникам акции — это видно по пикам активности пользователей на диаграмме;

  • Существующие клиенты имеют потенциал для развития. С ними необходимо работать, чтобы увеличить прибыль, избежав затрат на привлечение новых клиентов.

Есть много сценариев, по которым можно построить когортный анализ. Всё ограничивается только доступными вам данными и смекалкой. Начать можно с простого и быстрого анализа — вы точно сможете сделать его «на коленке».

5 шагов:

  1. Подготовить данные о пользователях и покупках;

  2. Импортировать данные в Google Sheets;

  3. Привести их в порядок;

  4. Прописать формулы и создать таблицы;

  5. Наслаждаться своим великолепием.

1. Подготовка и импорт данных

Вне зависимости от того, насколько глубоким вы планируете анализ и сколько факторов хотите затронуть, ваш сет данных должен содержать:

  • Дату, на основании которой пользователь будет определён в какую-либо когорту — например, дата регистрации;

  • Дату конверсионного действия — покупки, скачивания и т.д.



2. Создание таблицы

Легче всего визуализировать таблицу, где строки — когорты, а столбцы — интервал времени, на протяжении которого пользователи совершают или не совершают необходимое действие.


Цифра в этой клетке означает, сколько пользователей, зарегистрированных с октября по ноябрь, совершило конверсионное действие.

3. Приводим данные в порядок

В первую очередь нужно отформатировать и развести данные по разным листам, чтобы процесс анализа был максимально быстрым и удобным.

Создайте лист, где будут храниться ваши исходные данные: ID пользователей, даты регистрации и конверсионных действий, столбец с нумерацией пользователей (для подсчёта количества пользователей в когорте необходимо каждому присвоить значение 1)


Таблицу с результатами анализа и диаграммами лучше вынести на отдельный лист.

4. Работа с формулами

Формула SUMIFS суммирует данные в интервале на основе разных критериев.

=SUMIFS (sum range, criteria_range1, criterion1, [criteria_range2, criterion2, ...])

Проще говоря,

sum_range = колонка с результатом (какое кол-во человек принадлежит к той или иной когорте);

criteria_range1 = диапазон поиска;

criterion1 = критерий поиска;

criteria_range2 & criterion2 = добавочные условия, которые можно использовать для определения более сложных сегментов.

Для примера выше:

sum_range = интервал, включающий всех рассматриваемых пользователей;

criteria_range1 = диапазон дат, в течение которых пользователь должен зарегистрироваться, чтобы принадлежать какой-либо когорте;

criterion1 = диапазон дат, в течение которых произошло конверсионное действие (доп. критерий отбора пользователей).

Формула должна выглядеть таким образом:

=SUMIFS('Data'!$F$2:$F$625,'Data'!$D$2:$D$625,">"&$C$1,'Data'!$D$2:$D$625,"<"&$D$1,'Data'!$E$2:$E$625,">"&A7,'Data'!$E$2:$E$625,"<"&A8)

5. Визуализация результатов

Для получения результатов останется заполнить таблицу, используя формулу (по примеру), посчитать сумму каждой когорты и построить диаграмму.



Формула проверяет данные на предмет соответствия заданным условиям: дата регистрации и конверсионного действия, и по итогу выводит сумму — количество пользователей в когорте. Диаграмма делает понятнее динамику их поведения.

Готово! Вы только что справились с когортным анализом. Теперь сможете получать полезные инсайты о вашей аудитории, не затрачивая на это много времени и сил.

Инструмент станет ещё полезнее, если добавить несколько метрик и условий, а также исследовать недельные или дневные когорты.


Статья подготовлена для портала CMS-magazine и впервые опубликована здесь.