Разработка и внедрение AI
Разработка приложения с нейросетью
Создание нейросети
Компьютерное зрение
Разработка приложения с искусственным интеллектом
ChatGPT внедрить в компанию
Создать прототип нейросети
MVP приложения с ChatGPT

Прогнозирование оттока клиентов (в розничной торговле) – подход в реальном проекте

В этой статье вы узнаете, как определить клиентов, которые могут перестать делать покупки в ближайшем будущем, почему важно вовремя выявлять таких клиентов, какие шаги необходимы для построения прогноза оттока, как выбрать и оценить модель, а также о ключевых методиках анализа результатов.

В простых словах, прогноз оттока — это определение клиентов, которые могут перестать делать покупки в ближайшем будущем. Но зачем это нужно?

Представим, что у нас есть продуктовый магазин, который в последние два года рос примерно на 10% в год. Однако сейчас мы ожидаем снижение темпов роста — примерно минус 1% в этом году при нынешних тенденциях. Что нам делать в такой ситуации?

Есть два возможных пути: первый — увеличить количество новых клиентов, второй — повысить удержание прежних клиентов. Какой из них важнее? Обычно привлечение новых клиентов стоит дороже всего, поэтому мы считаем, что стоит сосредоточиться на удержании уже имеющихся. Для этого сначала нужно определить, какие покупатели могут уйти в ближайшие месяцы. Это и называется прогнозированием оттока.

С помощью анализа оттока мы получаем список клиентов, которые рискуют уйти. Дальше мы делим их на три группы и предоставляем им особые предложения:

  • Группе 1 — дополнительно 5% скидки в следующем месяце,
  • Группе 2 — подарочный купон при покупке на сумму от 2000,
  • Группе 3 — 10% скидки на комплектные наборы товаров.
Мы надеемся, что это поможет вернуть покупателей и снова выйти на путь роста.

Теперь, когда стало ясно, зачем это нужно, давайте разберёмся, как правильно проводить анализ оттока.

Этапы:

  • Определение структуры модели
  • Подготовка исходных данных с зависимыми и независимыми переменными
  • Выбор подходящей модели классификации
  • Оценка результатов

Хотите узнать, как лидеры российского рынка используют наши решения?


Ознакомьтесь с маркетинг-китом AllSee, где собраны реальные кейсы и решения, доказавшие свою эффективность в бизнесе!

Определение моделирующей конструкции

Этот этап очень важен при построении модели прогнозирования оттока клиентов. Он требует серьезного внимания, хотя на практике многие специалисты по данным уделяют ему недостаточно времени, а на самом деле он играет ключевую роль. На этом этапе принимаются основные решения. Давайте разберёмся подробнее.

Для нашего продуктового магазина есть несколько вопросов, на которые нужно ответить:

Как определить, подходит ли клиент под наш анализ?

  • Например, это могут быть клиенты, которые совершили покупку:
  • в текущем месяце,
  • за последние два месяца,
  • за последний год,
  • либо по более сложному условию — например, если клиент совершал покупки хотя бы в трёх месяцах из последних двенадцати.

Что такое “отток” в нашем случае, какой именно отток мы хотим спрогнозировать?

  • Например, ушедшим клиентом можно считать того,
  • кто не совершит покупок в течение следующего месяца,
  • или не будет совершать покупки в течение двух последующих месяцев и так далее.

Обычно, чтобы получить ответы на эти вопросы, мы советуемся с бизнесом и внимательно анализируем данные. Для нашего магазина, например, после обсуждения с управляющим, выяснили: если клиент не покупал ничего два месяца, то вероятность его возвращения очень мала. Поэтому для нас ушедший клиент — тот, кто не делал покупок два месяца.

Далее нужно сформулировать, кто будет считаться «подходящим клиентом» для анализа, и для этого потребуется снова обратиться к данным. Что здесь важно учитывать? Наша задача — выяснить, каким был покупательский путь ушедших клиентов. Если мы видим, что клиенты начинают менять свои покупки за три месяца до ухода, то можно определить, что для анализа подойдут клиенты, совершавшие хотя бы одну покупку в последние три месяца. Окончательные условия лучше всего сформулировать после детального анализа, который нужно провести отдельно.

Когда на эти вопросы получены ответы, можно переходить к следующему шагу.

Входной набор данных с зависимыми и независимыми переменными

Если возникает вопрос, почему нужно так подробно определять понятия, давайте покажем их связь на этом этапе. Для построения модели нам нужны зависимые и независимые переменные, но есть только транзакционные данные. Как из них получить нужные переменные?

Допустим, у нас есть данные до октября 2024 года, и мы хотим спрогнозировать отток клиентов за ноябрь-декабрь 2024 года.

Начнём с того, как будет выглядеть прогнозируемый набор данных. Для каждого клиента нам нужно предсказать вероятность оттока. Поэтому данные нужно агрегировать на уровне клиента.

Поскольку данные есть до октября 2024 года, все независимые переменные будем собирать за август-октябрь 2024 года, затем передадим их модели и получим прогноз оттока на следующие два месяца.

Теперь рассмотрим, как создать обучающую выборку для модели.

  • Зависимая переменная — Для неё мы создаём специальную отметку на основе условия двух месяцев без покупок. Используя данные до октября 2024 года, берем последние два месяца для её создания. Если подходящий клиент (который совершал хотя бы одну покупку за предыдущие три месяца — июнь-август 2024 года) не сделал ни одной покупки в сентябре-октябре 2024 года, то ставим ему признак "ушёл" (1), а для остальных ставим "остался" (0).

  • Независимые переменные — Их может быть много, но все показатели нужно агрегировать только за трёхмесячный период (июнь-август 2024 года). Это могут быть: общая сумма покупок, количество уникальных приобретённых товаров, частота покупок, давность последней покупки, предпочтительный способ оплаты и другие параметры. Этот этап должен быть максимально полным: нужно собрать все переменные, которые могут как-то влиять на вероятность ухода клиента.

Если непонятно, зачем мы столько рассматривали разные определения на предыдущих шагах, давайте разъясним это здесь. Для любой модели нужны зависимые и независимые переменные, а у нас только транзакционные данные. Как их получить?

Предположим, что данные у нас есть до октября 2024 года, и мы хотим прогнозировать уход клиентов на ноябрь–декабрь 2024 года.

Для прогноза по каждому клиенту нам нужна вероятность оттока, поэтому все данные нужно обобщить на уровне каждого клиента. Вот как это делается:

Поскольку наши данные заканчиваются октябрём 2024 года, основные показатели (независимые переменные) мы будем собирать за август–октябрь 2024 года, передавать их модели и на их основе получать прогноз ухода клиентов на следующие два месяца.

Но как сделать обучающую выборку?

  • Зависимая переменная — делается с флагом, который отмечает уход клиента при условии двух месяцев без покупок. Используем последние два месяца из наших данных: если подходящий клиент (тот, кто за предыдущие три месяца — июнь–август 2024 года — хотя бы раз совершал покупку) не сделал никаких покупок в сентябре–октябре 2024 года, мы отмечаем его флагом “ушёл” (1). Остальные получают флаг “остался” (0).

  • Независимые переменные — их может быть много, но для всех берём только трёхмесячный период — с июня по август 2024 года. Сюда можно включать, например, общую сумму покупок, количество уникальных приобретённых товаров, частоту покупок, как давно была последняя покупка, варианты оплаты и другие параметры. Этот шаг нужно проработать очень тщательно и включить все переменные, которые могут выявить признаки того, что клиент покинет магазин.

Ищете проверенные ИИ-решения, которые реально работают?


В нашей подборке — 85 уникальных ИИ технологий для маркетинга, ритейла, HR и других сфер, которые уже приносят выгоду компаниям.

Выбор подходящей модели классификации

Основная подготовка завершена, и теперь нужно выбрать подходящую модель для обучения. По нашему опыту, алгоритмы на основе деревьев, такие как Random Forest и XGBoost, часто показывают хорошие результаты благодаря высокой точности и удобству объяснения решений моделей.

Если доля клиентов, которые ушли, очень мала, требуется использовать специальные методы для работы с несбалансированными данными.

Оценка

В практике обычно применяется метод кросс-валидации, чтобы убедиться, что модель не переобучается. Для оценки качества работы модели можно использовать разные метрики: точность (Precision), полноту (Recall), F1-меру, ROC-кривую и другие.

Существует ещё один часто используемый подход для проверки моделей оттока — это анализ по децилям, Gain Charts и Lift Charts. Суть в том, что если выбрать случайно 10% всех клиентов, то среди них будет примерно 10% от общего числа покинувших клиентов. А если выбрать 10% клиентов с самой высокой предсказанной вероятностью ухода, то можно посмотреть, какой процент ушедших клиентов в них попадает. Например, если среди выбранных по прогнозу 10% клиентов оказалось 30% всех ушедших, то это значит, что модель обладает положительным “лифтом” и работает эффективно.

Надеемся, статья оказалась для вас полезной.

Не уверены, нужен ли вашему бизнесу искусственный интеллект?


Специальная анкета от AllSee поможет оценить текущие бизнес-процессы и понять, где ИИ станет вашим конкурентным преимуществом.

Создайте новое будущее с нашими решениями

Похожие статьи
Показать еще
© ООО «АЛЛ СИИ», 2025
ИНН 4000007028
КПП 400001001

Реквизиты счета
ФИЛИАЛ "САНКТ-ПЕТЕРБУРГСКИЙ" АО "АЛЬФА-БАНК"
Корреспондентский счет 30101810600000000786
БИК 044030786
Расчетный счет
40702810032200004699
ИНН 7728168971
КПП 780443001