# Предиктивные аудитории

Предиктивные аудитории — это набор моделей искусственного интеллекта, которые прогнозируют поведение пользователей и понимают, как лучше всего на них повлиять. Прогнозирование включает в себя прогноз вероятности оттока пользователя (churn probability), вероятности покупки (в разработке), прогнозирование размера скидки или бонуса для удержания (в разработке).

# Предсказание Оттока

# Модель

ML модель, изучающая историческое поведение пользователей, которые попадают под условия выборки, например, можно выбрать пользователей у которых средний чек больше чем 500 рублей или пользователей, которые покупали товары из определенной категории.

В рамках секции можно создавать несколько моделей под разные сегменты пользователей.

Жизненный цикл создания модели:

  1. Обучение модели на исторических данных.
  2. Валидация модели на данных, которые модель еще не видела.

Например, модель обучается на данных за июнь — август, после этого модель берет свой прогноз на сентябрь и сравнивает прогноз с фактическим поведением пользователей.

Метрики качества:

  • Auc-roc - общий показатель качества модели
    • При значении больше 0.7 модель дает качественный прогноз, которому можно доверять
    • При значении меньше 0.5 модель дает некачественный прогноз, которому нельзя доверять
  • Accuracy - характеризует качество модели, агрегированное по всем классам. Это полезно, когда классы для нас имеют одинаковое значение. В случае, если это не так, accuracy может быть обманчивой
  • Precision - доля правильно предсказанных положительных объектов среди всех объектов, предсказанных положительным классом
  • Recall - доля правильно найденных положительных объектов среди всех объектов положительного класса
  • TPR - доля правильных положительных прогнозов
  • TNR - доля правильных негативных прогнозов
  • FNR - доля неправильных негативных прогнозов
  • FPR - доля неправильных положительных прогнозов

# Создание Predictive audience

1. В разделе Audiences — Predictive Audiences создать новую аудиторию

Screenshot 2024-09-12 at 15.02.00.png
Screenshot 2024-09-12 at 15.02.00.png

2. Выбрать условия выборки пользователей для обучения и Период прогнозирования

Доступные условия:

  • AOV
  • Event trigger
  • URL
  • Visit Traffic Source
  • Products
  • Viewed Products
  • Added to Cart Products
  • Purchased
  • Device
  • Category
  • Country
  • Region
  • City
  • Browser
  • Audience
  • OS

Подробнее с условиями таргетинга в аудиториях можно ознакомиться по следующей ссылке: Управление аудиториями

Screenshot 2024-09-12 at 17.31.09.png
Screenshot 2024-09-12 at 17.31.09.png

Период прогнозирования: Период на который модель дает прогноз. Например, если выбрать 7 дней, то модель будет предсказывать вероятность, что пользователь не совершит покупку в ближайшие 7 дней.

3. Проверить метрики модели

Screenshot 2024-09-12 at 17.31.57.png
Screenshot 2024-09-12 at 17.31.57.png

# Использование Predictive audience

Predictive audience можно использовать в Experience Targeting, для персонализации контента пользователей с определенным уровнем риска оттока.

https://lh7-us.googleusercontent.com/042jFaNLDkZNV5tRantwz1lSphVx7BVeRbqmVcX6kp3azeJXRxBc9dST7JI-qYTeHzrsjAR8-bACWyZyu-7paeaKps-jRGIRf2Jxgo_fGLozKJE11hIkKTmD2DcHZ80GtZzenMsXn8jz0O4aHnMGlDM

Также можно выгрузить пользователей с определенным риском оттока и загрузить список в маркетинговую платформу. При выгрузке идентификатором пользователя в файле является тот же идентификатор, который передаётся в событиях Login / Signup.

Screenshot 2024-01-26 at 16.04.03.png
Screenshot 2024-01-26 at 16.04.03.png

# Требования к качеству данных

Для эффективного обучения модели нужно чтобы в исходную выборку попало 10 000 пользователей, которые совершили 1+ покупку за последние 16 недель.

Данные должны быть нормально распределены во времени. Например, 90% покупок относятся к периоду за последний месяц, а остальные 10% принадлежат другим 3 месяцам. Такое искажение может сильно повлиять на точность модели.