# Статистические выбросы

Платформа персонализации Gravity Field позволяет исключать статистические выбросы как в разрезе пользователей с экстремальным числом конверсий, так и в разрезе монетарных показателей.

Когда речь идёт о расчёте финансовых показателей кампаний, т.е. когда кампании персонализации (или A/B тесты) оцениваются по выручке или среднему чеку, простое сложение всех покупок, совершённых в рамках вариации не всегда показывает правильный результат. Представим себе, что в вариацию A попало 10 000 пользователей и они совершили 1 300 покупок, а в вариацию B попало также 10 000 пользователей, но они совершили 1 200 покупок. По количеству покупок вариация A выигрывает со статистической достоверностью 98.4% (см. иллюстрацию).

Теперь обратимся к финансовым показателям. Мы видим, что 1 300 покупок из вариации A принесли нам 3 900 000 рублей, а 1 200 покупок из вариации B 4 297 000 рублей. Получается, что выигрывает вариация B? (см. таблицу с исходными значениям) Но давайте взглянем на сами заказы. Мы увидим, что в вариации A все заказы по 3 000 рублей, а в вариации B есть один заказ на 700 000 рублей, при этом все остальные так же по 3 000 рублей.

A/B Test Data (исходные значения)

Получается, что один заказ влияет на финансовые показатели всей кампании. Чтобы избежать таких ситуаций, в серьёзных системах A/B тестирования есть возможность исключать чрезмерно крупные покупки из результатов тестирования.

В платформе Gravity Field при исключении экстремумов (аутлаеров) применяется следующая схема: все суммы заказов секции в платформе за последние 30 дней, сортируются от самой крупной к самой маленькой, затем берутся верхние и нижние 5% списка и значения выручки в этих заказах заменяются на значения самого 95-го или 5-го персентиля. В нашем случае 700 000 рублей будет заменено на 3 000 рублей и мы получим следующие данные (см. таблицу с расчётными значениями).

A/B Test Data (расчётные значения)