Содержание
- пользователи совершают обращение после нескольких визитов на сайт, поэтому модель атрибуции Last Click дает некорректные данные
- заявки и звонки часто совершаются одним и тем же пользователем, что приводит к дублированию данных и ошибкам в расчетах итоговых показателей
- клиент хотел бы видеть данные по обращениям (включая звонки) в едином отчете
- вопрос выбора модели атрибуции, которая наиболее точно покажет вклад каждого источника в конверсию
- стандартный API Google Analytics не отдает данные в заданных моделях атрибуции
- не все звонки корректно передавались в Google Analytics
Реализация
1. Client ID
Нужно добавить Client ID в Google Analytics. Это основной параметр для сведения данных и построения моделей атрибуции. Из всех инструкций по установке Client ID, мы выбрали метод Simo Ahava. После сбора статистики по Client ID в течение нескольких месяцев, получили данные для анализа.2. Big Analytics Data
Для выгрузки данных по API из Google Analytics мы выбрали инструмент Big Analytics Data. Он бесплатный, удобный, позволяет регулярно обновлять данные. Также, он показывает семплирование данных и позволяет его обходить. Работает как дополнение к Google SpreadSheets, устанавливается аналогично:


3. Запрос по API к коллтрекингу
Помимо данных из Google Analytics, нужны данные коллтрекинга. Изучив справку API коллтрекинга, написали запрос:

4. Объединение таблиц: аналитика и коллтрекинг
Соединяем таблички в единое целое:

5. Группировка All Rows
Основной метод объединения данных по Client ID в Power Query — группировка All Rows (Все строки). C её помощью мы получили табличку из 2 столбцов — Client ID и все остальные данные:





6. Удаление дублей в обращениях
Сводим к единице или нулю количество обращений по каждому Client ID. Если клиент не обращался — ноль, если обратился хотя бы один раз — единица:
7. Вычисление количества обращений
Рассчитываем ценность каждого визита в обращении (value). Если суммарное количество хитов равно нулю, считаем, что пользователь сразу вышел с сайта. Если есть хотя бы один хит — считаем отношение количества хитов в конкретном визите к общему числу хитов:

8. Статистика по кампаниям
Агрегируем данные по рекламным кампаниям, считаем количество обращений (value_app):
9. Оптимизация рекламных кампаний
Подгружаем расходы, строим график по расходам (costs) и стоимости обращения по модели «активность пользователя» (CPA_active). Видим, какие кампании нуждаются в оптимизации:
10. Сравниваем модели атрибуции
Из графика сравнения моделей атрибуции видно, что модель Last Click идет в отрыве от остальных и не является объективной. Модель атрибуции по данным активности очень похожа на линейную модель, но мы считаем её более интересной благодаря учету действий пользователя на сайте. Красный столбец — стоимость обращения по модели атрибуции «активность пользователя». Желтый столбец — стоимость обращения по модели атрибуции «First Click». Фиолетовый столбец — стоимость обращения по модели атрибуции «Last Click» Оранжевый столбец — стоимость обращения по линейной модели атрибуции.