AdRiver - система управления интернет-рекламой
О компании Справочное руководство Вход в систему
 

Выбор профессионалов

AdRiver — высокотехнологичная система управления интернет-рекламой. Ведущие рекламные площадки и агентства уже выбрали её для решения своих бизнес-задач.

Рекламным агентствам  AdRiver DSP 
Владельцам сайтов  AdRiver SSP 
Управление рекламой  AdRiver DMP 
Новости

Технология построения сегментов в AdRiver

Сегменты собираются с помощью специальных математических алгоритмов — математических моделей. Для построения матмодели анализируется поведение посетителей сайтов определённой тематической категории. Их поведение сравнивается со случайными пользователями сети.

Признаки организуются в двойные условия («если посетил сайт-A и сайт-B», «если посетил сайт-A и был там не позднее N дней назад» и т.д.). Из всего множества возможных условий отбираются 500, которые чаще всего встречаются у целевой аудитории и реже всего у случайной. Вместе эти условия и составляют математическую модель. В процессе анализа поведения аудитории, выборка условий видоизменяется и уточняется. Этот процесс называется обучением матмодели.

На вход обученной модели поступает вся аудитория «Соловья». Каждый пользователь проверяется на соответствие всем условиям матмодели. Модель определяет уровень интереса пользователя к теме. Пользователь попадает в потребительский сегмент, если уровень его интереса превышает заданный порог.

Индивидуальная матмодель

Для построения индивидуальной модели, на сайте рекламодателя устанавливается код, который собирает информацию о посетителях. Необходимое для этого время зависит от посещаемости сайта и может составлять от нескольких дней до месяца. Модель может настраиваться на посетителей совершивших определенное целевое действие или соответствующих определённому сценарию поведения (например, просмотрели более двух страниц или были на сайте более 5 минут).

Алгоритм обучения индивидуальной матмодели аналогичен обучению общей. Анализируется поведение целевых посетителей сайта и сравнивается с поведением случайных пользователей сети. Из всего множества возможных условий отбираются те, которые чаще всего встречаются у целевой аудитории и реже всего у случайных пользователей. Вместе эти условия и составляет математическую модель.

На вход обученной индивидуальной модели поступает вся аудитория. Каждый пользователь проверяется на соответствие всем условиями матмодели. На выходе аудитория делится на несколько весовых категорий в зависимости от близости к эталонной модели поведения.

Двухуровневые деревья

Матмодель — это алгоритм, состоящий из многих парных условий — двухуровневых деревьев. На каждом уровне дерева проверяется один из признаков:

  • был или не был на сайте, в разделе или на конкретной странице тематической категории определённое количество раз
  • был ли там не позднее определённого срока

В дереве могут быть как признаки одного типа, так и разные.

Например: «Первое условие: «Был на сайте auto.ru не менее 3 раз?» Да/Нет. Если «да», то проверяется второе условие: «Был там не позднее 3 дней назад?» Да/Нет»

У двухуровневого дерева три ветви — три сочетания признаков. У каждой ветки есть свой вес.

В приведённом выше примере самый большой вес будет у ветви Да-Да. Самый низкий — у ветви «Нет». Средний — у ветви «Да-Нет».

Кука, проходя через дерево, получает один из этих весов. Потом все 500 весов суммируются. По суммарному весу система определяет входит кука в целевую аудиторию или нет.

Построение матмодели — это, прежде всего, её обучение. Для этого выборка аудитории делится пополам и на вход матмодели подаются целевые куки и случайные. В процессе обучения множество деревьев меняется, меняются сочетания признаков внутри деревьев и их параметры. В конце концов, в матмодели остаются деревья, которые содержат в себе самые часто встречающиеся у целевой аудитории сочетания признаков и их параметров. Одновременно эти же сочетания реже всего встречаются у случайной аудитории.

После обучения модель проверяется. Для этого на вход модели подаётся вторая половина аудитории. Если в процессе проверки матмодель делит аудиторию на целевую и случайную с допустимой погрешностью, то матмодель считается рабочей. В противном случае целевая выборка собирается заново: либо делается большая выборка, либо уточняется тематическая категория.

Категоризация сайтов

Для построения общей матмодели необходим каталог тематических сайтов. Сайты одной тематики и отдельные разделы сайтов объединяются в категории вручную. Сейчас этих категорий более 700. Категории формируют тематический каталог.

Аудитория тематической категории используется для обучения матмодели соответствующего потребительского сегмента. Сайты категории используются как параметры условий в матмодели.