Recommender system |
Вначале несколько примеров.
Пример 1.
Сеть магазинов Target в США с помощью этих технологий решила определить модель покупательского поведения для беременных женщин.
Для этого они собрали данные обо всех покупках женщин, которые участвовали в их программе лояльности для беременных, и проанализировали их с
помощью математических алгоритмов и машинного обучения. Оказалось, что на начало второго триместра беременности женщины обычно покупают лосьоны
без запаха, а через несколько недель начинают покупать пищевые биодобавки и так далее. Закономерности в изменениях покупательского поведения так
четко прослеживались, что по ним даже можно было определить срок беременности с точностью до недели.
Благодаря полученным данным, розничная сеть смогла составить алгоритм для определения беременности по покупкам. Со временем эта система персонального таргетирования стала настолько точной и продвинутой, что она зачастую определяла беременность женщины раньше, чем та узнавала о ней сама. Если модель покупательского поведения женщины говорила о том, что она беременна, Target начинала показывать ей определенную рекламу, предлагать скидки на товары, которые ей вскоре могут понадобиться.
Используя чрезвычайно разнородную статистику о конкретном пользователе интернет-магазина (откуда он пришел, демографические данные, привычки поведения в интернете и др.), можно сформировать уникальные товарные предложения и акции под поведенческий портрет конкретного покупателя. Такие рекомендующие системы в интернет-магазине должны анализировать доступную информацию и принимать решения в течение нескольких секунд (пока потребитель находится на сайте). Разработка таких рекомендаций зависит от области и конкретных характеристик данных. Например, фильму на сайте Netflix часто проставляют рейтинги по шкале от 1 (не нравится) до 5 (понравилось). Такой источник данных записей позволяет реализовать взаимодействие между пользователями и элементами запроса. Кроме того, используя такие атрибуты, как демографические данные и описание продукта, система может иметь доступ к конкретному пользователю и пункту конкретного профиля. Рекомендующие системы отличаются по способу анализа этих источников данных для исследования связи между пользователями и элементами запроса, которые могут быть использованы для выявления хорошо коррелирующих пар клиент-сервис. В основе рекомендующих систем лежит коллаборативная фильтрация системы анализа истории взаимодействия и content-фильтрация на основе системы атрибутов сервисов (товаров или услуг). Кроме того, существуют гибридные методы, использование которых представляет собой попытку объединения обеих этих конструкций.
Общая структура рекомендующей системы.
Сообщение Netflix об окончании конкурса.
Матрица рейтинов \(r_{u,i} \) , соответствующих пользователю u и объекту \(i \).
Общая схема content-фильтрации..