Фото: Дмитрий Духанин/Коммерсантъ
Поделиться
С октября 2023 года крупные онлайн-площадки в обязательном порядке начали раскрывать, как работают их алгоритмы рекомендаций. Теперь можно задаваться вопросом «Почему у меня это в ленте?» не риторически, а предметно и по пунктам изучить, что влияет на рекомендованные товары на маркетплейсах или песни в VK или «Яндекс.Музыке». «Фонтанка» узнала, какие данные интернет-пользователей интересуют российские компании и почему в правительстве потребовали эту информацию разглашать.
В октябре VK, «Яндекс», Ozon, Wildberries, «Сбермаркет», «М.видео-Эльдорадо», ivi и Start опубликовали на своих ресурсах правила применения своих рекомендательных алгоритмов — по требованию нового закона, вступившего в силу с начала октября. Он распространяется на соцсети, маркетплейсы и онлайн-кинотеатры. Теперь крупные онлайн-площадки должны объяснять, на основании чего у их пользователей составляется лента рекомендаций.
Сами рекомендательные алгоритмы позволяют онлайн-сервису изменять список и порядок данных, выдаваемых конкретному пользователю в ответ на его запрос. Сейчас такими алгоритмами пользуются практически все сайты, начиная от поисковиков, заканчивая приложением каким-нибудь небольшого цветочного магазина. Как подчеркнули игроки рынка, это не сюжет очередной серии «Черного зеркала» — ваши данные и так собирают, а тут как бы вам на пользу, чтобы сервисом было удобнее пользоваться.
«Фонтанка» ознакомилась со списком данных, которые компании используют для составления ленты рекомендаций. В большинстве своем пункты формальные и очевидные, вроде лайков и отметок «интересно» и «неинтересно», но есть и любопытные параметры, на которые почему-то обращают внимание компании.
У «Яндекса» теперь появился раздел «Правила рекомендаций», где перечислены сведения для каждого из сервисов компании, от «Алисы» до «Яндекс.Музыки» и «Кинопоиска». Причем в списке четко прописано, что в компании «для борьбы с предвзятостью» используют специальные тесты и методики, чтобы гарантировать, что «алгоритм не дает несправедливого преимущества или дискриминации определенных групп или контента».
Сам поисковик учитывает историю запросов пользователя, клики по ссылкам в результатах и время возврата на страницу поиска, информацию об устройстве пользователя, о его геолокации, cookie-файлы, язык запросов и страниц в результатах выдачи. В «Кинопоиске» на рекомендации влияет история поиска, оценки, которые пользователь ставит, и добавление фильмов в коллекцию.
С «Яндекс.Go» интереснее. И такси, и доставка учитывают географию заказов и поездок, способы оплаты, местоположение пользователя и его предпочтения по тарифам. То есть, если часто заказывать «комфорт», то автоматически сразу будут предлагать «комфорт». Любопытнее то, что предлагают самокатчикам — страховку. Да, если часто кататься на самокатах от «Яндекса», то сервис предложит «застраховать своё здоровье и здоровье окружающих, а также смартфон на случай, если он упадет во время поездки и повредится».
В «Яндекс.Музыке» играют роль отметки «нравится» и настройки предпочтений. В их числе, например, настроение треков — бодрый он, веселый или грустный, степень знакомства с песней или исполнителем и сходство прослушанного с другим контентом. У «Алисы» в числе первых данных — возраст, видимо, чтобы колонка не сболтнула ребенку лишнего.
Правила работы рекомендаций от VK больше напоминают какого-нибудь блогера, который просит ставить лайки и подписываться. «Чтобы было проще найти контент, который понравится именно вам, мы применяем рекомендательные технологии. Все ваши лайки, комментарии, репосты, просмотры — все это учитывается при подборе видеороликов, которые мы вам предлагаем», — говорится в ролике VK. Отметки «Мне нравится», «Это не интересно», «Поделиться» и подписки влияют на факт и очередность показа контента едва ли не в первую очередь.
Но есть и более любопытное. На ленту рекомендаций влияет и то, как часто пользователь оставляет комментарии, смотрит посты того или иного сообщества или пользователя, на кого подписывается и где проживает. А еще VK изучает, кого пользователи добавляют в друзья. Работает это, видимо, по принципу «скажи мне, кто твои друзья, а я скажу, какие у тебя рекомендации в VK».
Ozon учитывает около 300 параметров: и товара, и пользователя, который эти товары просматривает. Влияют на показы той или иной продукции ее характеристики и рейтинг, а еще то, как долго покупатель просматривает товары, оформляет заказ или добавляет что-то в корзину. Wildberries тоже тщательно бдит, что его клиент делает на сайте, а заодно собирает информацию о его провайдере, браузере и операционной системе. А еще — разрешение и глубину цветности экрана на устройстве. Зачем — не уточняется.
Онлайн-кинотеатр Start учитывает жанровые предпочтения пользователя, то, как часто он фильмы и сериалы смотрит и какие из них досматривает до конца. Ivi обращает внимание на покупки, добавление в избранное, просмотры и обратную связь от пользователя — активную или пассивную.
Большая часть правил работы рекомендательных алгоритмов от компаний довольно формальные — подробную цепочку «я зашел с этого браузера, лайкнул фото одноклассницы, послушал эту песню, поэтому у меня в рекомендациях вот это» составить не получится даже близко, потому что внутренняя кухня и сами формулы компании оставляют в секрете, объяснил «Фонтанке» генеральный директор диджитал-агентства Uplab Павел Тарелкин.
Закон и не требует раскрытия коммерчески чувствительных нюансов работы, публикация правил работы алгоритмов, скорее, формирует доверительные отношения платформ с пользователями, рассказал гендиректор ассоциации «Интернет-видео» Алексей Бырдин. «При обсуждении законопроекта с ключевыми игроками интернет-рынка эти опасения были устранены как на уровне закона, так и подзаконных актов. Сегодня большинство сервисов уже разместили информацию о применении рекомендаций у себя на сайтах», — отметил он.
Другой вопрос в том, что компании разместили. «Пока все, что опубликовали площадки, — это абсолютно базовые вещи, общие слова. Самих алгоритмов здесь нет — только параметры. Очень все кратко и неконкретно. Для чего — я не могу ответить на этот вопрос сам себе», — подчеркнул Павел Тарелкин.
Грубо говоря, сейчас онлайн-площадки выложили на стол ингредиенты, но рецепта не дали. Есть параметры, а самое главное — что с этими параметрами делают и как и в каких пропорциях они влияют на ленту рекомендаций — ни одна из компаний не раскрывает.
«Сказать, что пользователь что-то важное с законом получил, я не могу. Возможно, это сделано, чтобы в случае чего проверить (методы работы рекомендательных алгоритмов компании. — Прим. ред.), но я не думаю, что Роскомнадзор будет активно этим пользоваться, особенно с крупным бизнесом», — предположил Павел Тарелкин.
Регулирование рекомендаций обсуждается с 2021 года. Депутатов, как вспоминают в одном из крупных интернет-агентств, всегда больше всего смущал антиправительственный контент, который мог попадать на основе рекомендательных алгоритмов в ленты пользователей. «Вспомните протесты 2021 года. Тогда вся лента ныне запрещенных сетей была в роликах с митингами — естественно с внутренней кухней того, как это в ленты попадает, решили ознакомиться и этот процесс проконтролировать», — рассказали «Фонтанке».
В одной из предварительных версий законопроекта предлагали обязать владельцев информационных ресурсов дать пользователям возможность отказаться от рекомендательных технологий — полностью или частично. Против этой инициативы выступали владельцы соцсетей и поисковых систем: в их числе и VK, и Яндекс.
«Если запретить рекомендательные алгоритмы, то это откатит все сервисы лет на двадцать назад. Нам просто неудобно будет ими пользоваться. Да и сбор данных будет осуществляться и без рекомендательных алгоритмов — для той же рекламы», — пояснил «Фонтанке» генеральный директор диджитал-агентства Uplab Павел Тарелкин.
В итоге онлайн-площадки отделались малой кровью. В октябре внесли изменения в Федеральный закон «Об информации, информационных технологиях и о защите информации». Принятые поправки обязывают их публиковать правила использования алгоритмизированных сведений. Они должны включать описание процессов и методов сбора данных, их систематизации и анализа, а также способов осуществления таких процессов и методов таргетирования запросов пользователей.
«Основное требование нового закона — это прозрачность применения рекомендательных технологий. Владельцы сайтов и приложений, использующих механизм рекомендаций, теперь должны объяснять пользователю, по каким принципам он работает, какие данные собирает, как их обрабатывает. Всё это должно быть отражено в правилах, написанных простым и понятным русским языком», — рассказал «Фонтанке» автор законопроекта и член комитета по информационной политике Антон Горелкин.
Теперь, если ресурс не информирует пользователей о том, по какому принципу работают их рекомендации, либо если эти технологии используются для распространения запрещенной информации, то в дело может вмешаться Роскомнадзор. То есть — потребовать доступ к программно-техническим средствам и проверить, как рекомендации работают.
Если будут выявлены нарушения, то на их устранение владельцу дано десять дней. Иначе — сначала запрет на использование рекомендательных технологий, потом — блокировка. При этом новые требования не распространяются на государственные информационные системы и госорганы. Зато коснется зарубежных — это подтвердил «Фонтанке» и Антон Горелкин. Правда, подчинит ли себе Роскомнадзор Google или YouTube — большой вопрос, считают игроки рынка. Еще интереснее — не развяжут ли принятые изменения регулятору руки.
«Закон обязателен к исполнению для всех сайтов и приложений, которые используют функционал рекомендаций. В том числе, и зарубежных. Я уверен, что регулятор использует свои широкие полномочия таким образом, чтобы не допускать дисбаланса правоприменения в отношении российских платформ», — заверил «Фонтанку» Антон Горелкин.
Милена Солдатенко, «Фонтанка.ру»
Фото: Дмитрий Духанин/Коммерсантъ