Фото: https://www.gosuslugi.ru/
Поделиться
Уже до конца года региональные информационные сервисы оснастят функцией автоматизированного поиска услуг, которая уже известна пользователем «Госуслуг» под именем «Робот Макс». «Фонтанка» по-новому взглянула на двухлетней давности игрушку и рассказывает, почему она не избавит горожан от общения с живыми людьми в окошках госведомств.
Функционал робота доработают и до конца года завершат его миграцию на платформу «Гостех», — сообщили в конце недели «Ведомости». После этого региональные разработчики получат возможность добавлять его на свои сайты.
Внедрение на петербургских госсайтах передовой поисковой системы с «Госуслуг» не станет панацеей от врожденных проблем, но сделает их чуточку понятнее гражданам. По крайней мере именно таковой была логика создания «Робота Макса». «Фонтанка» протестировала его работу и готова засвидетельствовать: многое у него получается. А больше от него и не требуется.
Робот Макс — разумеется, никакой не робот, несмотря на его аватар на сайте «Госуслуг». Заголовки даже самых серьезных госСМИ от 2021 года вроде «Пользователей нового портала госуслуг будет консультировать робот», — не более, чем метафора. Речь всего лишь о системе поиска по заголовкам статей об услугах, которые можно получить на портале. Как «Яндекс», но со своей спецификой.
Поскольку услуг этих многие тысячи, а подавляющее большинство пользователей портала не имеют научных степеней в области Search Engine Optimization (SEO), перед разработчиками этой системы стояла нетривиальная задача — научить своего «робота» переводить человеческий язык (зачастую с грубыми ошибками) на весьма специфический «канцелярский» язык, которым написаны и описаны госууслуги. Ну и как-то соединить все это в одной точке.
«Границы получения услуг, кому можно или нельзя, когда и как, описываются официальными формулировками. Часто используются канцеляризмы и аббревиатуры. Вместо «налоговая» — «ФНС» или «Федеральная налоговая служба». Вместо «ремонтировать» — «производить ремонт». Люди так не разговаривают. Но завтра же изменить язык государство не сможет. Законы и акты придется переписать, для новых внедрить редакционную политику, научить сотрудников. А госуслуги нужны сейчас. Так мы поняли, что людям нужен переводчик с «государственного», — рассказывал в своем блоге руководитель команды разработчиков робота Макса Никита Устриков.
Тот рассказ был очень подробным, и предназначен, в первую очередь, для специалистов-айтишников. Для обывателя же общий смысл сводился к формуле «все сложно», и наглядно иллюстрировался схемой архитектуры поисковика.
Фото: hsto.org
Поделиться
Нет смысла подробно описывать внутренности этого робота, которые создавались командой в 70 человек одного из подразделений компании «РТЛабс» (структура «Ростелекома»). Достаточно просто понимать, как он работает. В первую очередь запросы разделяются по длине. Это важно, ведь по статистике больше 70% запросов на «Госуслугах» состоит не более чем из трех слов, причем, 49% — всего одно.
Это означает, что в половине случаев робот оказывается один на один с человеком, который не может сформулировать, что ему нужно, и хочет, чтобы за него все придумали и сказали, куда идти, а в ряде случаев и — зачем. И значит задача поисковой системы тут будет не столько в поиске нужного ответа, сколько в выяснении, чего именно требуется клиенту.
На запрос пользователя, например, «паспорт», система должна, для начала, догадаться, о каком паспорте идет речь: общегражданском, заграничном, ветеринарном, паспорте транспортного средства, паспорте жилого дома и много еще вариантов паспортов. Далее надо понимать, что слово «паспорт» присутствует примерно во всех описаниях порядка получения госуслуг. Ну и напоследок — надо догадаться, чего человек хочет с этим своим паспортом сделать: получить, поменять, продлить, забрать уже готовый и т.п.
В итоге, как убедилась «Фонтанка», для начала робот Макс предлагает всего три варианта: «Что вас интересует — Паспорт РФ, Загранпаспорт, Нет нужного ответа».
В самом простом и банальном случае — «Паспорт РФ», — Макс предлагает шесть, видимо, самых распространенных вариантов, включая банальное «Оформить паспорт РФ» и нетривиальное «Перенести визит». Далее идет интуитивно понятное дерево вариантов, которое ранее или позднее приводит человека на страницу, где он может либо заказать какую-то услугу, либо узнать, почему ему ничем нельзя помочь.
Поделиться
Если выбрать вариант «Нет нужного ответа», начинается канитель. В первый раз он предложит три варианта, среди которых «Выдача паспорта на музыкальные инструменты и смычки». К своему стыду мы не знали, что такое бывает, прошли дальше по этой ветке и все выяснили.
Если продолжать каждый раз жать «Показать, что нашлось еще», можно узнать «Что делать с паспортом умершего человека», «Как заменить паспорт гражданина СССР», и даже «Что такое паспорт». Где-то на седьмой итерации Макс начал повторяться, а к десятой начал предлагать совсем странное, вроде «Как оформить ИНН на ребенка, как получить выписку из ЕГРН», или оптимистичное «Как получить паспорт без очередей и на 30% дешевле», а затем и вовсе подсунул адрес 3 отделения Красносельского отдела по вопросам миграции МВД РФ.
Поделиться
Из объяснений Никиты Устрикова следовало, что, к примеру, по сути, одинаковые запросы «какой размер пошлины за замену паспорта?» и «сколько платить за замену паспорта» робот воспримет немного по-разному за счет появления слова «какой».
«Оно содержится в разметке для статьи «Штраф за просрочку замены паспорта», т.к. люди часто спрашивают именно: «Какой штраф...». Если вы введете фразы «размер пошлины за замену паспорта» и «сколько платить за замену паспорта», то Макс предложит одинаковые результаты., — объяснял «родитель» поисковой системы.
Потом «Фонтанка» намеренно написала слово «паспорт» с шестью разными ошибками (да, нам пришлось подумать), каждый раз Макс догадывался, что мы имеем в виду. Почти во всех случаях он просто показывал результаты выдачи по слову «паспорт», и лишь случае с «Паспарт» он на всякий случай осторожно поинтересовался, действительно ли мы хотим посмотреть результаты поиска по такому слову. Если нажать «да», все равно все рассказывается про обычный паспорт РФ (а не загранпаспорт и не ветеринарный).
Итак, с первой — действительно непростой — задачей по встрече с незнакомым с бюрократической машиной человеком Макс пусть со скрипом, но справляется.
Дальше мы попробовали более конкретный вариант: «Как получить повторное свидетельство о рождении». Тут Макс блеснул. С первого раза выдал: кому можно получить такое, кому нельзя, куда идти и что делать.
Поделиться
Но это явно очень обычный и частый вопрос, так что мы задали действительно небанальную и редкую задачу: «Как многодетным получить компенсацию за взносы на капремонт в Петербурге». И тут Макс явно спасовал.
Поделиться
Ни в первой, ни во второй, ни в третьей итерации «Показать, что нашлось еще» ничего даже примерно похожего не было. А когда на седьмой раз Макс предложил почитать «Правила выплаты компенсации на собаку-проводника», мы перестали над ним издеваться.
Тот же запрос в «Яндексе» первым же вариантом выдал нам ссылку на страничку того самого регионального ГИС Петербурга (в лице комитета по информатизации и связи), который сейчас будут оснащать роботом Максом, где все ясно и понятно описано по заданной проблеме.
Поделиться
Возможно, когда Макса «поженят» с петербургской системой госуслуг, ему будет проще искать ответы на наши мелкие провинциальные запросы. Пока же у него тут явный пробел.
Стоит отметить, что когда система поиска, позже получившая название «Робот Макс», разрабатывалась в недрах экосистемы «Ростелекома», компанией-разработчиком «РТЛабс» руководил никто иной, как Максут Шадаев, нынешний глава Минцифры РФ.
К слову, к моменту релиза этой поисковой системы ее авторы подверглись довольно обидной критике от гуру отечественной IT-отрасли Игоря Ашманова, который, в ряду огромного количества разнообразных достижений, имеет опыт работы и с поисковыми технологиями, и с госзаказами.
«Мужики, вы переоткрываете для себя все мельчайшие грабли обычного информационного поиска по базе знаний. И рассказываете об этом, как об откровении.
Прямо по всем шагам, умилительно. Разработчики внезапно узнают про машинную морфологию и основы слов! ШОК, Фото!!!
Потом про синонимы! Потом про проблему коротких текстов! Потом про поиск по каталогу!!! И т.п.
Вы, похоже, делали всё с нуля, «с мороза». Причём, похоже, сначала вам казалось, что нужно просто »правильно сформировать стек технологий» — и он всё сделает.
И вы в итоге справились: построили штуку уровня примерно 2001 года. На hunspell и таком же всяком.
А нельзя было просто нанять кого-то, кто знает, как это на самом деле делается? Люди же в отрасли есть. Куча народу работала в поиске Яндекса, в Мыле и т.п.
Более того, у вас там рядом должен был кто-то остаться из Спутника, где также все эти проблемы давно решены, и морфология своя, и поисковик, всё принадлежит РТ».
В открытом доступе комментариев этих слов ни от «Ростелекома», ни от «РТЛабс» в лице хоть Максута Шадаева, хоть Никиты Устрикова не последовало.
Денис Лебедев, «Фонтанка.ру»
Фото: https://www.gosuslugi.ru/Фото: hsto.org