Когда в вашей компании появляется новый клиент или запустился очередной проект с давним партнером, неизбежно формируется большой объем корпоративных документов. К ним относится вся «первичка»: счета-фактуры, счета на оплату, платежные поручения; документы бухгалтерской и налоговой отчетности (например, справка о доходах физлица). А кроме того уставные, страховые, нотариальные документы, KYC-анкеты, согласия на обработку персональных данных и т.д.
Зачастую компании обрабатывают миллионы листов корпоративных документов с помощью планшетного сканера. Сотрудники сканируют документы и переводят их в PDF-файлы. Поиск нужной информацию в этих копиях иногда превращается в квест.
Нередко банки, государственные компании и госкорпорации привлекают к обработке документов специальные онлайн-сервисы, которые в свою очередь нанимают операторами распознавания третьих лиц, обычно, самозанятых. В этом случае при несущественных затратах у заказчика возникает серьезный риск утечки данных и угроза мошенничества, за что компания и ее CEO, скорее всего, будут оштрафованы.
Утечки персональных данных могут обернуться для топ-менеджеров банков более серьезными последствиями. Так, при участии Банка России в начале 2024 года был разработан законопроект, который предусматривает отстранение топ-менеджеров банков от работы на десять лет за неоднократную утечку данных.
Более надежно обрабатывать данные в безопасном контуре, не используя внешние сервисы. Распознавание корпоративных документов сейчас можно поручить автономной системе на базе искусственного интеллекта, которая инсталлируется на любое устройство. Последней разработкой в этом классе является программный продукт Smart Document Engine. В июле 2024 г. Smart Engines обновила его до версии 2.4.0.
Распознавание счета на оплату:
Если говорить коротко, решение позволяет решить две главных задачи:
Как автономная OCR применяется в банках и МФО
Наша система помогает банкам улучшить качество обслуживания и увеличить точность, скорость и безопасность своих операций.
Быстрое распознавание справки о доходах физического лица (ранее – 2-НДФЛ) позволяет банкам полностью автоматизировать процесс так называемого «кредитного конвейера». Это система обработки заявок на кредитование и принятия решений на основе комплексного анализа данных заемщика. Она анализирует риск невозврата и определяет параметры кредита — условия, лимит, срок, обеспечение. Причем не имеет значения, идет ли речь о микрофинансировании, потребительском кредитовании, автокредитах, ипотеке.
Распознавание справки о доходах физических лиц:
Технология распознавания обнаруживает и извлекает из справки о доходах все данные табличной части, в том числе при размещении информации на двух страницах. Система обрабатывает до нескольких сотен атрибутов, содержащихся в справке о доходах.
Таким образом, автономная OCR для смартфона помогает банкам ускорить процесс коммуникации с клиентом и, что не менее важно, сократить число ошибок ввода, которые приводят к необоснованным отказам.
Технологии распознавания Smart Engines используются в банках не только для обработки документов, но и для считывания данных QR-кодов, банковских карт и при сканировании номеров телефонов.
Где OCR может использоваться еще?
Smart Document Engine©
Система анализа и распознавания документов
Автоматизация бухгалтерской отчетности
Давайте представим себе компанию Х, занимающуюся продажей гидравлического оборудования. В ней работает бухгалтер, который контролирует участок товарно-материальных ценностей (ТМЦ) и отвечает за оформление процессов закупки материалов, товаров и услуг. Ежедневно он обрабатывает по 60–70 первичных документов. На каждый из них у него уходит от 5 до 10 минут. То есть в день бухгалтер-материалист тратит на эти процессы по 6–7 часов.
Теперь предположим, что сотрудник вводит данные из документов не вручную, а с помощью системы распознавания первичных документов для десктопных, серверных и мобильных платформ.
OCR извлекает атрибуты счета-фактуры за 2–3 секунды, платежного требования — за 2 секунды. Иначе говоря, те же самые 60–70 документов решение обрабатывает за считанные минуты. При автоматическом вводе снижается и вероятность ошибки, исключается риск утечки.
Упрощение аудиторских проверок
Выездные аудиторы обычно работают в офисе клиента. Согласитесь, в условиях такой «полевой» работы каждая минута на счету. Вспомним, сколько стоит рабочее время таких выездных сотрудников. Такой режим задает высокую планку для допустимого времени извлечения данных из документа. А какова цена ошибки при вводе данных из важных бухгалтерских документов? Точность считывания данных для аудитора особенно важна.
Автоматизация программ лояльности
Хотя в мире уже сформировался тренд на автоматизацию процессов в работе с программой лояльности, многие компании по-прежнему предпочитают действовать по старинке: взамен заполненной от руки бумажной анкеты дают пластиковую карточку. При ручной обработке результатов анкетирования процент ошибок составляет около 30%, в то время как автоматический ввод данных обеспечивает гораздо более высокий уровень точности.
Smart Document Engine также обеспечивает защиту персональных данных пользователей программ лояльности. Это наиболее надежный вариант обработки персональных данных — в этом случае информация не покидает контур безопасности.
Если оператор персональных данных привлекает к их обработке внешних исполнителей, то это создает риск утечки. Пример тому — «Спортмастер».
31 декабря 2022 г. в одном из телеграмм-каналов был опубликован архив с данными клиентов «Спортмастера». В распоряжении злоумышленников оказались имена, даты рождения, номера телефонов и адреса электронных почт. Этот архив содержал всего 1,655 млн строк информации о пользователях.
«Спортмастер» объявил о начале расследования, которое должно выяснить причины инцидента. По предварительным данным, утечка произошла через одного из подрядчиков компании, который имел доступ к указанной информации. Название компании-подрядчика, попавшего под подозрение, «Спортмастер» не уточнил.
Но вернемся к нашему лонгриду. Где еще можно применять нашу безопасную OCR?
Обработка KYC-анкет
Система KYC — Know Your Customer или Знай своего клиента (ЗСК) — это процедура идентификации контрагентов, обязательная для банков, бирж, криптобирж и букмекерских контор.
С ее помощью организации защищают себя от риска работы с мошенниками, а также от контактов с лицами, внесенными в списки экстремистов и террористов.
В соответствии с этим принципом компании задают своим клиентам вопросы об их финансовой деятельности и т.д. Но сбор данных — это лишь первый этап, после которого следует обработка полученной информации. Система распознавания документов не только в разы увеличивает качество проверки данных из KYC-анкет, но и снижает санкционные риски.
Помимо распознавания паспорта или ID-карт, Smart Engines проверит подлинность удостоверяющих документов, найдет признаки редактирования файлов и установит факты компрометации изображений, которые предъявляются в ходе онбординга клиентов. В апреле в Smart Document Engine была добавлена возможность распознавания нескольких документов, удостоверяющих личность, в одном видеоклипе или изображении, что значительно ускоряет работу с ними.
Распознавание 15 документов за 1 секунду на сервере:
Обработка логистической документации
В качестве примера представим себе логистический склад, где водитель-экспедитор в соответствии с универсальным передаточным документом (УПД) или товарной накладной по форме ТОРГ-12 передает кладовщику под ответственное хранение весь товар. Какое оборудование, помимо шариковой ручки, в такие моменты под рукой? Максимум — терминал сбора данных или какой-то смартфон. Автономная OCR Smart Document Engine для мобильного телефона значительно ускорит работу кладовщика.
Распознавание накладной МХ-18:
На каком этапе развития компании пора внедрять OCR по распознаванию документов
AI-решение по распознаванию документов существенно повышает эффективность бизнеса и потому не может стоить дешево. В ряде случаев руководству компании в моменте удобнее держать в штате несколько человек, которые в течение дня вводят и обрабатывают документы (первичку, KYC анкеты, заявления и т.д.), чем нести затраты на покупку OCR.
Мы подсчитали, что если организация — вне зависимости от того, чем она занимается — обрабатывает более 100 тыс. документов в год или использует хотя бы двух операторов ручного ввода, то ей имеет смысл приобретать решение по распознаванию текста уже сейчас.
Спасибо, что дочитали до конца нашу статью!
Специально для вас мы собрали ее ключевые поинты:
Обработка документов с помощью планшетного сканера — это прошлый век;
Передача персональных данных на обработку третьим лицам, во внешние сервисы и на краудсорсинг грозит утечками, большими штрафами, дисквалификацией, уголовной ответственностью;
Обработку паспортных данных и другой чувствительной информации о клиентах необходимо проводить внутри своей ИТ-инфраструктуры - в контуре безопасности;
В июле вышла новая версия ПО по безопасному распознаванию корпоративных документов — Smart Document Engine. Это полностью российская разработка. OCR быстро и точно работает на смартфонах. А на сервере скорость распознавания достигает впечатляющих 15 страниц в секунду.
Smart Document Engine©
Система анализа и распознавания документов
Реклама: ООО «СМАРТ ЭНДЖИНС СЕРВИС», ИНН 7728328449, erid: LjN8KBp2o