Распознавание документов: Распознавание документов на частном примере — обзор доступных платных и бесплатных решений

Содержание

Smart Document Engine: оптическое распознавание документов

Smart Document Engine

— система автоматического анализа и распознавания документов для десктопных, серверных и мобильных платформ.

 

Smart Document Engine — высокопроизводительная система автоматизации обработки документов и форм. Система предназначена для автоматизации обработки документов, документооборота и оптимизации процессов массового ввода документов. Smart Document Engine позволяет быстро и надежно распознавать текстовые и иные реквизиты первичных, деловых, уставных, бухгалтерских, налоговых, нотариальных, юридических, страховых и банковских документов, а также типовых анкет и форм строгой отчетности.

 

Как и другие продукты Smart Engines, система распознавания документов Smart Document Engine работает полностью автономно — данные НЕ передаются ни на какие сервисы, НЕ сохраняются, и для работы системы НЕ требуется доступ в интернет. Вся обработка документов ведется локально на устройстве клиента.

 

За счет использования state-of-the-art алгоритмов компьютерного зрения, компактных глубоких нейросетевых моделей с преобразованием Хафа (HoughNet и HoughEncoder) и энергоэффективной технологии распознавания текста GreenOCR®, разработанных нашими учеными и инженерами, Smart Document Engine позволяет решать даже на обычных мобильных телефонах задачи оптического распознавания деловых документов, которые раньше были доступны только высокопроизводительным серверам.

 

В результате современный мобильный телефон позволяет распознавать поток со специализированного документного сканера производительностью до 30 страниц в минуту, что ранее было доступно только высокопроизводительным рабочим станциям или серверам. При этом не принося в жертву качество распознавания, а обеспечивая высочайшую точность распознавания текстовых, цифровых и иных данных документа. Так, распознавание справки 2-НДФЛ на телефоне Galaxy S10 в среднем занимает меньше 3 секунд. При этом система одинаково хорошо и быстро обрабатывает как сканы анкет, так и фотографии, автоматически выполняя все действия, необходимые для классификации, извлечения из них данных и распознавания текста с учетом геометрических искажений, перепадов и неравномерностей освещения характерных для фотографий.

 

Важным аспектом Smart Document Engine является возможность создания специализированных решений для конкретных заказчиков, позволяющих производить автоматическую обработку, классификацию, распознавание и анализ документов и форм любой сложности. Заказные решения позволят вашей организации снизить издержки и нагрузку на персонал, внедрив высокоэффективное и высокоточное поточное сканирование и распознавание документации, оптимизированное под конкретный поток данных и под существующие бизнес-процессы, при этом исключив передачу каких-либо данных сторонним сервисам или третьим лицам.

 

Технология GreenOCR®, входящая в систему Smart Document Engine, обеспечивает высокую точность распознавания печатного текста (OCR), рукопечатного и рукописного заполнения полей (ICR), а также распознавание меток и чекбоксов (OMR). Система построена на принципе — “что вижу, то распознаю”, и не использует лингвистических моделей, а высокое качество распознавания текста достигается предельно высокой точностью распознавания символов. Это позволяет достигать высокой точности оцифровки документов, избегая ошибок когда система распознавания подменяет результат исходя из той или иной лингвистической или статистической модели языка.

 

Разработчикам при встраивании системы Smart Document Engine в десктопные, серверные и мобильные приложения доступен простой API (application programming interface), который позволяет реализовать систему распознавания документов документов в программах написанных на популярных языках программирования: C, C++, C#, Java, Python, PHP, Swift, Objective C для широкого круга операционных систем: iOS, Android, Sailfish Mobile, МОС «Аврора», Linux, Windows, macOS, ОС Эльбрус, РЕД ОС, Astra Linux, ОС Атликс, ОС Альт Линукс. и др. Имеется возможность подключения к популярным фреймворкам RPA и продуктам 1С.

 

Подробнее о распознавании платежек, счетов, KYC анкет, согласий и доверенностей

 

Подробнее о распознавании анкет, опросников и других форм

 

Подробнее о распознавании учредительных, бухгалтерских и учетных документов

 

Заказать продукт или консультацию

31.08.2020 Распознавание документов теперь доступно в 1С:Бухгалтерии без установки расширения

В 1С:Бухгалтерии версии 3.0.81 появилась возможность упростить ввод некоторых первичных документов с помощью

сервиса распознавания бухгалтерских документов.

Достаточно отсканировать или сфотографировать документы и отправить их на распознавание. Через несколько минут документы будут распознаны и доступны к вводу в вашем приложении.

Сейчас доступно распознавание Счетов-фактур, ТОРГ-12, УПД, Актов и Счетов на оплату.

Сервис сейчас предоставляется в пилотном режиме, правила его использования могут уточняться в будущем.

Обучающие видео

Смотрите обучающие видео по использованию сервиса распознавания бухгалтерских документов:

Как воспользоваться

Главная форма (список задач) сервиса доступна в разделах Продажи и Покупки главного меню в разделе Сервис под названием Загрузить документы из сканов (фото).

Доступ к настройкам подсистемы распознавания документов и к списку мобильных приложений открывается через иконки и  на главной форме подсистемы.

Также настройки подсистемы распознавания документов можно найти в составе пункта меню

Администрирование под названием Настройки распознавания документов.

Отказ от расширения

Расширение Библиотека распознавания больше не понадобится и поддерживаться не будет.

После обновления 1С:Бухгалтерии на версию 3.0.81 при открытии списка задач Вам будет предложено перенести данные из расширения.

Пожалуйста, воспользуйтесь этим предложением, если хотите сохранить все распознанные документы и настроенные мобильные приложения. Впрочем, это необязательно: вы можете не переносить данные и начать использование с чистого листа.

После переноса данных (или осознанного отказа от их переноса) расширение можно удалить.

В 1С:Бухгалтерии появилось распознавание документов: как это работает

В 1С:Бухгалтерии с версии 3.0.81 появилась возможность упростить ввод некоторых первичных документов с помощью сервиса распознавания бухгалтерских документов. Специалист 1С:ИТС Тимофей Антипин рассказал, как это работает.

Тратите время на заведение первички вручную? Эта статья для вас.  

Неважно, в офисе или дома — теперь для ввода первичных документов достаточно отсканировать или сфотографировать документы и отправить их на распознавание. Если дома нет сканера — смартфон всегда под рукой. 

Распознавание документов есть только в сервисе 1С:Фреш в программе 1С:Бухгалтерия. На данный момент доступно распознавание Счетов-фактур, ТОРГ-12, УПД, Актов и Счетов на оплату. 

Обращаем внимание, что пользователи с действующим договором 1С:ИТС уровня ПРОФ могут работать в облачном сервисе 1С:Фреш бесплатно
 


На наш взгляд, распознавание документов — это первое значимое отличие в функционале облачной и коробочной версии, которое позволяет сделать однозначный выбор в пользу 1С:Фреш.

Для того чтобы воспользоваться сервисом распознавания документов в приложении 1С:Бухгалтерия нужно зайти в «Администрирование» — «Настройки распознавания документов» и поставить галочку «Использовать распознавание документов».

Рис. 1 (нажмите, чтобы увеличить) 


Представим, что пришли 3 документа, которые надо ввести в информационную базу:

  • поступление с УПД;
  • один Акт оказанных услуг; 
  • счет на оплату.

Сканируем документы и получаем файл с изображениями. В приложении 1С:Бухгалтерия откройте «Продажи» или «Покупки» и нажмите «Загрузить документы из сканов (фото)». В открывшемся окне нажмите кнопку «Добавить файлы».

Рис. 2 (нажмите, чтобы увеличить) 


Перетащите файлы в открывшееся окно или выберите их с диска.

Рис. 3 (нажмите, чтобы увеличить) 


Далее нажмите кнопку «Распознать».

Рис. 4 (нажмите, чтобы увеличить) 


В списке задач на распознавание появились новые записи в статусе «В обработке».

Рис. 5 (нажмите, чтобы увеличить) 


Спустя несколько минут документы распознаются и сменят статус на «Распознанные».

Рис. 6 (нажмите, чтобы увеличить) 


Открываем первый документ.

Рис. 7 (нажмите, чтобы увеличить) 


Слева отображаются основные свойства документа, справа — изображение отсканированного документа, а снизу — табличная часть документа. Далее проверяем номер, дату и сумму и контрагента. Если контрагента нет в информационной базе, 1С предложит создать контрагента по данным отсканированного документа. После проверки корректного заполнения всех полей, нажмите кнопку «Создать документ». В базе создался документ «Поступление услуг».

Рис. 8 (нажмите, чтобы увеличить) 


После создания документа программа автоматически перейдет к вводу следующего распознанного документа. Аналогичным образом создаем оставшиеся документы. Предварительно проверьте корректность автоматического заполнения полей, в том числе наименование номенклатуры, и при необходимости исправьте ошибки.

Таким образом, всего за несколько минут мы завели в базу 3 документа.

Для ускорения работы рекомендуем сканировать (фотографировать) документы и загружать их по несколько штук.



                       
Автор статьи: Тимофей Антипин,
специалист отдела 1С:ИТС 
«АСП-Центр сопровождения».
                                               
Заказать консультацию                  

Вместе с этим читают: