Automatic recognition of business forms and documents

Smart Document Engine

— automatic analysis and data extraction from business documents for desktop, server and mobile platforms.

 

Smart Document Engine — high-performance software for automatic classification, recognition and analysis of documents and forms. The system helps to automate document management workflows and optimize document entry processes. Smart Document Engine quickly and securely scans and extracts the required data from various document types — standard and reporting forms, primary, business, statutory, financial, notarial, legal, insurance and banking documents, as well as standard questionnaires and forms of strict accountability.

 

Like other Smart Engines products, Smart Document Engine works autonomously – data is NOT transferred to servers, is NOT saved or stored and internet access is NOT required. The document recognition process is performed on the user’s device.

 

Thanks to our state-of-the-art recognition and computer vision algorithms, compact deep neural network models with the Hough transform (HoughNet and HoughEncoder) and energy efficient GreenOCR ® text recognition technology developed by our scientists and engineers, Smart Document Engine solves business document recognition tasks even on mobile phones, previously only high-performance servers managed to do it.

 

Thanks to Smart Engines technologies, a modern mobile phone scans a document stream from a specialized document scanner with a capacity of up to 30 pages per minute, previously only high-performance workstations or servers were able to do it. At the same time, the quality is on a high level and the solution ensures the best text recognition, digital and other document data accuracy. Thus, the recognition of a full-page tax certificate on Galaxy S10 takes less than 3 seconds. At the same time, the system quickly and precisely scans both scans and photos and automatically performs all the actions necessary for classification, data extraction and text recognition, robust to lighting conditions, geometric distortions and poor image quality.

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

 

The GreenOCR® technology included in Smart Document Engine provides high recognition accuracy of printed texts (OCR), handprinted and handwritten form fields (ICR), as well as label and checkmarks recognition (OMR). The implemented AI-based approach “I extract what I see” does not use linguistic models and high-quality text recognition is achieved by extremely high accuracy of character recognition. Thus, it allows you to achieve high digitization accuracy and avoid errors when the recognition system substitutes the result based on a particular linguistic or statistical language model.

 

The developers are provided with the simple API to integrate Smart Document Engine into the software, with support for various programming languages such as C, C++, C#, Java, Python, PHP, Swift, Objective C for a wide range of operating systems: iOS, Android, Sailfish Mobile, Aurora OS, Linux, Windows, macOS, Elbrus OS, RED OS, Astra Linux, Atlix OS, Alt Linux, etc. It is also possible to connect with popular RPA frameworks.

 

Send Request

Smart Document Engine customers

Gazprombank

Gazprombank integrated Smart Engines AI for forms and documents scanning

Rosbank

Rosbank implemented an artificial intelligence solution for the paperwork

Tessi

Tessi partners with Russian developers of ID recognition systems Smart Engines

Alfa Insurance

Alfa Insurance has introduced the Intelligent Document Recognition system from Smart Engines

 

 

Send Request



Overview

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Lorem ipsum

 

The most important feature of Smart Document Engine is the ability to create specialized solutions for automatic processing, classification, recognition and analysis of documents and forms of various complexity required by particular customers. High-performance and accurate document recognition solutions, optimized for a specific data flow and business processes, will allow your organization to reduce costs and ease the workload processing, without compromising data security — the images are not transferred to any third-parties or their services.

Send Request

Поставка

С помощью Smart Document Engine SDK вы сможете добавить функциональность глубокого анализа и распознавания документов как в ваши инфраструктурные решения для автоматизации back office, так и в мобильные приложения, для максимального упрощения удаленного автоматического ввода документов.

 

Smart Document Engine поставляется в виде автономного SDK (software development kit), содержащего все необходимые прекомпилированные библиотеки, документацию программного интерфейса и примеры интеграции для различных языков программирования. Для разработчиков подготовлен простой, но многофункциональный API (application programming interface), который позволяет внедрить распознавание документов в решения с использованием языков C++, C#, Java, Python и Objective-C для широкого круга операционных систем: iOS, Android, Linux, Windows, MacOS, в том числе Sailfish Mobile, МОС “Аврора”, ОС Эльбрус, РЕД ОС, Astra Linux, и другие. Обеспечивается поддержка следующих аппаратных платформ: x86_64, ARM v7, v8 (Aarch32, Aarch64), MIPS, Эльбрус. Имеется возможность подключения к популярным фреймворкам RPA и продуктам 1С.

 

Документы, распознаваемые “из коробки” включают в себя свидетельство о постановке на налоговый учет гражданина РФ (ИНН), справка 2-НДФЛ, платежное поручение (форма 0401060), бухгалтерский баланс (форма 0710001), отчет о финансовых результатах (форма 0710002), а также справки о результатах анализов ПЦР нескольких популярных лабораторий России.

 

При необходимости ввода документов, удостоверяющих личность, технология органично дополняется нашим продуктом Smart ID Engine, который с высочайшим качеством и скоростью распознает более 1600 различных типов документов. Распознавание кодифицированных объектов, таких как машиночитаемые зоны (MRZ) и баркоды, доступно за счет использования Smart Code Engine.

 

 

Send Request

Features

GreenOCR
Разработанная учеными и инженерами нашей компании в рамках инициативы Green AI технология GreenOCR обеспечивает непревзойденные качество и скорость распознавания при минимальном потреблении энергии и воздействии на окружающую среду. Все вычисления выполняются на CPU, не требуя использования дополнительных акселераторов вычислений типа GPU. Технология позволяет распознавать машинописные тексты (OCR), тексты написанные “от руки” (ICR) и метки (OMR).

 

Точность
Мы создали новое поколение технологий OCR, преодолевшее рубеж качества традиционных подходов за счет использования наших последних достижений в вычислительном интеллекте и глубоком обучении. Точность распознавания реквизитов документов доходит до 99.5% без участия человека.

 

Удобство
Наши передовые алгоритмы сами обнаруживают документ на кадре, автоматически определяют тип документа, находят реквизиты и распознают их. Система устойчива к различным геометрическим искажениям, шумам, перепадам освещения, дефектам печати и низкому разрешению.

 

Продуктовая линейка
В рамках Smart Document Engine возможно использовать все возможности по распознаванию кодифицированных объектов Smart Code Engine, распознаванию и проверки подлинности и живости ДУЛ Smart ID Engine. Клиентам предоставляется возможность использовать преимущества всех продуктов Smart Engines, пользуясь одним интерфейсом SDK, снижая затраты на интеграцию.

Скорость
Оригинальный целочисленный конвейер обработки изображений, включающий 8- и 4-битные глубокие нейросетевые архитектуры, позволяет использовать интеллектуальное распознавание документов даже на бюджетных телефонах за счет максимального использования имеющихся аппаратных ресурсов.

 

Надежность
Для повышения надежности результата мы используем подход «Что вижу, то и распознаю», в котором мы реализовали наши передовые достижения в AI: точное распознавание без словарей и грамматик, ответственные и компактные сети. Помимо результатов распознавания пользователю доступны оценки уверенности и другая информация о процессе распознавания.

 

Охват
Система позволяет распознавать документы на 100 языках: как использующих буквенные кириллические и латинские алфавиты, так и составленные на языках, где используются иероглифы: Корейский, Японский, традиционный и упрощенный Китайский. Кроме того, система ищет таблицы, печати, подписи, рукописные пометки, распознает чекбоксы и баркоды.

 

Поддержка Российских аппаратных платформ
Smart Document Engine - первая система распознавания документов которая нативно (без эмуляции) поддерживает Российские аппаратные платформы “Эльбрус”, “КОМДИВ” и “Байкал”, что позволяет использовать продукт в зонах максимальной ответственности и защищенности. Система Smart Document Engine обеспечивает беспрецедентный уровень безопасности обработки данных и защиту от санкционных рисков.

Безопасность
Благодаря достижениям наших ученых, все вычисления выполняются на конечных устройствах без передачи данных вовне, что подтверждено независимым международным аудитом. Данные НЕ передаются, НЕ сохраняются, НЕ требуется доступ в интернет, вся обработка ведется в оперативной памяти. Это правило «трех НЕ» обеспечивает высочайший уровень безопасности нашим клиентам.

 

Производительность
Высочайшая производительность достигается за счет комбинирования алгоритмов компьютерного зрения и глубокого обучения компактных нейронных сетей. Полный цикл от определения типа до распознавания всех реквизитов занимает от 2 секунд для страницы документа формата А4.

 

Многоплатформеность
Smart Document Engine поддерживает широкий класс операционных систем, включая специализированные операционные системы, предназначенные для работы с персональными данными: ОС Эльбрус, РЕД ОС, ОС Атликс, Astra Linux, Cent OS, Ubuntu, Red Hat Enterprise Linux, SUSE Linux Enterprise Server, Arch Linux и другие дистрибутивы Linux, MS Windows, macOS, ОС Аврора, iOS, Android, Sailfish Mobile OS.

 

Роботизация процессов (RPA)
Поддержка практически всех операционных систем и аппаратных платформ, скорость, качество и широкий круг устройств получения изображений (смартфон, планшет, умная камера, веб-камера, документ-камера, сканер), а также гибкие возможности интеграции оптимально подходят для роботизации бизнес-процессов ввода данных.

Send Request

TECHNICAL SPECIFICATIONS

Список поддерживаемых архитектур CPU:

 

– x8,
– x86_64
– ARMv7-v8 (AArch32 и AArch64)
– MIPS (MIPS32 и MIPS64)
– Elbrus

 

Список поддерживаемых Российских процессоров:

 

– Эльбрус-4С
– Эльбрус-8С
– Эльбрус-8СВ
– Эльбрус-1C+
– Эльбрус-2С+
– Эльбрус-16C
– КОМДИВ-32 (1890ВМ2Т, 5890ВЕ1Т, 1900ВМ2Т)
– КОМДИВ-64 (1890ВМ5Ф, 1890ВМ6Я, 1890ВМ8Я)
– КОМДИВ-128 (1890ВМ7Я, 1890ВМ9Я)
– Baikal-T1
– Baikal-M

 

Список поддерживаемых мобильных операционных систем:

 

– Android (версии 5.1 и выше)
– iOS (версии 9 и выше)
– Sailfish Mobile OS (версии 2.2 и выше)
– OC Аврора (версия 3.1.0 и выше)

 

Список поддерживаемых операционных систем для PC:

 

– MS Windows (все официально поддерживаемые правообладателем версии)
– Семейство ОС, основанных на ядре Linux (включая Ubuntu 14.04 и выше, CentOS 6 и выше, SUSE Linux Enterprise Server 12 и выше, Astra Linux 1.6 и выше, РЕД ОС 7 и выше)
– macOS (версии 10.13 High Sierra и выше)
– ОС Эльбрус (версии 8.11 и выше)

 

Список распознаваемых документов:

 

– Свидетельство о постановке на учёт гражданина РФ (ИНН)
– Справка 2-НДФЛ
– Платежное поручение (форма 0401060)
– Бухгалтерский баланс (форма 0710001)
– Отчет о финансовых результатах (ОКУД 0710002)
– Справка о результатах анализа ПЦР
– Заявления на выдачу загранпаспорта

 

Добавление других типов документов может быть выполнена под заказ.

 

Список поддерживаемых языков распознавания текста (OCR):

 

  • Кириллица (Русский, Абхазский, Белорусский, Болгарский, Казахский, Киргизский, Монгольский, Осетинский, Сербский, Таджикский, Узбекский, Украинский)
  • Латиница (Английский, Азейбаржанский, Аймара, Албанский, Африкаанс, Берберский, Боснийский, Венгерский, Волеаи, Гаитянский креольский, Датский, Зулу, Индонезийский, Ирландский, Исландский, Испанский, Итальянский, Кантонский, Кастильский, Каталонский, Кечуа, Коморский, Коса, Латышский, Литовский, Люксембургский, Македонский, Малайский, Мальтийский, Мандарин, Маори, Молдавский, Науруанский, Ндау, Ндебеле, Немецкий, Нидерландский, Норвежский, Палауский, Польский, Португальский, Руанда, Румынский, Рунди, Свази, Северный сото, Сейшельский креольский, Сесото, Словацкий, Словенский, Сомалийский, Суахили, Тамазайт, Тетум, Ток-писин, Тонга, Тсвана, Тсонга, Турецкий, Туркменский, Фиджи хинди, Фиджийский, Филиппинский, Финский, Французский, Хорватский, Чева, Чешский, Чибарве, Чичева, Шангани, Шведский, Шона, Эстонский, Южный ндебеле)
  • Китайский (классический, 20 000 иероглифов)
  • Японский (Хирагана, Катакана и Кандзи)
  • Корейский (Хангыль)
  • Сингальский
  • Греческий
  • Грузинский
  • Армянский
  • Иврит
  • Арабский
  • Фарси
  • Урду
  • Тамильский
  • Тайский

Список совместимых языков программирования

 

Smart Document Engine содержит API для следующих языков программирования:

  • C (стандарт С11 и выше)
  • С++ (стандарт С++11 и выше)
  • C# (версия 6.0 и выше)
  • Java (версия 1.7 и выше)
  • Python (версия 3.7.2 и выше)

Интеграция с использованием других языков программирование обсуждается отдельно.

 

 

Send Request

Please fill out the form and we will contact you shortly.

    Our customers

    TWINO

    Moneza (part of TWINO Group) integrated Smart ID Engine to automate user onboarding and customer identification

    iDenfy

    iDenfy Upgrades Its Identity Verification Technology with Smart Engines solutions

    2e Systems

    2e Systems use Smart Engines technologies in solutions for the airline industry.

    Rosbank

    Rosbank has implemented an artificial intelligence solution for the paperwork

      Send request for quotation or more information about products.
      Please fill out the form and we will contact you shortly.