Перейти к основному содержанию

ContentCapture

Универсальная платформа для интеллектуальной обработки данных

  • Позволяет ускорять и упрощать любые процессы, связанные с документооборотом

Автоматизация обработки информации

  • Любые типы документов: отсканированные бумаги, фотографии, электронные документы, тексты писем и вложений и т.д.
  • Многоуровневая классификация документов
  • Распознавание рукописного текста
  • Автоматическое извлечение данных
  • Верификация и экспорт
  • Мониторинг и администрирование

Схема работы

Scheme_FC

 

  • New! Распознавание рукописного текста
    Извлекайте из документов данные, написанные от руки с помощью специализированных ICR-технологий. Они позволяют автоматизировать обработку разнообразных документов: паспортов, анкет, заявлений и др.
     
  • Предобработка входящих изображений
    Автоматически улучшайте изображения для оптимизации обработки информации. Функциональность особенно важна для работы с документами со сложным фоном: паспортов, водительских удостоверений, транспортных форм
     
  • Многоуровневая классификация документов
    Используйте классификаторы для повышения эффективности обработки и маршрутизации документов. Благодаря применению передовых методов машинного обучения возможно определить любые типы документов и избавиться от необходимости их ручной сортировки и маркировки
     
  • Внедрение
    Решение развернуто в крупнейших российских организациях и протестировано под ежедневной нагрузкой до 3 миллионов документов в день. Гибкие возможности интеграции позволяют бесшовно встроить продукт в IT-систему организации и обеспечить бесперебойную автоматизацию на годы вперед
     
  • Многоуровневая защита данных
    Конфиденциальные данные в документах могут быть скрыты разными способами при проверке результатов обработки операторами с разными правами доступа. HTTPs обеспечивает двунаправленное шифрование между пользователем и сервером для защиты от перехвата данных и предотвращения атак
     
  • Импортонезависимость
    ContentCapture входит в реестр отечественного ПО и подходит для импортозамещения ABBYY Flexicapture, Kofax Capture, IBM Datacap. Работает на отечественных ОС (Astra Linux, РедОС, Alt Linux) и на Windows
     
  • Разнообразные варианты ввода данных
    Благодаря возможности многоканального ввода данных ContentCapture позволяет обрабатывать как бумажные, так и цифровые документы, поступающие из различных источников в едином потоке. Среди этих источников могут быть многофункциональные устройства (МФУ), сетевые сканеры, электронная почта, FTP, веб-почта, горячие папки и мобильные устройства
     
  • Все типы документов
    С помощью продвинутого анализа документов ПО ContentCapture способно точно определить тип бумажных или электронных документов (таких как электронные таблицы, изображения, логотипы и другие), а также выделить различные области внутри документа, даже если текст на первый взгляд неразборчив. Решение может обрабатывать в одном потоке файлы в форматах Word, Excel, PDF, электронные сообщения, отсканированные изображения и другие цифровые документы
  • Обработка бухгалтерских и финансовых документов

    Быстро и качественно обработать первичные документы необходимо любому предприятию. Чем крупнее компания, тем больше финансовых операций она выполняет, и тем больше времени и ресурсов требуется для обработки счетов-фактур, актов, товарных накладных и других документов.
    Российское решение ContentCapture значительно разгружает отдел бухгалтерии для более важных задач, сокращает время принятия решений, снижает издержки на обработку документов и при этом обеспечивает контроль на всех этапах работы системы.
     
  • Обработка входящей корреспонденции: сканирование, классификация, распределение

    Какие бы услуги ни предоставлял бизнес, клиенты всегда ожидают точных ответов, оперативной обработки информации и высокой клиентоориентированности.
    Автоматизируйте маршрутизацию входящих документов, и вся деловая корреспонденция будет обрабатываться в момент поступления. Запрос будет обработан в кратчайшие сроки, лояльность клиентов будет повышаться, а вы сократите расходы на сортировку, организацию и ручную маркировку документов.
     
  • Поточное сканирование для наполнения электронных архивов

    Электронный архив документов необходим любой организации, которая регулярно решает задачи поиска и копирования документов по запросам внешних инстанций, например, в рамках камеральных проверок или налоговой отчетности.
    Для того, чтобы отсканированные документы попали в электронный архив, необходимо привязать их к карточке документа, снабдив необходимыми атрибутами: дата, номер, поставщик и т. д. Если помещать в архив просто сканы, то найти документ в дальнейшем будет невозможно.
     
  •  Автоматизация ввода и обработки кадровой документации

    Для приема на новое место работы соискателю необходимо предоставить пакет документов. По данным аналитиков, кадровый специалист тратит до 1 часа на ручную обработку одного пакета документов для оформления нового работника в штат.
    Универсальная платформа для интеллектуальной обработки информации ContentCapture поможет автоматизировать обработку кадровых документов при приеме на работу, снизить процент ошибок при переносе информации в базы данных компании и в несколько раз ускорить процесс оформления новых сотрудников.
     

  • Обработка проектно-сметной документации

    При проектировании различных систем и оборудования в тяжелой промышленности и энергетике нередко встречаются расхождения в данных проектно-сметной документации и САПР.
    Зачастую такие ошибки обнаруживаются на поздних стадиях проекта и требуют исправления несоответствий, что ведет к увеличению стоимости проекта. ContentCapture помогает снизить финансовые и технологические риски на ранних этапах проектирования.
     
  • Обработка обращений из государственных органов

    Ежегодно банк обрабатывает более 100 тыс. запросов от госорганов о предоставлении информации по счетам и операциям клиентов. Каждое обращение составляется в бумажном виде и произвольной форме, а ответ должен быть дан в кратчайшие сроки. При этом по некоторым запросам подготовка релевантных документов может занять не одну неделю.
    Универсальная платформа для интеллектуальной обработки информации ContentCapture поможет оптимизировать и ускорить процесс подготовки ответов на обращения от госорганов, а также упростить контроль за выполнением этой задачи.
     
  • Автоматизация обработки финансовой отчетности

    Банки тщательно анализируют финансовые данные клиентов для того, чтобы снизить собственные риски и сохранять рыночные позиции. Так, например, в работе с корпоративными заказчиками для банков важна тщательная проработка бухгалтерского баланса и отчета о финансовых результатах предприятия, поскольку в них содержатся важные сведения, которые помогают заранее оценить платежеспособность клиента и присвоить ему внутренний кредитный рейтинг.
    Сами формы бухгалтерской отчетности представляют из себя многостраничные текстовые документы с различными таблицами, в которых отражена информация об активах, собственном капитале, кредитных обязательствах, выручке, расходах и финансовых результатах предприятия. Качественно обработать такой объем данных способны технологии автоматизации, освободив рабочее время специалистов для более сложных аналитических задач.

Общие системные требования

Системные требования ContentCapture 14.0.0 совпадают с требованиями для 12 версии продукта:

  • процессор c поддержкой x86−64
  • не меньше 8 ГБ ОЗУ
  • 40 ГБ места на жестком диске
     

Под Linux

Операцион­ная система для клиентских станций:

  • Astra Linux 1.7.3
  • РедОС 7.3
  • Alt Linux 10.1

База данных - Postgre SQL

Работа серверных компонентов возможна на любой Linux-системе с поддержкой Docker. Внутренние тесты проводятся на Astra Linux в качестве хост-системы.
Приложения спроектированы так, чтобы можно было их переносить между различными современными дистрибутивами Linux. Если не удалось найти нужный дистрибутив — напишите в техподдержку support@contentai.ru.
 

Под Windows

Поставляемые с ContentCapture 14.0.0 поддерживают следующие версии Windows:

  • Windows 10
  • Windows 11
  • Windows Server 2019 + Desktop Experience
  • Windows Server 2022 + Desktop Experience
     

Для работы требуется наличие Microsoft .NET Framework 4.7.2 или выше и Visual C++ 2015 Redistributable Runtime.
 

Форматы и языки

Языки распознавания
ContentCapture распознает печатные тексты на более 200 языках, в том числе со словарной поддержкой (●), а формы заполненные от руки — на 110 языках.

Языки интерфейса

  • русский
  • английский
     

Типы текстов
Система распознает следующие типы текстов:

  • типографский
  • рукописный
  • пишущая машинка
  • матричный принтер
  • индекс
  • OCR-A
  • OCR-B
  • MICR (E-13B)
  • MICR (CMC7)

Поддерживаемые форматы

Форматы импорта
Документы могут быть не только отсканированы, но и загружены в систему из файлов изображений:

  • BMP — ч/б, серый, цветной
  • PCX, DCX — ч/б, серый
  • PNG — ч/б, серый, цветной
  • JPEG — серый, цветной
  • JPEG-2000* - серый, цветной
  • TIFF — ч/б — несжатый, CCITT3, CCITT4, Packbits, ZIP; серый — несжатый, Packbits, JPEG, ZIP; цветной — несжатый, JPEG, ZIP.
  • JBIG2 — ч/б
  • GIF — цветной
  • PDF, PDF/A
     

* - Для изображений в формате JPEG-2000 используется сжатие без потери качества.

Поддержан также импорт документов в офисных форматах:

Текстовые документы — *.doc, *.docx, *.rtf, *.htm/*.html, *.txt, *.odt
Табличные документы — *.xls, *.xlsx, *.ods
Презентации — *.ppt, *.pptx, *.odp​​​​​​​

Форматы экспорта
Возможности экспорта данных:

  • файлы
  • SharePoint 2003, 2007, 2010, 2013
  • база данных
  • любое внешнее приложение (API, использование скриптов)
     

Форматы экспорта данных

  • CSV
  • DBF
  • TXT
  • XLS/XLSX
  • XML
     

Форматы экспорта изображений

  • PDF, PDF/A (только изображение, текст под изображением)
  • TIFF
  • JPEG
  • JPEG 2000
  • PCX packbits
  • BMP
  • PNG
На сайте мы используем cookie. Политика использования cookie.
Принимаю
На сайте мы используем cookie. Политика использования cookie.
Закрыть