ContentCapture

Универсальная платформа для интеллектуальной обработки данных

Позволяет ускорять и упрощать любые процессы, связанные с документооборотом

Автоматизация обработки информации

Любые типы документов: отсканированные бумаги, фотографии, электронные документы, тексты писем и вложений и т.д.
Многоуровневая классификация документов
Распознавание рукописного текста
Автоматическое извлечение данных
Верификация и экспорт
Мониторинг и администрирование

ContentCapture – ключевые возможности

Схема работы

New! Распознавание рукописного текста
Извлекайте из документов данные, написанные от руки с помощью специализированных ICR-технологий. Они позволяют автоматизировать обработку разнообразных документов: паспортов, анкет, заявлений и др.
Предобработка входящих изображений
Автоматически улучшайте изображения для оптимизации обработки информации. Функциональность особенно важна для работы с документами со сложным фоном: паспортов, водительских удостоверений, транспортных форм
Многоуровневая классификация документов
Используйте классификаторы для повышения эффективности обработки и маршрутизации документов. Благодаря применению передовых методов машинного обучения возможно определить любые типы документов и избавиться от необходимости их ручной сортировки и маркировки
Внедрение
Решение развернуто в крупнейших российских организациях и протестировано под ежедневной нагрузкой до 3 миллионов документов в день. Гибкие возможности интеграции позволяют бесшовно встроить продукт в IT-систему организации и обеспечить бесперебойную автоматизацию на годы вперед
Многоуровневая защита данных
Конфиденциальные данные в документах могут быть скрыты разными способами при проверке результатов обработки операторами с разными правами доступа. HTTPs обеспечивает двунаправленное шифрование между пользователем и сервером для защиты от перехвата данных и предотвращения атак
Импортонезависимость
ContentCapture входит в реестр отечественного ПО и подходит для импортозамещения ABBYY Flexicapture, Kofax Capture, IBM Datacap. Работает на отечественных ОС (Astra Linux, РедОС, Alt Linux) и на Windows
Разнообразные варианты ввода данных
Благодаря возможности многоканального ввода данных ContentCapture позволяет обрабатывать как бумажные, так и цифровые документы, поступающие из различных источников в едином потоке. Среди этих источников могут быть многофункциональные устройства (МФУ), сетевые сканеры, электронная почта, FTP, веб-почта, горячие папки и мобильные устройства
Все типы документов
С помощью продвинутого анализа документов ПО ContentCapture способно точно определить тип бумажных или электронных документов (таких как электронные таблицы, изображения, логотипы и другие), а также выделить различные области внутри документа, даже если текст на первый взгляд неразборчив. Решение может обрабатывать в одном потоке файлы в форматах Word, Excel, PDF, электронные сообщения, отсканированные изображения и другие цифровые документы

ContentCapture – сценарии применения

Обработка бухгалтерских и финансовых документов

Быстро и качественно обработать первичные документы необходимо любому предприятию. Чем крупнее компания, тем больше финансовых операций она выполняет, и тем больше времени и ресурсов требуется для обработки счетов-фактур, актов, товарных накладных и других документов.
Российское решение ContentCapture значительно разгружает отдел бухгалтерии для более важных задач, сокращает время принятия решений, снижает издержки на обработку документов и при этом обеспечивает контроль на всех этапах работы системы.
Обработка входящей корреспонденции: сканирование, классификация, распределение

Какие бы услуги ни предоставлял бизнес, клиенты всегда ожидают точных ответов, оперативной обработки информации и высокой клиентоориентированности.
Автоматизируйте маршрутизацию входящих документов, и вся деловая корреспонденция будет обрабатываться в момент поступления. Запрос будет обработан в кратчайшие сроки, лояльность клиентов будет повышаться, а вы сократите расходы на сортировку, организацию и ручную маркировку документов.
Поточное сканирование для наполнения электронных архивов

Электронный архив документов необходим любой организации, которая регулярно решает задачи поиска и копирования документов по запросам внешних инстанций, например, в рамках камеральных проверок или налоговой отчетности.
Для того, чтобы отсканированные документы попали в электронный архив, необходимо привязать их к карточке документа, снабдив необходимыми атрибутами: дата, номер, поставщик и т. д. Если помещать в архив просто сканы, то найти документ в дальнейшем будет невозможно.
Автоматизация ввода и обработки кадровой документации
Для приема на новое место работы соискателю необходимо предоставить пакет документов. По данным аналитиков, кадровый специалист тратит до 1 часа на ручную обработку одного пакета документов для оформления нового работника в штат.
Универсальная платформа для интеллектуальной обработки информации ContentCapture поможет автоматизировать обработку кадровых документов при приеме на работу, снизить процент ошибок при переносе информации в базы данных компании и в несколько раз ускорить процесс оформления новых сотрудников.
Обработка проектно-сметной документации

При проектировании различных систем и оборудования в тяжелой промышленности и энергетике нередко встречаются расхождения в данных проектно-сметной документации и САПР.
Зачастую такие ошибки обнаруживаются на поздних стадиях проекта и требуют исправления несоответствий, что ведет к увеличению стоимости проекта. ContentCapture помогает снизить финансовые и технологические риски на ранних этапах проектирования.
Обработка обращений из государственных органов

Ежегодно банк обрабатывает более 100 тыс. запросов от госорганов о предоставлении информации по счетам и операциям клиентов. Каждое обращение составляется в бумажном виде и произвольной форме, а ответ должен быть дан в кратчайшие сроки. При этом по некоторым запросам подготовка релевантных документов может занять не одну неделю.
Универсальная платформа для интеллектуальной обработки информации ContentCapture поможет оптимизировать и ускорить процесс подготовки ответов на обращения от госорганов, а также упростить контроль за выполнением этой задачи.
Автоматизация обработки финансовой отчетности

Банки тщательно анализируют финансовые данные клиентов для того, чтобы снизить собственные риски и сохранять рыночные позиции. Так, например, в работе с корпоративными заказчиками для банков важна тщательная проработка бухгалтерского баланса и отчета о финансовых результатах предприятия, поскольку в них содержатся важные сведения, которые помогают заранее оценить платежеспособность клиента и присвоить ему внутренний кредитный рейтинг.
Сами формы бухгалтерской отчетности представляют из себя многостраничные текстовые документы с различными таблицами, в которых отражена информация об активах, собственном капитале, кредитных обязательствах, выручке, расходах и финансовых результатах предприятия. Качественно обработать такой объем данных способны технологии автоматизации, освободив рабочее время специалистов для более сложных аналитических задач.

ContentCapture – системные требования, форматы и языки

Общие системные требования

Системные требования ContentCapture 14.0.0 совпадают с требованиями для 12 версии продукта:

процессор c поддержкой x86−64
не меньше 8 ГБ ОЗУ
40 ГБ места на жестком диске

Под Linux

Операционная система для клиентских станций:

Astra Linux 1.7.3
РедОС 7.3
Alt Linux 10.1

База данных - Postgre SQL

Работа серверных компонентов возможна на любой Linux-системе с поддержкой Docker. Внутренние тесты проводятся на Astra Linux в качестве хост-системы.
Приложения спроектированы так, чтобы можно было их переносить между различными современными дистрибутивами Linux. Если не удалось найти нужный дистрибутив — напишите в техподдержку support@contentai.ru.

Под Windows

Поставляемые с ContentCapture 14.0.0 поддерживают следующие версии Windows:

Windows 10
Windows 11
Windows Server 2019 + Desktop Experience
Windows Server 2022 + Desktop Experience

Для работы требуется наличие Microsoft .NET Framework 4.7.2 или выше и Visual C++ 2015 Redistributable Runtime.

Форматы и языки

Языки распознавания
ContentCapture распознает печатные тексты на более 200 языках, в том числе со словарной поддержкой (●), а формы заполненные от руки — на 110 языках.

Языки интерфейса

русский
английский

Типы текстов
Система распознает следующие типы текстов:

типографский
рукописный
пишущая машинка
матричный принтер
индекс
OCR-A
OCR-B
MICR (E-13B)
MICR (CMC7)

Поддерживаемые форматы

Форматы импорта
Документы могут быть не только отсканированы, но и загружены в систему из файлов изображений:

BMP — ч/б, серый, цветной
PCX, DCX — ч/б, серый
PNG — ч/б, серый, цветной
JPEG — серый, цветной
JPEG-2000* - серый, цветной
TIFF — ч/б — несжатый, CCITT3, CCITT4, Packbits, ZIP; серый — несжатый, Packbits, JPEG, ZIP; цветной — несжатый, JPEG, ZIP.
JBIG2 — ч/б
GIF — цветной
PDF, PDF/A

* - Для изображений в формате JPEG-2000 используется сжатие без потери качества.

Поддержан также импорт документов в офисных форматах:

Текстовые документы — *.doc, *.docx, *.rtf, *.htm/*.html, *.txt, *.odt
Табличные документы — *.xls, *.xlsx, *.ods
Презентации — *.ppt, *.pptx, *.odp

Форматы экспорта
Возможности экспорта данных:

файлы
SharePoint 2003, 2007, 2010, 2013
база данных
любое внешнее приложение (API, использование скриптов)

Форматы экспорта данных

CSV
DBF
TXT
XLS/XLSX
XML

Форматы экспорта изображений

PDF, PDF/A (только изображение, текст под изображением)
TIFF
JPEG
JPEG 2000
PCX packbits
BMP
PNG

Все составные части успеха

Выгодное приобретение ПО
Профессиональное внедрение САПР и BIM
Обучение и техническая поддержка

Обратитесь в ближайшее
региональное представительство