Интеллектуальная система распознавания текста

CuneiForm — это программа для оптического распознавания текста документов в редактируемый вид. Результаты работы программы можно редактировать в офисных программах и текстовых редакторах и сохранять в популярных форматах, проводить по ним полнотекстовый поиск.

CuneiForm является предшественницей систем промышленного распознавания и понимания документов. Многие технологические ноу-хау, результаты научных исследований, положенные в основу CuneiForm, успешно применяются и совершенствуются по сей день в коммерческих продуктах Cognitive Technologies:

  • Cognitive Forms — корпоративное решение для автоматизации ввода документов;

  • Cognitive Forms Bank — система ввода и контроля платежных документов;

  • Cognitive Passport — программа для ввода данных из удостоверяющих документов;

  • Cognitive ScanPack — технология потокового сканирования документов с их последующей обработкой и сжатием.

 

Поддержка CuneiForm

Cognitive Technologies сделала CuneiForm бесплатной программой и открыла для сообщества OpenSource ее исходные тексты. Новый открытый проект, в котором может принять учавстие любой желающий, получил название OpenOCR.

Для координации работы над проектом действует сайт OpenOCR.org c русскоязычным форумом. На этом же сайте осуществляется и поддержка пользователей.

Отзывы и пожелания, новые и интересные вопросы (которые не обсуждались на форуме) по CuneiForm (OpenOCR) вы можете прислать нам по электронной почте cuneiform_info@cognitive.ru. Мы не гарантируем ответы на все письма, но на наиболее интересные ответим и/или учтём при размещении информации по программе.

Возможности

При распознавании с помощью CuneiForm сохраняется структура документа и его форматирование.

Программа распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки.

Распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.

Алгоритмы оптического распознавания (OCR, Optical Character Recognition), встроенные в программу позволяют распознавать текст с матричного принтера, плохих ксерокопий и факсов.

Распознавание документов более чем на 20 языках: на русском, английском, немецком, французском, испанском, итальянском, шведском, украинском и других.

Для повышения качества распознавания в программе используется словарная проверка. При этом стандартный словарь можно расширить за счет импорта новых слов из текстовых файлов.

Скачайте CuneiForm

CuneiForm является бесплатной программой и доступна для скачивания и использования всем желающим.

Скачать OCR CuneiForm V.12 (ZIP, 33,3 МБ)

Скачать Cognitive OpenOCR (CuneiForm), русская версия (EXE, 32,1 МБ)

Скачать Cognitive OpenOCR (CuneiForm), english version (EXE, 31,9 МБ)

Исходные тексты CuneiForm

Скачать исходный код программы OCR Cuneiform (ZIP, 34,4 МБ)

Скачать исходный код интерфейса OCR Cuneiform (ZIP, 7,33 МБ)

Скачать документацию на библиотеки ядра распознавания (ZIP, 228 КБ)