Интеллектуальная система распознавания текста
CuneiForm — это программа для оптического распознавания текста документов в редактируемый вид. Результаты работы программы можно редактировать в офисных программах и текстовых редакторах и сохранять в популярных форматах, проводить по ним полнотекстовый поиск.
CuneiForm является предшественницей систем промышленного распознавания и понимания документов. Многие технологические ноу-хау, результаты научных исследований, положенные в основу CuneiForm, успешно применяются и совершенствуются по сей день в коммерческих продуктах Cognitive Technologies:
Cognitive Forms корпоративное решение для автоматизации ввода документов;
Cognitive Forms Bank система ввода и контроля платежных документов;
Cognitive Passport программа для ввода данных из удостоверяющих документов;
Cognitive ScanPack технология потокового сканирования документов с их последующей обработкой и сжатием.
Поддержка CuneiForm
Cognitive Technologies сделала CuneiForm бесплатной программой и открыла для сообщества OpenSource ее исходные тексты. Новый открытый проект, в котором может принять учавстие любой желающий, получил название OpenOCR.
Для координации работы над проектом действует сайт OpenOCR.org c русскоязычным форумом. На этом же сайте осуществляется и поддержка пользователей.
Отзывы и пожелания, новые и интересные вопросы (которые не обсуждались на форуме) по CuneiForm (OpenOCR) вы можете прислать нам по электронной почте cuneiform_info@cognitive.ru. Мы не гарантируем ответы на все письма, но на наиболее интересные ответим и/или учтём при размещении информации по программе.
Возможности
При распознавании с помощью CuneiForm сохраняется структура документа и его форматирование.
Программа распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки.
Распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.
Алгоритмы оптического распознавания (OCR, Optical Character Recognition), встроенные в программу позволяют распознавать текст с матричного принтера, плохих ксерокопий и факсов.
Распознавание документов более чем на 20 языках: на русском, английском, немецком, французском, испанском, итальянском, шведском, украинском и других.
Для повышения качества распознавания в программе используется словарная проверка. При этом стандартный словарь можно расширить за счет импорта новых слов из текстовых файлов.
Скачайте CuneiForm
CuneiForm является бесплатной программой и доступна для скачивания и использования всем желающим.
Скачать OCR CuneiForm V.12 (ZIP, 33,3 МБ)
Скачать Cognitive OpenOCR (CuneiForm), русская версия (EXE, 32,1 МБ)
Скачать Cognitive OpenOCR (CuneiForm), english version (EXE, 31,9 МБ)