|
Распознавание текста
Бум домашнего применения систем оптического распознавания пришёлся на тот период, когда
школьники и студенты уже обзавелись компьютерами, но доступ в Интернет оставался
привилегией избранных. Тогда грызуны гранита науки умело упрощали и ускоряли решение
задачи подготовки рефератов, сканируя фрагменты учебников, энциклопедий и других книг.
Сейчас надежда нации предпочитает скачивать уже готовые рефераты из Сети.
Тем не менее, компания ABBYY вроде бы не бедствует и имеет спрос на домашнюю версию
программы FiNeReaDeR. Надо сказать, что мало кто вообще может назвать еще хотя бы одну
подобную программу. Пришло время расширить кругозор. CUNeiFoRM – бесплатная программа для
распознавания текста.
Как и многие другие серьезные открытые проекты, CuneiForm когда-то была коммерческой разработкой, её библиотеки даже вошли в издательский пакет Corel Draw, но в декабре 2007 года компания Cognitive Technologies запустила программу «Распознавание должно быть на каждом компьютере», первым шагом которой был выпуск бесплатной версии приложение и открытие его исходных кодов. Скачать 35-мегабайтный дистрибутив CuneiForm можно на сайте www.cuneiform.ru. Пока что программа довольно сыра, но вполне пригодна для выполнения основной своей задачи. Самым неприятной деталью на момент написания материала было то, что инсталлятор последней версии программы напрочь отказывался делать свою работу под Vista.
CUNeiFoRM работает шустро, качество распознавания – примерно на уровне FiNeReaDeR пятой
или шестой версии. Не удалось скормить программе сразу несколько картинок, а специальный
инструмент для пакетного распознавания почему-то для каждого распознанного изображения
создаёт отдельный выходной текстовый файл, что не очень удобно при переводе книг в
цифровую форму. Интерфейс CUNeiFoRM прост и удобен, цветом выделяются места, в которых
нужно проверить качество распознавания, в отдельном фрейме окна показывается
соответствующее место оригинального изображения, чтобы можно было свериться.
|
|
|