
На свет появился FineReader пятой версии. Появился как истинный диверсант, оставив в полном неведении всезнающих жуков на Горбушке. Финальный релиз Windows Millennium, который поступит в продажу только в конце сентября, лежал на прилавках уже в июне. Ровно неделю назад я поинтересовался о наличии FineReader 5.0, и на меня посмотрели как на ламернутого дурачка: «Мальчик, такого нет в природе!»
Нет, дядька, он в природе есть! Детали презентации программы и красочную коробку пятого «Файнридера», выдающую дизайн мирового класса, уже описал Денис Викторов в «ИнфоБизнесе». Козловский ничего написать не успел, потому что опять куда-то отчалил. Я же подверг новый релиз «аббийного» (от ABBYY — создателя программы) флагмана настоящему кислотному тесту, чем и готов поделиться.
Программы OCR [1] — веселые программы. Всякий апгрейд сопровождается невиданным хайпом: из победоносного релиза мы узнаем, что задействованы революционные технологии, полностью переписан код, радикально изменено ядро распознавания, скорость распознавания увеличилась в N-ное число раз. Это уже было и раньше в случае с четвертой версией FineReader, то же самое я слышал в связи с CuneiForm 2000. Про пятую версию FineReader тоже сказано, что «точность распознавания улучшена в 1,5–2 раза по сравнению с версией 4.0».
Насколько это так, мы сейчас посмотрим. Почему речь зашла о кислотном тесте (acid test [2])? Дело в том, что совершенно бесполезно тестировать современные программы распознавания знаков на свеженьких текстах, отпечатанных типографским способом либо на лазерном принтере. Результат будет заведомо безупречен. Поэтому, если вам приходится иметь дело только с такими документами, то создавать электронный архив можно с любой программой OCR — разницы вы не почувствуете. Другое дело — документы экстремального характера…
