После обработки в выходной папке будут находиться:

• Собственно выходные файлы со страницами книги, преобразованными в черно-белые одноцветные изображения;

• Рисунки, сохраненные под именами типа picOOOl. tif.

В самих страницах на месте выделенных рапсе рисунков останутся «дыры».

Поэтому для получения изображений, пригодных для распознавания, нужно объединить страницы с рисунками. Это делается командой меню Zones => Picture Zone => Merge Zones. После окончания процесса объединения все выходные файлы будут готовы для распознавания.

Шаг 3. Распознавание и первичная вычитка

Вот, наконец, и пришло время для включения в процесс FineReader.

Да, великого и ужасного. Для цели книгосканирования лучше всего подойдет версия 9.0 Pro, но мне впору пришлась лицензионка 7.0 Pro, списанная за ненадобностью на работе. Шучу.

Первое, что нужно сделать — зайти в диалог опций пакета, и сбросить там все флажки на вкладке Сканирование/Открытие в группе Обработка изображений.

После этого нужно переместить куда-нибудь в известное место сам пакет, чтобы потом легко найти его. Я предпочитаю сохранять в папку, куда выводил изображения страниц ScanKromsator. Когда страницы открыты, можно сразу запускать распознавание.

Первичная вычитка в FineReader сводится к легкой коррекции самых заметных ошибок.

Главное правило при работе если вы собираетесь сохранять файл в DjVu, ни в коем случае не удаляйте знаки переноса строки и концевые дефисы абзацев! Тогда внедрить текстовый слой в DjVu-файл можно будет легко и быстро, и не возникнет проблем при модификации готовой книги.




21 из 33