Не распознаванием единым: обзор ABBYY FineReader 11

 | 11.02

В программе предусмотрено большое количество сценариев работы с отсканированными документами, включая создание электронных книг

В жизни каждого человека рано или поздно наступает момент, когда бумажная копия документа еще есть, а ее электронного оригинала, увы, уже нет. Как правило, ситуация усугубляется еще и тем, что документ необходимо редактировать или еще как-то использовать в электронном виде. Вот тут-то и настает звездный час программ распознавания текста! Ну не набирать же его с распечатки вручную?!

Тем более что новая версия ABBYY FineReader 11 распознает текст намного быстрее предшественницы. Увеличение скорости особенно заметно в так называемом черно-белом режиме, когда программа тратит время на анализ цветных изображений. По данным производителя, прирост составляет порядка 45 %, и по нашим субъективным оценкам, эта цифра недалека от истины.

В FineReader 11 появился новый редактор стилей, призванный улучшить передачу оформления и структуры документа

Как и в предыдущей версии OCRсистемы большой упор сделан на точное воссоздание структуры документа, в частности правильное распознавание колонтитулов, заголовков, оглавлений и прочих элементов текста. Этой цели служит усовершенствованная фирменная технология ADRT, а также новый редактор стилей, позволяющий определить оформление однотипных элементов документа и упростить передачу его логической структуры. Добавьте к этому поддержку почти 190 языков (из них 40 имеют словарную поддержку) — и вы получите действительно универсальное средство для работы с отсканированными документами.

Впрочем, оперативное распознавание — далеко не единственная сфера применения подобных программ. В частности, новая версия ABBYY FineReader научилась превращать отсканированный и распознанный текст в электронные книги. Поддерживаются популярные форматы ePub и fb2. Также не проблема сохранить документ в PDF с текстовым слоем.

Программа хорошо распознает оформление документов, но по-прежнему спотыкается на сложной журнальной или газетной верстке

Единственное, чего не хватает для полноценного создания электронных книг, так это инструментов редактирования структуры. Нужно ли говорить, что интерактивное содержание и закладки существенно упрощают чтение, особенно с электронных букридеров. К другим недочетам можно отнести все еще неуверенное распознавание сложного форматирования. Например, программа упорно отказывается воспринимать двухколоночную верстку (характерна для периодических изданий) и неправильно отображает ее в итоговом документе. Также часто неправильно распознаются мелкие изображения, хотя как раз работа с картинками заявлена в числе важных сторон новой версии программы.

FineReader 11 поддерживает множество форматов сохранения документов и многочисленные настройки для каждого из них

В целом можно сказать, что новый «файнридер» удался. Главные фишки программы — большое количество языков (включая арабский, распознавание которого непростая задача даже для человеческого глаза J), высокая скорость работы, качественная передача структуры и оформления документа. Все это наверняка придутся по душе как новым пользователям, так и подвигнет обновиться до последней версии уже состоявшихся владельцев FineReader.

 ABBYY FineReader 11 Professional edition

Разработчик:ABBYY

Сайт: http://abbyy.ua/products/ocr/finereader/

Цена: 798 грн

 

Общее впечатление:

Программа стала еще лучше и быстрее распознавать даже весьма сложные документы. Результаты распознавания можно не только в популярных офисных форматах, но и конвертировать в PDF-файлы, а также различные форматы электронных книг.

Чего не хватает:

Распознавание сложного форматирования (например, журнальных страниц) дается FineReader все еще с трудом. Впрочем, в более простых случаях успехи воссоздания структуры и форматирования документа очевидны.

Оценка:

+ скорость работы

+ точность воссоздания структуры и оформления документа

+ создание электронных книг

+ распознавание 189 языков

— проблемы с воссозданием сложного форматирования

Владислав Ткачук

Robo User
Web-droid editor

Додати коментар

Ваша email адреса не буде опублікована.