Победитель в номинации компьютер мечты SCAN 3XS JELLYFISH

Компьютер-мечта от 3XS Systems

Игровые компьютеры Gladiator

Компьютеры Gladiator

Планшетный, планетарный и сканер на основе ЦФК: сравнение и методы сканирования

Перевод книги и любого другого сшитого документа в электронный вид предполагает решение нескольких задач: непосредственно сканирование, обработка полученных изображений, их последующая компоновка в файл и, в некоторых случаях, оптическое распознавание текста (ОРС). Для сканирования книг используется 3 типа сканеров: планшетный, планетарный и сканер на основе цифровых фотокамер.

Ниже представлены сравнительные характеристики трех типов сканеров и поставляемого с ними программного обеспечения на различных этапах создания электронной книги.

I. Получение электронных образов сканируемого документа

Планшетный сканер представляет собой планшет, внутри которого под прозрачным стеклом расположен сканирующий механизм. Небольшой по размеру (подходит для дома или офиса), очень прост в эксплуатации, запускается нажатием одной кнопки, однако не модернизируется и быстро устаревает. Формат сканирования - не более А4, скорость - 300 стр./час, разрешение получаемых изображений - 2400 dpi и выше (оптическое).

Сканер предназначен для оцифровки расшитых документов; при сканировании нерасшитых возникают проблемы с искажением изображений. Поскольку страницы перелистываются вручную, проблемы возникают и при постоянном изменении позиции книги, что затрудняет последующую обработку с помощью ПО. Планшетный сканер подходит для оцифровки относительно новых изданий, так как ветхие чаще всего не поддаются расшивке в связи с культурной или юридической значимостью. При сильном сгибании корешка книги есть вероятность повредить хрупкое издание.

Что же касается качества получаемых изображения - поскольку освещение не достигает затемненной области у корешков книги, качество изображения оставляет желать лучшего. Средняя цена планшетного сканера - от 1500 руб.

Планетарный сканер отличается сканирующей головкой, расположенной сверху, на значительном удалении от сканируемого документа и педалью для управления. Занимает много рабочего пространства и не модернизируется. Формат сканирования - A2-A4, скорость - 400-700 стр./час, разрешение изображений на выходе - 400-600 dpi (среднее – 400 dpi. В большинстве планетарных сканеров (кроме Zeutschel и CMA) увеличение разрешения достигается интерполяцией программным способом, что приводит к сильной потере качества).

Сканер предназначен для оцифровки как сшитых, так и расшитых изданий - и относительно новых, и ветхих изданий. Однако в последнем случае все же есть вероятность повредить корешок книги, так как издание должно быть развернуто полностью, на 180 градусов. Часть моделей оснащена прижимным стеклом, у остальных контакт между сканируемым изданием и сканирующим элементом отсутствует. Сканируемая книга остается в одной и той же позиции, несмотря на то, что сканирование производится вручную. Отсутствует и проблема с затемненной областью, поскольку сканируемые изображения полностью освещены. Цена планетарного книжного сканера - от 600 000 руб.

Книжный канер на основе ЦФК - подвид планетарного. Предназначенный для оцифровки как сшитых, так и расшитых изданий, он подходит для оцифровки как относительно новых, так и ветхих изданий за счет специальной V-образной колыбели, позволяющей не раскрывать книгу полностью (на 90 градусов), что сводит к минимуму вредное воздействие на издание. Скорость сканирования - 500-700 стр./час, формат - A2-A4, изображения на выходе получают оптическое разрешение 130-470 dpi и отличное качество за счет полного освещения изображений.

Перелистывание страниц осуществляется вручную (существуют модели с автоматическим перелистыванием, однако ценные, ветхие книги, составляющие основу библиотечного фонда, не рекомендуется оцифровывать на таком оборудовании во избежание повреждений). Сканер занимает много рабочего пространства, однако практически не подвержен поломкам, поскольку является сканирующей платформой. Запускается нажатием одной кнопки. Модернизируется за счет замены фотокамер на более профессиональные варианты. Начальная цена такого книжного сканера - 395 300 руб.

II. Обработка полученных изображений

У всех книжных сканеров, участвующих в сравнении, есть общий минус — изображения, полученные от любого из них, требуют корректировку в соответствии с оригиналом, приведение к одному и тому же виду, устранение искажений, выравнивание с помощью ПО (обычно прилагается к сканеру), что и представляет собой второй этап создания электронной книги. Чаще всего данные операции выполняются в пакетном режиме — параметры обработки выставляются для первой страницы, а затем применяются ко всем остальным.

Основные проблемы, возникающие при сканировании книг:

Планшетный сканер

- Освещение сканера не достигает затемненной области у корешка книги, даже если используется редуцирующая линза большой резкости; информация, попавшая в данную область, не восстанавливается с помощью ПО.

- Необходимо, чтобы сканируемое издание оставалось в одном и том же положении, иначе оператору придется заниматься обрезкой страниц вручную, поскольку настройки пакетного режима не подойдут ко всем страницам; распознавание текста в дальнейшем будет производиться с потерей качества.

Решение:

- Тщательно следить за тем, чтобы сканируемое издание находилось параллельно границам сканера.
Использовать ПО для устранения искажений

Планетарный сканер

Основной проблемой считается большое количество искажений. Их количество минимизируется, но не устраняется полностью, за счет прижимного стекла, используемого в некоторых моделях планетарных сканеров.

Решение:

Использовать ПО для устранения искажений. Неудобство заключается в очень низкой скорости обработки изображений, за счет чего значительно снижается общая скорость сканирования книг этим типом сканеров.

Книжный сканер на основе цифровых фотоаппаратов

Эффект «Margin crawl», обусловленный толщиной бумаги издания, заставляет изображения по мере сканирования немного продвигаться по горизонтали.

Решение:
При пост-обработке изображений менять настройки кадрирования каждые 100-200 страниц.

III. Оптическое распознавание символов, компоновка файла электронной книги с возможностью редактирования и полнотекстового поиска

Если же говорить о точности распознавания символов, то сравнение изображений наивысшего качества от сканера на основе ЦФК планшетного и планетарного сканеров с помощью Abbyy Finereader V.8 Professional Edition показал, что наиболее оптимальным вариантом является книжный сканер с V-образной колыбелью - его точность составляет 99,66%, тогда как планшетный и планетарный сканер выдают 90,42% и 91,59% соответственно.

В качестве вывода можно отметить, что каждое из сравниваемых устройств имеет свои достоинства и недостатки; выбор оптимального решения зависит от возможности расшивки документа, его состояния (относительно новое или ветхое издание), требований к получаемому файлу электронной книги и многих других условий.

 

Увидели опечатку?

Выделите текст и нажмите Shift+Enter.
И мы в ближайшее время ее исправим!
Сервера 3XS SystemsКомпьютеры с поддержкой 3D Vision
S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13