Форум » Вопросы по форуму » Краткое руководство по сканированию » Ответить

Краткое руководство по сканированию

Bewerr: Просто решил обобщить накопившуюся информацию. Что-то почерпнул в инете, но бОльшая часть описанного все же из личного опыта. Замечания и дополнения приветствуются :). Краткое руководство по сканированию. 1. Выбор сканера. Производители. Cамый удачный выбор среди настольных сканеров по соотношению цена/качество/скорость/надежность– Epson и Canon. Это механически надежные сканеры, с продвинутым софтом и хорошей оптикой. Речь идет только о CCD моделях (см. ниже). Не рекомендуется – Hewlett-Packard, главным образом из-за более высокой цены и не очень удачного софта. Остальное можно оценить по принципу "Лучшее - враг хорошего". Интерфейс. У любого из современнных сканеров интерфейс USB 2.0. При режиме черно-белого сканирования в разрешении до 400 dpi интерфейс подключения на скорость практически не влияет, и пропускной способности шины USB 1.1 вполне достаточно. Для больших разрешений и любых цветных режимов интерфейс USB 1.1 является сильным тормозом. Тип матрицы. Как правило, надо отдавать предпочтение сканерам с CCD матрицей, и не брать сканер с CIS. Матрицы типа CIS для качественного скана требуют очень плотного прилегания листа к стеклу сканера, и допускаемый зазор между сканируемым листом и стеклом минимален, порядка 2-5 мм. В их конструкции основной упор сделан на минимальную толщину сканера, а также более дешевую цену готового изделия, что трудно совмещается с надежной и выносливой механической частью. Вообще, хороший сканер – это еще плюс ко всему и толстый в буквальном смысле слова сканер. Хороший ССD сканер обладает глубиной резкости, достаточной для четкого сканирования с оригинала, отстоящего от стекла на расстоянии до 15-20 мм. Этого расстояния, наверное, в 99% случаев вполне достаточно, чтобы сосканировать текст на разворотах, не ложащихся на стекло из-за крепкого или склеенного корешка. Для макимальной производительности важен такой параметр, как скорость сканирования листа А4. Для сканеров от серьезных производителей эта скорость указана в технических характеристиках сканера, выражается некоторым числом и единицами измерения msec/line. Line – это «ряд(или строка) точек». Чтобы узнать время, за которое сканер сосканирует лист А4, требуется подставить этот параметр в следующую формулу: Время(секунды) = Параметр(msec/line) x 12(дюймов) x Разрешение(одна цифра) : 1000 Например, для модели Epson Perfection 1670 скорость сканирования в черно-белом режиме составляет 3.68 msec/line. Время сканирования приблизительно будет равно: при разрешении 300 dpi 3.68 х 12 х 300 : 1000 = 14 секунд при разрешении 400 dpi 3.68 x 12 x 400 : 1000 = 18 секунд (реальная скорость была даже немного выше, порядка 16 секунд). Сегодня сканеры ценового диапазона (80-100 долларов) без проблем сканируют лист А4 в разрешении 400 dpi за время. Иногда приводится характеристика «Время сканирования черно-белого документа в 300-400 dpi». Интересно, что приходилось сталкиваться и со случаями, когда реальная скорость сканирования оказывалась выше заявленной производителем. Т.е. если указано 15-20 сек./А4, то этого вполне достаточно для продуктивной работы. Техническое отступление: скорость сканирования зависит в том числе и от внутреннего процессора сканера – чем быстрее он может обработать поступившую от матрицы информацию, тем быстрее матрица может перейти к сканированию следующего ряда точек. В более дорогих сканерах используются более мощные процессоры. Это вызвано тем, что на максимальных разрешениях им необходимо обрабатывать гораздо больший объем информации, чем у дешевых сканеров. Побочный эффект – немного возросшая скорость сканирования также и в черно-белом режиме. Передвижение каретки с большей скоростью, чем у дешевых моделей, требует и более надежной, точной и качественной механики. Поэтому сканер ценового диапазона от 150-200 долларов и выше может оказаться более надежным при больших объемах сканирования. Минимальная наработка на отказ CCD планшетного настольного сканера начального уровня - 10000 сканов (точнее, циклов движение-возврат каретки). У более дорогих моделей производители (например, Epson) обещают до 30000 и даже до 100000 сканов. Возможно, что в действительности сканер проработает больше обещанного. Например, для Epson Perfection 1670 заявленная наработка на отказ составляет 10000, в то же время сканер после небольшой профилактики, с легкими поскрипываниями при начале работы, продолжает работать, уже сделав 12000 сканов А4. 2. Программное обеспечения для сканирования. Предпочтительнее использовать программное обеспечение, идущее в комплекте сканера. Например, софт от Epson'a достаточно удобен, содержит все необходимые настройки. В то же время интерфейс программы прост, не перегружен лишними кнопками и маловажными и редко используемыми настройками. Сканирование производится "батчем", "серией", в выбранную директорию. 3. Разрешение сканирования и оптимальное качество. Оговримся, что речь идет о сканировании для возможной дальнейшей пересылки сканов, для чего требуется найти оптимальный компромисс между размером файла и качеством изображения. Выбираемое разрешение: Текст (даже с примечаниями мелким шрифтом) - 400 dpi. Рисунки, в случае, когда сканируются отдельно от текста - минимум 300 dpi. Географические карты - 300-600 dpi. Книга сканируется в три захода: 1) текст + черно-белые рисунки (графика, которую при увеличении можно увидеть как линии, штрихи и точки). Формат файла - однобитный (черно-белый) (Black/White, B/W, Line-Art), TIFF(*.tif), компрессия Group 4 (может обозначаться как TIFF G4). 2) серые рисунки и фотографии (содержат полутона). Под увеличением фрагменты таких изображений остаются сплошными участками серого и не превращаются в штрихи и линии. Формат - JPG Greyscale 256 градаций серого (8 бит) с установкой компрессии 75-80% от 100% возможного качества. Примечание: если затруднительно определить, каким же именно является изображение - черно-белым или серым - то делаются сканы в двух режимах. 3) Цветные рисунки и карты. Формат - JPG RGB (24 бита) с установкой компрессии 75-80% от 100% возможного качества. Естественно, что стекло сканера должно быть чистым. Для протирания стекла от грязи используйте слегка влажную не оставляющую волокон салфетку или кусок ткани с минимальным количеством ворса. В процессе сканирования стекло пачкается редко. Чаще проблему доставляет пыль, остающаяся на стекле от бумаги. Если сканирование происходит в черно-белом режиме, то такую пыль можно просто смахнуть чистой сухой ладонью или же используйте кусок ткани с минимальным количеством ворса (шелк и т.п.). При сканировании в "сером" и "цветном" режиме рукой пыль смахивать не надо, используйте только ткань. Сосканированное изображение должно быть четким, чистым, без лишнего "мусора" (точек). В случае сканирования текста это достигается правильной установкой порога Threshold (уровень, начиная с которого сканированное изображение воспринимается как черное). Проверяется на нескольких пробных сканах. Критерий правильной установки порога - на скане бумага уже выглядит белым листом без вкраплений, а линии букв еще не стали утоньшаться и прерываться. 4. Сканирование. Сканируемая книга должна быть хорошо прижата к стеклу сканера. Особенное внимание следует уделить прилеганию части страницы около корешка(сгиба) книги. Часто корешок книги требуется сильно выгнуть в обратную сторону. В качестве прижимающего груза можно использовать книги, или, предпочтительнее, какой-либо бесформенный тяжелый предмет. Например, мешочек с песком или другим сыпучим наполнителем (крупа и т.п.). Вес порядка 1-3 кг, в ряде случаев может быть и больше(!), в зависимости от усилия, необходимого для плотного прилегания сгиба конкретной книги. Если сканер быстрый, то можно обойтись нажатием на корешок рукой. Заодно, при сканировании сотен страниц, это будет хорошей гимнастикой ;). Не рекомендуется использовать в качестве груза тяжелые твердые предметы – при случайном неосторожном обращении возможно повреждение стекла и самого сканера.

Ответов - 1

mzhukovsky: Оговримся, что речь идет о сканировании для возможной дальнейшей пересылки сканов, для чего требуется найти оптимальный компромисс между размером файла и качеством изображения. Выбираемое разрешение: Текст (даже с примечаниями мелким шрифтом) - 400 dpi. Рисунки, в случае, когда сканируются отдельно от текста - минимум 300 dpi. Географические карты - 300-600 dpi. Нередко бывает, что сканер не покупается специально для книг, а он "уже есть". Во многих моделях, с какими сталкивался, скорость сканирования листа А4 с разрешением 300 dpi и 400 dpi сильно отличалась - 400 точек делались медленнее раза в полтора. Если Ваш сканер ведет себя так, то советую сканировать текст на 300 dpi - качество (для распознавания) будет немногим хуже, чем при 400 точках, а времени съэкономите порядочно даже с учетом дополнительных исправлений при OCR. Вообще же при любом удобном случае используйте МФУ :) Книга сканируется в три захода: 2) серые рисунки и фотографии (содержат полутона). Под увеличением фрагменты таких изображений остаются сплошными участками серого и не превращаются в штрихи и линии. Формат - JPG Greyscale 256 градаций серого (8 бит) с установкой компрессии 75-80% от 100% возможного качества. Примечание: если затруднительно определить, каким же именно является изображение - черно-белым или серым - то делаются сканы в двух режимах. 3) Цветные рисунки и карты. Формат - JPG RGB (24 бита) с установкой компрессии 75-80% от 100% возможного качества. В старых советских книгах "серая" картинка (например, фотография) при увеличении чудесно распадется на точки, причем расстояние между точками будет больше, чем их диаметр. Это не должно смущать - она все равно "серая" - причина в использовавшейся технологии печати. Я бы не рекомендовал использовать "вшитое в сканер" jpeg-сжатие при сканировании картинок - см. пп.2-3 выше. Лучше отсканировать в тиф greyscale или rgb без компрессии. Ее всегда можно (и нужно) будет включить при создании конечного варианта книги, но у Вас будет выбор! К тому же, если Вы будете масштабировать картинки, то без компрессии источника результат получится существенно лучше. Сосканированное изображение должно быть четким, чистым, без лишнего "мусора" (точек). В случае сканирования текста это достигается правильной установкой порога Threshold (уровень, начиная с которого сканированное изображение воспринимается как черное). Проверяется на нескольких пробных сканах. Критерий правильной установки порога - на скане бумага уже выглядит белым листом без вкраплений, а линии букв еще не стали утоньшаться и прерываться. Тут про это не упоминается, но момент важный. При сканировании картинок настоятельно не рекомендуется делать это с превью и автоподстройкой сканера. Это гораздо дольше, а аналогичного результата легко достичь, установив экспериментальным путем подходящие значения коррекции яркости и контраста в драйвере сканера. Имейте в виду, что используемые по умолчанию значения в 90% случаев - не подходят. В качестве прижимающего груза можно использовать книги, или, предпочтительнее, какой-либо бесформенный тяжелый предмет. Например, мешочек с песком или другим сыпучим наполнителем (крупа и т.п.). Вес порядка 1-3 кг, в ряде случаев может быть и больше(!) Если у Вас сканер Epson - то кладите песок и не сомневайтесь ;) Если нет - я бы рекомендовал быть очень аккуратными с нагрузкой на стекло. Во многих недорогих моделях нажатие на стекло - даже небольшое - мешает правильному позиционированию лампы - как результат смазанные сканы. Что еще хуже, визуально это может быть не очень заметно сразу. Худший вариант - стекло просто провалится и все - оно часто бывает "приклеено снизу".



полная версия страницы