Форум » Вопросы по сайту » Копии/сканы книг » Ответить

Копии/сканы книг

Bewerr: Есть возможность копировать и сканировать для дальнейшего распознавания книги, изданные хоть в начале 19-го века. Естественно, при условии их наличия в библиотеке. В основном - русские, но можно пробовать найти что-то и среди книг на немецком. Один лист А4 по библиотечным расценкам стоит 0.06USD. Поход в библиотеку, заказ книг, забрать копии и сосканировать - я все это делаю бесплатно. Интересующихся прошу отвечать либо в этой ветке, либо на мэйл dddv@pochta.ru С уважением, Bewerr

Ответов - 71, стр: 1 2 3 4 5 All

Euxeynos: Спасибочки огромное!! только у меня почему то архив не открывается, посмотрите пожалуйста еще раз может что не так а то я сейчас пытаюсь найти ее выходные данные и никак не получается, вроде потерялись :(

Euxeynos: у меня скачался файл размером 1122 kb но открыть не могу?? "! orme.rar: Unexpected end of archive" я не говорю что я сильно умная, но может просто что не так сделала?

Carlos de Almansa: Euxeynos, файл в порядке. Только что скачал, распаковал. Если хотите, вышлю Вам на мыло. Выходные данные статьи: Nicholas Orme, "The Culture of Children in Medieval England", in Past and Present, vol. 148 (Aug., 1995), pp. 48-88.


Bewerr: Strori пишет: А никто не знает программы, которая убирает фон с листа? Допустим те же желтые страницы - они плохо воспринимаются файнридером. Так оставить бы только черный цвет на странице, т.е. буквы. Требуется конвертация в B/W. Это можно сделать пакетно в фоторедакторе или продвинутом вьювере (XnView, Irfan), поэкспериментировав с установками контраста, гаммы, Input-Output Levels, резкости. Но в очень сложных случаях, когда RGB скан в одной части страницы имеет фон более темный, чем текст в другой ее части, требуется применение "интеллектуальных" фильтров. Эти фильтры работают по принципу разницы в контрасте между соседними пикселами или группами пикселов. Такое может СканКромсатор. О всех тонкостях и нюансах по использованию этой мощной, но сложной в освоении программы, смотрите разрозненные ЧАВО и постинги на разных форумах.

Euxeynos: очень хочу euxeynos@yandex.ru спасибо

Carlos de Almansa: Euxeynos, отправил.

Shangry: Заболел человек, который у нас занимается сканированием. Так что статья Лесникова немного откладывается. Список книг, который дал Thietmar завтра проверю по каталогу. Bewerr Требуется конвертация в B/W. Вот как раз перевод в B/W здесь нежелателен. Все граф. редакторы, которые мне попадались (в том числе Photoshop и XnView), вместо прямого преобразования по заданному порогу "черное-белое" занимаются каким-то непонятным хитромудрием. В результате чего получается "картинка" приятная для посмотреть и полюбоваться, но малосъедобная для FineReader. Здесь уж скорее надо вычитать цветной фон. Это можно сделать или в Фотошопе (но деталей уже не помню), или преобразованием в DjVu. Там в процессе сжатия цветная картинка делится на слои, один из которых как раз B&W. Потом можно разжать обратно в TIFF, причем послойно.

Bewerr: Shangry пишет: вместо прямого преобразования по заданному порогу "черное-белое" занимаются каким-то непонятным хитромудрием. Я использую Able Tif Fax View Shangry пишет: преобразованием в DjVu. Там в процессе сжатия цветная картинка делится на слои, один из которых как раз B&W. Для получения хорошего разделения на эти слои как раз и требуется "усилить" черную составляющую. В идеале - сделать скан черно-белым. Очень хорошо для таких целей подходит коррекция гаммы (в Фотошопе отсутствует, но есть, если не ошибаюсь, в Иллюстраторе). И в Able Tif Fax View есть

Shangry: Bewerr пишет: Able Tif Fax View А кто и где ее делает? Сейчас попробовал запустить поиск по этому названию, но в ответ почему-то ничего не выдалось. Даже на Гугле.

Shangry: Отсканировал статью Лесникова. Качество не очень понятное: для просмотра еще годится, а вот для FineReader - трудно сказать. Объем 6 Мб с хвостиком. Куда ее теперь?

Bewerr: Shangry пишет: А кто и где ее делает? http://www.graphicregion.com/

Bewerr: Shangry пишет: Качество не очень понятное: для просмотра еще годится, а вот для FineReader - трудно сказать. Объем 6 Мб с хвостиком. 6 мегов на 32 страницы - хм... высказывать оценки качества пока преждевременно, дождусь сканов. 6 мегов = 9-10 при пересылке - делите на две части.

Bewerr: Теперь понятно, почему 200 килобайт на страницу - сканы-то 600 dpi. Качество хорошее. Видно, что оригинал был далеко не идеальным, поэтому для данного оригинал качество даже отличное

Shangry: 1. А.А. Васильев. Византия и арабы. Том 2. Политические отношения Византии и арабов за время македонской династии. СПб. 1902. Нужны стр. 113-128 приложений (т.е. источников). У нас он числится как "Записки Историко-филологического факкультета Императорского Санкт-Петербургского университета, часть LXVI". И номер тома на карточке не прописан, просто название и все. Это то, что нужно или как? 2. Письма русского из Персии. СПб. 1844 [автор: Н. Т. Муравьев]. Нужны стр. 229, 294. Это есть, заказал. Но автором указан некто Масальский. 3. Воспоминания о Персии 1834-1835. Барона Феодора Корфа. СПб. 1838. Нужны стр. 288-289. Пока не нашел, надо будет более тщательно пошарить. 4. Мирза Мухаммад Хайдар. Тарих-и Рашиди. Ташкент. Фан. 1996. Нужны стр. 403-404. Эту тоже пока не нашел. И в основном потому, что не очень понятно на какую букву книгу поставили. С именами тюркского происхождения вечная проблема - что там имя, а что фамилия :-). ... сканы-то 600 dpi. А это наш стандарт сканирования. Все издания по умолчанию делаются на 600 точек (если не требуется большего разрешения). Очень рад, что по качеству подошло.

Bewerr: Shangry пишет: ... сканы-то 600 dpi. А это наш стандарт сканирования. Все издания по умолчанию делаются на 600 точек (если не требуется большего разрешения). Я знаю. Принятый у распознавателей рунета 400 dpi - это выстраданный компромисс между качеством и размером пересылаемых и складируемых файлов. Несколько лет назад это было крайне актуально. Это в последние год-два некоторые стали сканировать для распознавания даже в RGB



полная версия страницы