Форум » Исторические вопросы » Источники-оригиналы » Ответить

Источники-оригиналы

Carlos de Almansa: Появилась такая идея. Почему бы не создать сайт, на котором будут храниться средневековые источники на оригинальных языках? Речь идет даже не об OCR. Было бы хорошо (даже предпочтительно, по-моему) иметь копии книг в форматах djvu, pdf. В последнее время в интернете появилось немало таких книг-первоисточников. Но это лишь крупица. Да и хранится это все на разных сайтах. Приходится бегать по интернету в поисках того или иного текста. Конечно, бумажный вариант всегда лучше, но для этого надо иметь доступ в хорошую библиотеку, но не у всех есть такая возможность. Я довольно часто заказываю книги по межбиблиотечному обмену, но каждый такой заказ обходится мне в $30, что на самом деле не так уж и много, учитывая, что книги порой приходят из-за океана. Как вам такая идея, господа историки? Есть предложения, идеи?

Ответов - 63, стр: 1 2 3 4 5 All

Bewerr: Целиком "за". Вижу два пути реализации такого проекта: 1) Делаем на форуме ветку и выкладываем в ней все линки на оригинальные источники. Кто-то один берет на себя координацию деятельности и в случае, если линк "умер", выкладывает источник повторно на свой премиум-аккаунт на рапиде. Стоимость реализации = стоимости премиума + время. К тому же рапида иногда почему-то удаляет файлы со сканами тех книг, которые перешли в общественное достояние. Жаловаться бесполезно. Иногда по ошибке может заодно и прикрыть аккаунт. Такое случается крайне редко, но все же бывает. 2) Свой физический сервер. Я бы такой вариант не рассматривал, поскольку это будет стоить долларов 300 в месяц (размещение+техобслуживание+аммортизация+настройка).

Thietmar: Bewerr пишет: Делаем на форуме ветку и выкладываем в ней все линки на оригинальные источники Я когда-то пытался сделать что-то подобное: http://vostlit.borda.ru/?1-2-0-00000028-000-0-0-1176297062

Carlos de Almansa: 2Bewerr А третий вариант? Создается сайт, на котором ничего храниться не будет, а будут ссылки на файлообменники. Но сайт должен поддерживать поиск. Примером может послужить хорошо известный Вам натахаус.ру.


Carlos de Almansa: 2Thietmar Такой вариант хорош в качестве промежуточного. Кстати, если мы уж заговорили о сайтах, то, если не секрет, во сколько обходится Вам содержание Востлита?

Thietmar: Carlos de Almansa пишет: во сколько обходится Вам содержание Востлита? То есть ? Сколько стоит хостинг или суммарные траты ?

Carlos de Almansa: Ага. Хостинг.

Bewerr: Thietmar пишет: Я когда-то пытался сделать что-то подобное: http://vostlit.borda.ru/?1-2-0-00000028-000-0-0-1176297062 Знаю. Но рук одного человека не хватает на всё, поэтому требуется доброволец, который занимался бы только линками.

Thietmar: Carlos de Almansa пишет: Ага. Хостинг. Хостинг стоит 88 долларов в год. Но хостинг - одна из самых незначительных трат...

Carlos de Almansa: А какие есть еще траты? И как это отражается на кошельке?

Thietmar: Carlos de Almansa пишет: А какие есть еще траты? И как это отражается на кошельке? Интернет - 44 евра/месяц, читательский 25/год, Сканер 90/единоразово, ксерокс книг которые не дают на дом - по разному, минимум 6 центов/копия. На кошельке это сказывается по-разному, но всегда отрицательно.

a_e_g: Ссылки на другие сайты - это не всегда хорошо. Например, на Books Google очень много таких книг в PDF, но у них обычно нет оглавлений в Bookmarks, что не очень удобно. Да и нумерация страниц в Pdf и в бумажном варианте не соответствуют: в оригинале часто предисловие нумеруется римскими цифрами, а текст источника - арабскими. Так что лучше их скачать, привести в приличный вид и перезалить в другое место. Неплохо бы иметь и в текстовом виде (HTML или XML), так как при цитировании проще копировать, чем возиться с отсканированным и нераспознанным PDF. А начать можно с создания рубрик и их заполнения названиями и (если есть) ссылками на тексты. Можно русской версией Википедии воспользоваться - заодно и ссылки сделать на статью о сайте ВЛ :)

a_e_g: И не только средневековые, но и античные. Античные латинские тексты в формате RTF у меня уже готовы - примерно мегабайт 110 получилось, сейчас делаю греческие (античные и византийские). А средневековые латинские оставил на потом, их очень много и требуется OCR. Пожалуй, сканировать почти не придётся - большая часть текстов у меня есть, я проверял по списку.

Thietmar: У меня тоже есть немало отсканированных источников на иностранных языках. И исследований на них же - стирать жалко а пользоваться исследоваиями некому. Я бы эти исследования с удовольствием кому-нибудь слил.

Bewerr: С гугльбукса одних исследований и источников на русском по периоду до 19 века набралось уже около 20 гигов. Сколько будет, если добавить туда иностранные - подумать страшно... измерять придется в терабайтах. Правда, если оставить только источники и исследования, содержащие источники в виде приложений, то получится меньше. По крайней мере сопоставимо с размером харда в 75-150 гигов. Сосканировать тоже можно довольно много, был бы спрос и возможность разместить где-либо. Установка и содержание мало-мальски приличного сервера будет стоить: Единоразовая плата за сервер - примерно 1000-1500 долларов, если считать сервером какой-нибудь простенький десктоп на Conroe + миррор из двух WD-шек Raptor + памяти 4-8 GB. Ежемесячный хостинг - 100-200 долларов в зависимости от страны расположения. Первоначальная настройка ОС и установка готового движка - зависит от расценок программера. Сам движок сайта - ??? зависит от того, есть ли что-то готовое, сколько надо вложить труда в переделку под конкретные нужды проекта - от "0" до 2000-5000 тыс.долларов. Самая расплывчатая строка сметы. Ежемесячная техподдержка - энтузиаст, разместивший сервер, периодически ездит к нему и меняет вышедшие из строя харды и другое железо. Т.е. это все дорого и хлопотно, пока нет нефтяной вышки. Проще складировать линки на рапиду. Тот же гугльбукс, кстати, не имеет ничего против использования книг в некорыстных целях, что нас полностью устраивает.

Thietmar: Bewerr пишет: Проще складировать линки на рапиду. Вот тебе и сольем исследования..



полная версия страницы