ЦИФРОВАЯ БИБЛИОТЕКА GREENSTONE ОТ БУМАГИ К КОЛЛЕКЦИИ

Chapter 4 
Три примера: от 1000 до 100.000 страниц

Contents

Небольшая коллекция: от 500 до 1000 страниц
Все публикации организации: 5000 страниц
Небольшая библиотека: 100.000 страниц

4.1 Небольшая коллекция: от 500 до 1000 страниц

Большинство НПО нуждаются в сканировании материала объемом 5000-1000 страниц. Это можно осуществить и провести с помощью ОРС без особого труда при наличии высоко целеустремленных работников.

Сканирование

Первый шаг состоит в сканировании материала для получения его в качественном электронном формате TIFF - на каждую страницу по одному файлу. В настройках надо подбирать соответствующие режимы для каждого типа рисунка. Предположим, что задача состоит в том, чтобы отсканировать 1000 страниц. Это можно организовать, наняв работников на полставки на протяжении месяца — только для сканирования. Файлы TIFF займут от 60 до 80МВ пространства на жестком диске и лучше всего также записать эти файлы на компакт-диск (CD-ROM). Недорогой настольный сканер ценой $ 100-300 будет достаточен для этой работы. Сканирование можно проводить вечером или по выходным.

ОРС

Следующий шаг - это провести процесс ОРС одним или несколькими работниками, имеющими хорошие языковые навыки. Файлы TIFF можно распределить по нескольким компьютерам или выполнять всю работу на одном. Обычно это займет около пяти или шести месяцев для работника на пол -ставки (примерно 20 часов в неделю) для полной и безошибочной обработки 1000 страниц в файлы Word или HTML-документов.

Поручение другим

В качестве альтернативы вы можете поручить эту работу профессиональной компании. Это будет стоить около $1500-$2000 для получения отличных Word или HTML-файлов.

4.2 Все публикации организации: 5000 страниц

Многие большие организации имеют архивы, состоящие примерно из 5000 страниц изданий, книг, различного рода литературы, которые уже не издаются.

Сканирование

Это слишком большой объем для простого настолько сканера. Сканирование лучше либо поручить компании (около $400 за 5000 страниц) или приобрести сканер с автоматической подачей страниц (около $900). Можно также приобрести сканер совместно с другими НПО или другими организациями ($6000 разделить на количество совладельцев). Все 5000 страниц займут около 300-400 MB, и снова мы рекомендуем вам параллельно записать это на CD.

ОРС

И снова вам нужно пройти через процесс ОРС, используя схожую рабочую силу, что и в предыдущем случае. Можно использовать один или несколько компьютеров. На 5000 страниц это займет около 25-30 месяцев при работе по 20 часов в неделю. На практике это очень долгий срок. Нужен человек, ответственный за плату работникам, надзором за качеством, предоставление необходимого места и т.д. для окончания работы качественно и за менее короткий срок.

Можно также создать файлы PDF, которые займут около 300-400 MB пространства и будут очень долго загружаться через Интернет.

Поручение другим

Можно поручить другой компании как сканирование, так и ОРС. Это будет стоить от $7500 до $10000 за всю работу.

4.3 Небольшая библиотека: 100.000 страниц

Различные крупные организации, университеты, правительство и специализированные библиотеки могут пожелать перевести всю библиотеку в цифровой формат — допустим 100.000 страниц. Первая вещь, о которой следует позаботиться, - это авторские права на все издания. Вы должны получить разрешение владельцев этих прав перед тем, как начать сканирование. Вам также следует убедиться в том, что эти документы еще не существуют в цифровом формате.

Сканирование

Такой объем слишком велик для сканера с автоматической подачей страниц. Это нужно либо поручить другим организациям ($8000 за 100.000 страниц) или приобрести дорогой сканер совместно с другими ($6000). Объем 100.000 страниц займет 6-8 GB. Снова вам лучше поместить копию в несколько компакт-дисков.

ОРС

Второй шаг - это проведение ОРС (или создание PDF-файлов для редко используемых документов). Это займет около 500 - 700 месяцев для всего процесса ОРС и перевода в Word и HTML при использовании работников на полставки. Это неэффективно, поэтому вам лучше поручить эту работу профессионалам.

Для снижения затрат большинство редко используемых страниц (скажем, 80% или 80.000 с.) можно конвертировать в файлы PDF, а остальные 20.000 в Word, HTML. Файлы PDF заняли бы 4-6 GB, долго загружаемых через Интернет, но стоили бы они $0.2 за страницу у профессиональной компании ($16.000 для 80.000 с.). Если использовать наемный труд для конвертации TIFF в PDF, то это заняло бы 10-20 месяцев работы на полставки.

Поручение другим

Если сохранить пропорцию 80% PDF и 20% HTML, Word, то первая часть стоит около $16.000, а вторая - около $30.000-$40.000, а в целом около $50,000. Если все провести через ОРС, это будет стоить $150.000-$200.000.


Copyright © 2002 2003 2004 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand.

Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”