BIBLIOTECA DIGITAL GREENSTONE

DEL PAPEL A LA COLECCIÓN

Dr. Michel Loots, Dan Camarzan e Ian H. Witten

Human Info (Bélgica)
Simple Words (Rumania)
Universidad de Waikato (Nueva Zelanda)

Greenstone es un conjunto de programas y aplicaciones de software especialmente diseñados para la creación y difusión de colecciones documentales digitales, el cual le ofrece una nueva forma de organizar la información y publicarla en Internet o CD-ROM. Greenstone ha sido elaborado como parte del proyecto de Biblioteca Digital de Nueva Zelanda de la Universidad de Waikato y actualmente es desarrollado y distribuido en colaboración con la UNESCO y la ONG Human Info. Es un software de código abierto disponible en http://greenstone.org bajo los términos y condiciones de la Licencia Pública General de GNU.

Queremos estar seguros que este software trabaje bien para usted. Por favor comuníquenos cualquier problema que tenga con él a la siguiente dirección: [email protected]

Greenstone gsdl-2.50  Marzo de 2004

Acerca de este manual

El presente documento explica la forma de crear colecciones en CD-ROM a partir de documentos impresos y expone con detalle los procedimientos y costos de los procesos de escaneado y reconocimiento óptico de caracteres (OCR por sus siglas en inglés) para obtener al final un texto con el formato adecuado para los programas Greenstone. También se describe la forma de crear y editar el material asociado a una colección.

Hemos procurado formular nuestras explicaciones de la manera más sencilla posible. Cualquier referencia a productos o empresas responde a un propósito meramente ilustrativo, y no presupone por nuestra parte valoración o preferencia alguna por tales productos en perjuicio de cualquier otro.

Conjunto de documentos

La serie completa de documentos comprende cinco volúmenes:

Copyright

Copyright © 2002 2003 2004 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand.

Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”

Agradecimientos

Los capítulos dedicados al escaneado, el Organizador y demás información relativa a la creación de colecciones documentales colectivas sin fines de lucro son obra del Dr. Michel Loots , Gerente de la ONG Human Info y de HumanityCD , Dan Camarzan de Simple Words y el equipo que colabora con ambos desde Brasov (Rumania).

El programa Greenstone es fruto de la colaboración de muchas personas. Rodger McNab y Stefan Boddie son los principales arquitectos y programadores. También han contribuido David Bainbridge, George Buchanan, Hong Chen, Michael Dewsnip, Katherine Don, Elke Duncker, Carl Gutwin, Geoff Holmes, Dana McKay, John McPherson, Craig Nevill-Manning, Dynal Patel, Gordon Paynter, Bernhard Pfahringer, Todd Reed, Bill Rogers, John Thompson y Stuart Yeates. Otros miembros del proyecto Biblioteca Digital de Nueva Zelanda que proporcionaron asesoría y valiosas ideas para la concepción del sistema son: Mark Apperley, Sally Jo Cunningham, Matt Jones, Steve Jones, Te Taka Keegan, Michel Loots, Malika Mahoui, Gary Marsden, Dave Nichols y Lloyd Smith. También queremos dar las gracias a todos aquellos que contribuyeron a los paquetes de programas con licencias GNU incluidos en esta distribución: MG, GDBM, PDFTOHTML, PERL, WGET, WVWARE y XLHTML.

Contents

Introducción
Escáneres y escaneado
Escáneres
Preparación de los documentos
El proceso de escaneado
Productividad y recursos necesarios
OCR: reconocimiento óptico de caracteres
El proceso de OCR
Productividad y recursos necesarios
Alternativas al proceso de OCR
Combinación de escaneado y OCR
De 1.000 a 100.000 páginas en tres ejemplos
Una colección de pequeñas dimensiones: de 500 a 1.000 páginas
Todas las publicaciones de una organización: 5.000 páginas
Una pequeña biblioteca: 100.000 páginas
Creación de una colección digital
Métodos para crear colecciones
Aprendiendo a usar la interfaz en siete pasos y 15 minutos

Copyright © 2002 2003 2004 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand.

Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”