Bibliothèque numérique Greenstone: du papier à la collection

Dr Michel Loots, Dan Camarzan et Ian H. Witten

ONG Human Info, Belgique
Simple Words, Roumanie
Université de Waikato, Nouvelle-Zélande

Greenstone est une suite logicielle destinée à la construction et à la distribution de collections de bibliothèques numériques. Cette suite fournit une nouvelle manière d'organiser l'information et de la publier sur l'Internet ou sur un cédérom. Greenstone est produit par le projet de bibliothèque numérique de Nouvelle-Zélande (dépendant de l'université de Waikato), et développé et distribué en coopération avec l'UNESCO et l'ONG Human Info.C'est un logiciel Open Source, diffusé selon les termes de la licence publique générale de GNU, et qu'on peut obtenir à l'URL http://greenstone.org.

Nous souhaitons nous assurer que ce logiciel fonctionne bien pour vous.
Faites-nous part, en anglais, de tout problème à l'adresse électronique [email protected].

Greenstone gsdl-2.50  Mars 2004

À propos de ce manuel

Ce document explique comment créer des collections de cédéroms à partir de documents papier. Il décrit en détail les procédures et les coûts relatifs à la numérisation et aux processus de reconnaissance optique de caractères (ROC, ou OCR), de manière à obtenir des textes dans un format que Greenstone puisse accepter. Il décrit aussi comment créer et éditer le matériel associé à une collection.

Nous nous sommes efforcés d'être aussi clairs et complets que possible dans nos explication. Toute marque commerciale mentionnée ne l'est que dans un but d'illustration, et cela ne signifie en rien que nous conseillions, favorisions ou recommandions ce produit d'une quelconque manière.

Documents d'accompagnement

L'ensemble des documents de Greenstone comprend cinq volumes:

Copyright

Copyright © 2002 2003 2004 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand.

Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”

Remerciements

L'opération de numérisation, l'Organizer et tout le savoir-faire relatif à la création de collections à but non lucratif par le fruit d'un travail de collaboration furent développés par Michel Loots, docteur en médecine, membre des projets Human Info NGO et HumanityCD, et par Dan Camarzan de Simple Words, ainsi que par leurs collaborateurs de Brasov, en Roumanie.

Le logiciel Greenstone a vu le jour grâce à un effort de collaboration entre de nombreuses personnes. Rodger McNab et Stefan Boddie en sont les principaux architectes et développeurs. Des contributions ont été faites par David Bainbridge, George Buchanan, Hong Chen, Michael Dewsnip, Katherine Don, Elke Duncker, Carl Gutwin, Geoff Holmes, Dana McKay, John McPherson, Craig Nevill-Manning, Dynal Patel, Gordon Paynter, Bernhard Pfahringer, Todd Reed, Bill Rogers, John Thompson, et Stuart Yeates. D'autres membres du Projet de bibliothèque numérique de Nouvelle-Zélande ont également donné des conseils et inspiré les concepteurs du système: Mark Apperley, Sally Jo Cunningham, Steve Jones, Te Taka Keegan, Michel Loots, Malika Mahoui, et Lloyd Smith. Nous remercions aussi tous ceux qui ont contribué au développement des modules sous licence GNU GPL qui font partie de cette distribution: MG, GDBM, PDFTOHTML, PERL, WGET, WVWARE, XLHTML.

Contents

Introduction
Les scanners et la numérisation
Les scanners
La préparation des documents
L'opération de numérisation
De la productivité et des ressources nécessaires
ROC: reconnaissance optique de caractères
Le processus de ROC
De la productivité et des ressources nécessaires
Pour éviter la ROC
Mettre bout à bout numérisation et ROC
Trois exemples: de 1000 à 100 000 pages
Cas d'une petite collection: de 500 à 1000 pages
Toutes les publications d'une organisation: 5000 pages
Une petite bibliothèques: 100 000 pages
Créer une collection électronique
Méthodes de construction de collections
Commencer en sept étapes et en 15 minutes

Copyright © 2002 2003 2004 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand.

Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”