Ejercicio tutorial de Greenstone

Back to wiki
De regreso al index
Prerequisito: Observar una colección de multimedia
Archivos muestra: beatles.zip
Ideado para versión Greenstone: 2.60
Modificado para versión Greensotne: 2.70

Construir una colección de multimedia

Procederemos a reconstruir desde ceros la colección Beatles que usted acaba de mirar. Desarrollaremos la colección con un pequeño subconjunto del material para agilizar la reconstrucción.

  1. Comience una nueva colección (Archivo → Nuevo) llamado small_beatles, basado por defecto en "New Collection." (Basado en la colección existente Advanced Beatlesharía la vida mucho más fácil, pero queremos que usted aprenda cómo construir desde ceros!!) Llene los campos con la información apropiada. Use el conjunto de los metadatos Dublin Core (es el conjunto por defecto).

  1. Copie los archivos suministrados

    sample_files → beatles → advbeat_small

    en su nueva colección. Haga ésto abriendo advbeat_small,escogiendo los ocho items dentro de ella (desde discography hacia beatles_midi.zip), y arrastrándolos hacia allá. Como algunos de estos archivos están en formatos MP3 y MARC, se le preguntará si hay que incluir MP3Plug y MARCPlug en su colección. Haga clic en <Adicionar Plugin>.

  1. Cámbiese al panel Enrquecer y explore entre los archivos. No hay metadatos—todavía. Recuerde que puede hacer doble clic en los archivos para verlos.

    (No hay archivos MIDI en la colección: estos requieren una personalización más avanzada porque no hay plugin de MIDI. Más tarde trataremos este problema)

  1. Cámbiese al panel Crear y construir la colección.

  1. Vista previa de los resultados.

Corrección manual de etadatos

  1. Puede ser necesario corregir algunos metadatos—por ejemplo, la atroz ortografìa en los títulos "MAGICAL MISTERY TOUR." Estos documentos están en la sección de discografía, con nombres de archivo que tienen los mismos errores de ortografía. Busque uno de ellos en el panel Enriquecer. Nótese que el elemento de metadatos extraido ex.Título ahora está lleno y con errores de ortografía. Este elemento no se puede corregir ya que se ha extraido del archivo y se extraerá cada vez que se reconstruya la colección.

  1. En cambio, adicione dc.Título de metadatos para estos dos archivos: "Magical Mystery Tour." Cámbiese al panel Enriquecer, abra la carpeta de discografía y penetre hasta los archivos individuales. Ponga el dc.Tçitulo de los items mal escritos.

Hay un problema. El dc.Título de metadatos no aparecerá en títulos a-z porque el clasificador ha sido instruido para usar ex.Título. Pero si se cambia el clasificador para usar dc.Título no tendría en cuenta todos los archivos extraidos! Afortunadamente, hay una manera de enfrentar este problema y es especificando una lista de nombres de metadatos en el clasificador.

  1. Cámbiese al panel Diseño y escoja la sección Clasificadores de Exploración. Haga doble clic en clasificador Título (el primero) para editar sus definiciones de configuración.

    Construir la colección otra vez y vista previa de la misma.

    Los metadatos extraidos no son confiables. Pero es muy barato! Por otra parte, los metadatos asignados manualmente son confiables, pero costosos. La sección anterior de este ejercicio ha mostrado cómo buscar el mejor de los dos mundos, usando los metadatos extraidos y corrigiéndolos cuando esten malos. Tal vez ésto no satisfaga al bibliotecario profesional pero puede ser interesante para el profesor de música que quiera tener su colección con un mínimo de esfuerzo.

Explorar por tipo de medios

  1. Primero retiremos el clasificador de nombres de archivos AZList que no es muy útil, y reemplacémoslo con una estructura para explorar los grupos de documentos por categoría (discografía, líricas, audio etc.). Las categorías se definen con metadatos asignados manualmente.

    Constuir la colección otra vez y vista previa de la misma.

Supresión de texto ficticio

  1. Junto con los archivos de audio, hay un ícono de MP3 que toca el audio cuando se hace clic sobre él y hay un documento de texto que contiene texto ficticio. Este no se ve, y para suprimirlo se debe trabajar con una instrucción de formato.

    Para hacerlo más fácil, hemos preparado un archivo plano de texto que contiene el nuevo texto. En WordPad abra el siguiente archivo:

    sample_files → beatles → format_tweaks → audio_tweak.txt

    (Asegúrese de usar WordPad en vez de Notepad, porque Notepad no muestra los cortes de línea correctamente.) Colóquelo en el buffer de copia resaltándo el texto en WordPad y escogiendo Editar → Copiar. Ahora regrese a la Intefaz del Bibliotecario, resalte todo el texto que conforma la instrucción de formato corriente VList y use Editar → Pegue para transformar la instrucción anterior en la nueva instrucción. Recuerde oprimir <Reemplaar Formato> al terminar.

    Vista Previa del resultado. Si está usando el servidor local de biblioteca Greenstone, cámbiese al panel Crear y haga clic en <Vista Previa de Colección>, lo que hace que el servidor local de biblioteca escanée de nuevo las instrucciones de formato. No hay que construir la colección otra vez porque las instrucciones de formato sólo se usan durante la ejecución.

  1. Mientras estamos allí, retiremos el nombre del archivo fuente de donde aparece, después de cada documento

    No olvide hacer clic en <Reemplazar Formato> después de este trabajo! Vista Previa de los resultados (no hay que construir la colección.)

Uso de AZCompactList en veza de AZList

  1. A veces hay varios documentos bajo un mismo título. Por ejemplo, All My Loving aparece como lírica y como tablatura (bajo ALL MY LOVING). El explorador de títulos a-z puede mejorarse agrupándolos bajo un ícono de estantería. Esto lo hace AZCompactList.

    Construir la colección nuevamente y vista previa de la misma. Ambos items para All My Loving aparecen ahora en el mismo estante. Sin embargo, no se han amalgamado muchas entradas porque no hay uniformidad de títulos: por ejemplo A Hard Day's Night aparece como cuatro diferentes variantes. Más adeñlante aprenderemos cómo almalgamarlos.

Hacer que las estanterías muestren cuántos items tienen

  1. Haga que las estanterías muestren cuántos documentos tienen, insertando una línea en la instrucción de formato VList en el Rasgos de Formato sección del panel Diseño:

    <td valign=top>
    {If}{[dc.Format] eq 'Audio',
      [srclink][srcicon][/srclink],
      [link][icon][/link]}</td>
    <td>{If}{[numleafdocs],([numleafdocs])}</td>
    <td valign=top>[highlight] {Or}{[dls.Title],[dc.Title],[Title],Untitled} [/highlight]</td>

    Ensontrará este texto en format_tweaks → show_num_docs.txt, que se puede copiar y pegar como antes. No olvide hacer clic en <Reemplazar Formato>.

    Vista Previa del resultado (no hay que construir la colección.)

  1. Ahora volvamos a las imágenes. Aquí también se muestran los documentos ficticios. Para suprimir los documentos ficticios, cambie la instrucción de formato VList en la sección Rasgaos de Formato del panel Diseño otra vez, adicionando las dos líneas resaltadas y el corchete:

    <td valign=top>
    {If}{[dc.Format] eq 'Audio',
      [srclink][srcicon][/srclink],
      {If}{[dc.Format] eq 'Images',
        [srclink][thumbicon][/srclink],
        [link][icon][/link]}}</td>
    <td>{If}{[numleafdocs],([numleafdocs])}</td>
    <td valign=top>[highlight] {Or}{[dls.Title],[dc.Title],[Title],Untitled} [/highlight]</td>

  1. Adicione un explorador de clasificación Phind en la sección Buscador de Clasificadores del panel Diseño. Deje los ajustes a su defecto: esto genera un clasificador de frase de búsqueda que hace origen de Título y texto.

  1. Para completar la colección, use el botón de explorar del ícono URL para 'acerca de la página' en la sección General del panel Diseñopara escoger la imagen siguiente:

    advbeatles_large → images → beatlesmm.png

    Construir la colección nuevamente y vista previa de la misma.

Nótese cómo asignamos los metadatos dc.Formato a todos los documentos en la colección, con un mínimo de trabajo. Lo hicimos aprovechando la estructura de la información original en la carpeta. Aunque inicialmente nos quejamos del desorden en la estructura, pudimos sacar provecho al asignar los metadatos.

Uso de Plug desconocido

En el próximo ejercicio incorporaremos los archivos MIDI. Greenstone no tiene plugin para MIDI (aún). Pero esto no significa que no se pueden usar archivos MIDI.

  1. PlugDesconocid es un plugin genérico útil. No sabe nada acerca de cualquier formato dado pero se puede adaptar para procesar diferentes tipos de documentos—como MIDI—basado en las extensiones de los nombres de archivo, y definir metadatos básicos.

    En la sección Documentos Plugin del panel Diseño:

    En esta colección, todos los archivos MIDI están contenidos en el archivo beatles_midi.zip. ZIPPlug (ya están en la lista de plugins por defecto) se usa para desempacar los archivos y pasarlos a la lista de plugins hasta llegar a PlugDesconocido.

  1. Construir la colección y vista previa de la misma. Desafortunadamente, los archivos MIDI no aparecen como Audio bajo el botón de explorar. Esto es porque no se les ha asignado dc.Formato de metadatos.

Limpiar un browser de título usando epresiones regulares

Ahora limpiamos el buscador titles a-z.

Para hacerlo, debemos poner la Interfaz del Bibliotecatrio en un modo diferente. La interfaz soporta cuatro niveles de usuario: Asistentes de Biblioteca, que pueden adicionar documentos o metadatos a las colecciones, y pueden crear nuevas colecciones cuyas estructuras sean espejo de las que tienen las colecciones ya existentes; Bibliotecarios, que pueden, adicionalmente, diseñar nuevas colecciones pero no pueden usar aspectos IT de especialistas (e.g. expresiones regulares); Especialistas en Sistemas de Bibliotecas, que pueden usar todos los aspectos de diseño pero no pueden hacer tareas de corrección de problemas (e.g. interpretar los resultados de corrección de errores de proceso en los programas Perl); y Expertos, que pueden ejercer todas las funciones.

Hasta ahora, usted ha estado operando la mayoría del tiempo en modo de Bibliotecario. Ahora nos cambiamos al modo de Especialisa en Sistema de Bibliotecas para el siguiente ejercicio.

  1. Para cambiar modos, haga clic en Archivo → Preferencias → Modo y cámbiese a Especialista en Sistemas de Bibliotecas. En la descripción que aparece, note que necesita ser capaz de formular expresiones regulares para usar este módulo completamente. Es lo que hacemos a continuación.

  1. Ahora regresamos a nuestro explorador de títulos a-z y lo limpiamos. El objetivo es amalgamar variantes de títulos, retirando texto extraño. Por ejemplo, nos gustaría tratar de la misma manera "ANTHOLOGY 1", "ANTHOLOGY 2" y "ANTHOLOGY 3" con el objeto de agruparlos. Para logralo:

    Construir la colección y vista previa del resultado. Observe cuántas veces más, se han amalgamado títulos similares bajo la misma estantería. Pruebe su comprensión de expresiones regulares tratando de racionalizar las amalgamas. (Nota: [[:punct:]] representa cualquier caracter de puntuación.) Los íconos al lado de los documentos de Word y PDF no son los correctos, pero esto se arregla en la siguiente instrucción de formato.

El ejercicio anterior se hizo en el modo Especialista en Sistemas de Bibliotecas porque requería el uso de expresiones regulares, algo en lo que los bibliotecarios no están entrenados.

Un uso potente de las expresiones regulares en el ejercicio fue limpiar el explorador de títulos a-z. Tal vez la mejor manera de hacer ésto sería tener los metadatos apropiados para el título. Los metadatos extraidos de archivos HTML son desordenados e inconsistentes, lo cual se vio en el explorador original de títulos a-z. Una definición apropiada de los metadatos de títulos sería más simple pero más laboriosa. En vez de esto hemos optado por usar expresiones regulares en el clasificador AZCompactList para limpiar los títulos de metadatos. Esto es difícil de entender, pero si puede manejar su indiosincrasia, esta es una manera rápida de limpiar los metadatos extraidos y evita la entrada de grandes cantidades de metadatos.

Uso de archivos macro no-estandar

Para dar los toques finales a nuestra colección, adicionamos algunos aspectos decorativos

  1. Usando del explorador de Windows por fuera de Geenstone, localice la carpeta

    sample_files → beatles → advbeat_large

  1. Copie las carpetas de imágenes y macros que se encuentran allá arriba en el nivel superior de su colección. (está bien sobreescribir en la carpeta existente de imágenes: éstas están incluidas en la carpeta que se está copiando.) La carpeta de imágenes incluye íconos útiles, y la carpeta de macros define nombres de macros que usan estas imágenes. Para ver las definiciones de macros, mirelas usando un editor de texto para abrir el archivo extra.dm en la carpeta de macros.

Uso de diferentes íconos para diferentes tipos de medios

  1. Re-Edite su instrucción formato de VList para que sea lo siguiente (en Diseño→ Rasgos de Formato)

    <td valign=top>
      {If}{[numleafdocs],[link][icon][/link]}
      {If}{[dc.Format] eq 'Lyrics',[link]_iconlyrics_[/link]}
      {If}{[dc.Format] eq 'Discography',[link]_icondisc_[/link]}
      {If}{[dc.Format] eq 'Tablature',[link]_icontab_[/link]}
      {If}{[dc.Format] eq 'MARC',[link]_iconmarc_[/link]}
      {If}{[dc.Format] eq 'Images',[srclink][thumbicon][/srclink]}
      {If}{[dc.Format] eq 'Supplementary',[srclink][srcicon][/srclink]}
      {If}{[dc.Format] eq 'Audio',[srclink]{If}{[FileFormat] eq 'MIDI',_iconmidi_,_iconmp3_}[/srclink]}
    </td>
    <td>
    {If}{[numleafdocs],([numleafdocs])}
    </td>
    <td valign=top>
    [highlight]
    {Or}{[dc.Title],[Title],Untitled}
    [/highlight]
    </td>

  1. La instrucción completa está en el archivo format_tweaks → multi_icons.txt.

  1. Vista previa de su colección como antes. Ahora se usan íconos diferentes para los metadatos de discografía, líricas, tablatura y MARC. Inclusive, se distinguen los archivos tipo audio MP3 y MIDI. Si deja que el ratón permanezca sobre estas imágenes, aparecerá una "herramienta" qué explica qué tipo de archivo está representado por el íncono en el idioma activo de la Interfaz. (nota: extra.dm sólo define Inglés y Francés).

Cambiar la imagen del fondo de la página

  1. Abra su carpeta de macros de la colección y localice el archivo extra.dm dentro de ella. Clic-derecho sobre ella. Si se le pide, escoja WordPad como la aplicación con la cual abrirla.

  1. El contenido del archivo es breve, especifica solamente lo que se necesita omitir de las acciones por defecto de esta colección. En WordPad, cerca de la parte superior del archivo usted debe ver:

    _collectionspecificstyle_ {
    <style>
    body.bgimage \{ background-image: url("_httpcimages_/beat_margin.gif"); \}
    \#page \{ margin-left: 120px; \}
    </style>
    }

    Use copiar y pegar en estas tres líneas para hacerlas parte del archivo como:

    # Original statements
    #_collectionspecificstyle_ {
    #<style>
    #body.bgimage \{ background-image: url("_httpcimages_/beat_margin.gif"); \}
    #\#page \{ margin-left: 120px; \}
    #</style>
    #}

    _collectionspecificstyle_ {
    <style>
    body.bgimage \{ background-image: url("_httpcimages_/tile.jpg"); \}
    </style>
    }

    Un signo número (#) al comienzo de la línea señala un comentario y Greenstone ignora el texto que sigue después. Lo usamos para comentar las tres instrucciones originales y reemplazarlas con líneas modificadas. Es útil retener la versión original en caso de que necesitemos restaurar las líneas originales en una fecha posterior. Estas tres líneas se refieren a la imagen de fondo usada. La nueva imagen tile.jpg también estaba en la carpeta images que se había copiado previamente.

  1. En WordPad, guarde extra.dm.

  1. Vista previa de la home page de la colección. El fondo de la página es ahora el nuevo gráfico.

    Se pueden alterar otros aspectos, editando los archivos macro—por ejemplo, los encabezados y pies de página usados en cada página y el estilo de resaltado para buscar términos (especifique un color diferente, use negrilla, etc.).

  1. Si lo desea, puede reversar el cambio más reciente hecho, comentando las tres nuevas líneas adicionadas (adicione #) y quitando los comentarios en las tres líneas originales (quite el caracter #). Recuerde guardar el archivo. Para deshacer todos los cambios personalizados, elimine el contenido de las carpetas macros e imágenes.

Construcción de una versión tamaño completo de la colección

  1. Para terminar, construyamos ahora una versión más grande de la colección. Para hacerlo:

Adicionar un explorador de collage de imágenes

  1. Cámbiese al panel Diseño y escoja la sección Clasificadores de Exploración. Jale hacia abajo el menú seleccionar clasificador para adicionar y escoja Collage. Haga clic en <Adicionar Clasificador...>. No hay necesidad de personalizar las opciones, de manera que haga clic en <OK> en la parte inferior de la ventana que aparece.

  1. Ahora cámbiese al panel Crear y construir y vista previa de la colección.


Copyright © 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand
Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”