sábado, 14 de agosto de 2010

DELIMITACIÓN DE LOS CAMPOS DE INFORMACIÓN

Delimitación de los campos
La migración de datos, depende completamente de la manera en que representar la información. La delimitación de los datos y los campos de información son conceptos cruciales, de cara a facilitar la importación/exportación de un catálogo bibliográfico de un sistema de gestión de bibliotecas a otro, incluso para sistemas de gestión de archivos que utilicen otros modelos de descripción no basados inicialmente en el bibliográfico.

Los delimitadores como su propio nombre indica, son marcas que permiten identificar los segmentos de datos o contenidos de un determinado registro. Por tanto, cualquier formato de exportación de datos que esté debidamente delimitado, representa a la postre una tabla de una base de datos y en consecuencia todos sus campos. De esta forma se puede obtener una copia íntegra y exacta de la información original, quedando reproducida tanto en su forma y estructura como en su contenido.

Para lograr trasladar no sólo la estructura sino un contenido o información de origen, existen múltiples formas de representar y delimitar los datos, los campos que los contienen y en definitiva la estructura completa original. A menudo en los sistemas de automatización se desarrollan formatos propios, que plantean una codificación en la delimitación que reviste en algunos casos de gran complejidad. Esto se debe no sólo a cuestiones operativas, sino también comerciales y de protección de los sistemas de gestión que se desarrollan, evitando la operatividad de un centro bibliotecario, archivo, centro de documentación o museo, para poder transformar y manipular la información que originalmente creo y alimento en el sistema. Esta situación que puede llegar a ser paradójica, es real y limita sobremanera las operaciones de estudio estadístico de la colección bibliográfica y su circulación, de la gestión archivística y la tramitación de los expedientes y sus seguimientos, etc. Otros problemas que puede causar un formato de exportación no normalizado o convenido para su compatibilidad con otras herramientas de tratamiento de la información, es la limitación en el desarrollo de catálogos y publicaciones de referencia que tradicionalmente el documentalista y el archivero llevan a cabo con meridiana frecuencia; entre otros muchos motivos.

Conocida la problemática y la importancia de confeccionar formatos de migración o exportación de datos bien diseñados, se debe explicar como edificarlos convenientemente atendiendo a su casuística y diagnóstico general. Según se muestra en el gráfico de delimitación de campos e información, es obligado establecer minimamente dos delimitadores que correspondan al inicio y al final de un dato o un campo. De esta forma, cualquier PARSER o analizador de datos, es capaz de seguir un patrón sencillo de la codificación que se ha establecido para el formato de exportación correspondiente. A su vez es necesario establecer un delimitador que diferencia el inicio y el final de cada registro. Téngase en cuenta que un registro puede tener múltiples campos y múltiples datos, por lo que si se desean representar todos los datos de un registro bibliográfico o las descripciones de un expediente administrativo, se requiere obligatoriamente diferenciar la separación entre los diferentes asientos de la tabla.

Todos los separadores responden al esquema presentado, por lo que se observará siempre que la delimitación de datos y campos de un registro y a la postre de una tabla, mantienen un concepto de anidamiento singular.

A su vez, los delimitadores se conforman mediante caracteres ASCII, términos a modo de etiquetas previamente establecidas, códigos que definen un campo (como en el caso de las etiquetas MARC), códigos alfanuméricos, mezcla de códigos y caracteres especiales ASCII, o combinaciones entre todos estos elementos. Dicho de otra forma, cualquier palabra o término inventado, puede ser un delimitador válido, siempre y cuando se emplee conforme a unas normas de descripción para un campo de una tabla. Lo lógico es que en muchos casos los delimitadores sean los nombres de los campos de la tabla, de forma que se pueda identificar rápidamente la estructura original de la misma y encapsular la información.

Pero no siempre los formatos de exportación de información bibliográfica responden a estos esquemas que la lógica impone. Es el caso del formato ISO2709 ya que emplea delimitadores iniciales diferentes a los delimitadores finales. Por tanto en dicho caso si bien se cumple lo propuesto en el presente esquema, también es verdad, que está pensado para que la delimitación sea analizada de forma recursiva en función a las etiquetas que el PARSER tenga definidas como variables permitidas. Dicho de otra forma, el analizador de datos, define que el contenido de datos que encuentre en el espacio correspondiente entre la primera etiqueta de campo y la siguiente, corresponde a un dato de la primera etiqueta y así sucesivamente. Véase el siguiente esquema sobre delimitación de campos y datos en ISO2709-Unimarc.

A este modelo especial, hay que añadir el modelo de delimitación por anidamiento nodal, delimitación por caracteres especiales y código inicial y caracteres especiales finales. En todos los casos es posible de igual forma establecer la distinción de los diferentes datos y sus correspondientes campos.


No hay comentarios:

Publicar un comentario