Citation
Share
Date
Abstract
El flujo de información disponible a través de la Internet ha crecido de manera exponencial, sin embargo, el poder aprovechar esta información es difícil ya que se encuentra el texto en forma libre y al hacer una búsqueda se regresa un número muy grande de documentos que satisfacen los criterios requeridos, pero que no necesariamente representan lo que se busca. Cualquier información en formato libre se puede representar de una manera semiestructurada, utilizando etiquetas que permitan hacer búsquedas más precisas de acuerdo a lo que se necesita encontrar. Para el uso y manejo de información semiestructurada es necesario la ayuda de herramientas especiales, enfocadas en el manejo de este tipo de información, como lo es XML (Extensible Markup Language) [7] que es un lenguaje que permite estructurar la información y asignarle un significado semántico. Pero XML por sí solo no es suficiente, es necesario definir las reglas para transformar un documento sin organización a uno que si la tenga. En esta investigación se desarrolló una metodología que define un conjunto de pasos para tomar información semiestructurada y organizarla, con el fin de poder almacenarla de forma fácil y eficiente con el objetivo de poder mantenerla, por ejemplo mediante actualizaciones, y sobre todo poder usarla a través de consultas, ya sea obteniendo solo una fracción de la información o incluso todo el documento sin que éste haya perdido detalles como su organización original. Como resultado de la aplicación de la metodología propuesta se obtienen: un modelo de datos jerárquico y flexible que permite almacenar información semiestructurada, y también se obtienen, las estructuras que faciliten la representación de dicha información. A diferencia de propuestas existentes, como Object Exchange Model [14] ó Entidad Relación para datos semiestructurados [11], el modelo resultante se crea en base al análisis de las características de la información a manejar, mediante la metodología propuesta, y define también, las estructuras de representación particulares. En esta investigación se desarrolló un modelo de datos semiestructurados aplicado a contenidos curriculares de computación e informática usando la metodología propuesta. La validación del modelo resultante se llevó a cabo mediante su implementación en un sistema computacional que interactúa con una base de datos cuyo diseño fue creado a partir del modelo de datos creado. Así miso, el sistema computacional interactúa con la información semiestructurada almacenada en la base de datos, a través de las estructuras definidas para la interpretación de la información, logrando con esto: almacenar, manipular y consultar información semiestructurada. Definir modelos de datos semiestructurados para otros campos se puede llevar a cabo gracias a la metodología propuesta la cual permite, mediante el análisis de las características de la información a manejar, crear modelos adaptados a la información a almacenar y manipular.