Extracción automática de metadatos de un documento digital

dc.contributor.advisorGarza Salazar, David A.,
dc.contributor.chairScheel Mayenberger, Carlos
dc.contributor.committeememberSordia Salinas, Martha
dc.contributor.committeememberMartínez Treviño, Yolanda
dc.contributor.departmentITESM-Campus Monterreyen
dc.contributor.departmentPrograma de Posgrado en Computación, Información y Comunicacioneses_MX
dc.contributor.divisionDivisión de Graduados en Computación, Información y Comunicacioneses_MX
dc.contributor.institutionCampus Monterreyes_MX
dc.creatorPiña González, Orlando Julian
dc.date.accessioned2015-08-17T09:49:50Zen
dc.date.available2015-08-17T09:49:50Zen
dc.date.issued2000-05-01
dc.description.abstractDebido la necesidad de manejar las grandes cantidades de información que se generan día con día, la Extracción de Información se ha convertido en un área de la computación que ha tomado gran relevancia en los últimos años. En particular, dentro del ámbito de las Bibliotecas Digitales existe información acerca de un documento que es muy importante para la Clasificación, Indexamiento y Búsqueda de Información dentro de éstos; ésta información recibe el nombre de "Metadatos" y permite al usuario de la información obtener rápidamente una idea clara de su contenido. Actualmente existen diferentes esfuerzos para obtener información de documentos digitales, pero son pocos los esfuerzos dirigidos a la extracción de información de documentos en idioma Español, y específicamente sobre los metadatos. El presente trabajo se centra en el diseño y evaluación de heurísticas de Extracción de Información para documentos en Español. Los algoritmos fueron diseñados para la extracción de cuatro metadatos de importancia de un documento digital de tipo investigación: Fecha de creación, Autor, Extracción de palabras clave del Tema y Título del documento. Estos algoritmos utilizan técnicas y herramientas de extracción no muy complicadas que no utilizan técnicas de Inteligencia Artificial y que presentan resultados confiables para su aplicación en el ambiente de producción de bibliotecas digitales. Durante las pruebas de evaluación de desempeño de las heurísticas diseñadas sobre una muestra de documentos en Español e Inglés, se pudo apreciar un rendimiento arriba del 80 % de efectividad y en algunas de ellas alrededor del 90 %. Se pudo observar que las heurísticas se aplican de igual forma a documentos en idioma Inglés con resultados de efectividad muy similares.es_MX
dc.description.degreeMaestro en Ciencias con Especialidad en Tecnología Informáticaes_MX
dc.format.mediumTexto
dc.identificatorCampo||7||33||3304||120317
dc.identifier.urihttp://hdl.handle.net/11285/568007en
dc.languagespa
dc.publisherInstituto Tecnológico y de Estudios Superiores de Monterrey
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0*
dc.subject.classificationArea::INGENIERÍA Y TECNOLOGÍA::CIENCIAS TECNOLÓGICAS::TECNOLOGÍA DE LOS ORDENADORES::INFORMÁTICAes_MX
dc.subject.keywordExtracción de informaciónes_MX
dc.subject.keywordHeurísticas para la extracción de metadatoses_MX
dc.subject.keywordMetadatoses_MX
dc.titleExtracción automática de metadatos de un documento digitales_MX
dc.typeTesis de maestría
refterms.dateFOA2018-03-06T14:20:31Z

Files

Original bundle

Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
DocsTec_5631_1.pdf
Size:
34.97 KB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
PinaGonzalez_TesisMaestria.pdf
Size:
5.93 MB
Format:
Adobe Portable Document Format
Description:
Tesis de Maestría
Loading...
Thumbnail Image
Name:
PinaGonzalez_ActadeGrado.pdf
Size:
76.59 KB
Format:
Adobe Portable Document Format
Description:
Acta de grado
logo

El usuario tiene la obligación de utilizar los servicios y contenidos proporcionados por la Universidad, en particular, los impresos y recursos electrónicos, de conformidad con la legislación vigente y los principios de buena fe y en general usos aceptados, sin contravenir con su realización el orden público, especialmente, en el caso en que, para el adecuado desempeño de su actividad, necesita reproducir, distribuir, comunicar y/o poner a disposición, fragmentos de obras impresas o susceptibles de estar en formato analógico o digital, ya sea en soporte papel o electrónico. Ley 23/2006, de 7 de julio, por la que se modifica el texto revisado de la Ley de Propiedad Intelectual, aprobado

DSpace software copyright © 2002-2025

Licencia