Semantic Medline

Posted on 22 enero, 2013 por

0


Medline es la base de datos más importante de referencias y resúmenes de revistas de literatura biomédica con cobertura internacional. Se puede consultar de forma gratuita desde el interfaz de Pubmed. The U.S. National Library of Medicine (NLM) se encarga de su producción y mantenimiento. Contiene 21,3 millones de registros de referencias procedentes de 5,600 revistas internacionales. Desde el 2005, cada día, se añaden entre 2000-4000(1,2).

El tesauro, vocabulario controlado, que utiliza para indexar sus registros es el Medical Subject Headings (MESH)(3) que en el 2011 contaba con 26,142 descriptores.

Las cifras que hemos expuesto anteriormente nos dan idea de la envergadura de la base de datos a la cual nos enfrentamos al realizar una búsqueda de información en Medline.

Aunque se han incorporado en Medline filtros metodológicos para que la recuperación de información sea más eficiente, sus usuarios siguen recuperando un gran ruido documental y necesitan ciertos conocimientos y habilidades sobre la base de datos.

La NLM está desarrollando Medline Semántico, un prototipo de aplicación web basado en el procesamiento de lenguaje natural para extraer el significado de las referencias de Medline. Consta de tres procesos principales: SemRep, Resumen y Visualización. Estos procesos capturan el significado del contenido de las citas, identifican el significado de las necesidades de información del usuario y finalmente muestra el resultado en una representación gráfica(4,5).

La tecnología fundamental es SemRep, que extrae la información semántica de los documentos y lo expresa de forma normalizada en predicados semánticos que entienden y pueden utilizar las máquinas. Para realizar esta tarea se sirve del conocimiento de dominio del Unifed Medical Language system (UMLS). El UMLS se nutre de tres fuentes de conocimiento: el lenguaje ESPECIALIST, el Metatesauro y una Red Semántica(4).

En el proceso de Resumen la generación de esquemas semánticos se hacía de forma manual, lo que suponía una enorme inversión de tiempo y de recursos humanos cualificados. La NLM ha desarrollado un algoritmo estadístico, Combo, que realiza este proceso de forma automática. Combo ha demostrado buenos resultados en términos de sensibilidad y precisión. Combo puede usarse con cualquier generador de predicados semánticos no sólo con SemRep(5).

El prototipo de Semantic Medline contiene 35 búsquedas de Pubmed y puede probarse en: http://skr3.nlm.nih.gov/SemMedDemo/

Referencias

1 U.S. National Library of Medicine (NLM). Fact Sheet Medline. Bethesda [US]: NLM, 2011. URL:http://www.nlm.nih.gov/pubs/factsheets/medline.html. Accessed: 2012-03-27. (Archived by WebCite® at http://www.webcitation.org/66TKyT0o5)

2 American Chemical Society (CAS).Medline. Ohio [US]: CAS, 2012. URL:http://www.cas.org/ASSETS/BF043DBCE4274170A03561C274C671D2/medline.pdf. Accessed: 2012-03-27. (Archived by WebCite® at http://www.webcitation.org/66TL2QuIz)

3 U.S. National Library of Medicine (NLM). Fact Sheet Medical Subject Headings (MeSH®). Bethesda [US]: NLM, 2011.. URL:http://www.nlm.nih.gov/pubs/factsheets/mesh.html. Accessed: 2012-03-27. (Archived by WebCite® at http://www.webcitation.org/66TLSeL3x)

4 Workman, ET; Hurdle, JF. Dynamic summarization of bibliographic-based data. Medical Informatics & Decision Making. 2011, 11:6 . URL:http://www.biomedcentral.com/content/pdf/1472-6947-11-6.pdf. Accessed: 2012-03-27. (Archived by WebCite® at http://www.webcitation.org/66TTzvnbx)

5 Rindflesch, TC; Kilicoglu, H; Fiszman, M; Rosemblat, G; Shin, D. Semantic MEDLINE: An advanced information management application for biomedicine. Information Services & Use. 2011, 31: 15–21. URL:http://iospress.metapress.com/content/u2j7035q26h5l421/fulltext.pdf. Accessed: 2012-03-27. (Archived by WebCite® at http://www.webcitation.org/66Tb1xnZd)

Anuncios