Mª L MM_Manena_GOPubMed

Posted on 16 noviembre, 2014 por

0


La literatura biomédica crece a un ritmo tremendo. PubMed es el repositorio más utilizado para la bibliografía biosanitaria, contiene más de 21 millones de entradas; a medida que crece PubMed, las búsquedas bibliográficas se hacen más complejas y consumen mucho tiempo, ni siquiera la búsqueda avanzada con lógica booleana permite estructurar adecuadamente los resultados. Además, la enorme ambigüedad de la nomenclatura biomédica (genes, productos químicos, enfermedades…) produce resultados de búsqueda demasiado grandes e inespecíficos, el usuario tiene que leer cientos de artículos para seleccionar los más relevantes. La necesidad de una herramienta “automática” que permitiera consultas complejas y que redujera el ruido, y el silencio, llevó a la creación del buscador GOPubMed.

GOPubMed es un buscador basado en un vocabulario jerárquico controlado, la GeneOntology (GO) (http://www.geneontology.org/). La GO se compone de más de 19000 términos organizados en tres sub-ontologías: componentes celulares, funciones moleculares y procesos biológicos. Al igual que PubMed, se basa también en el MeSH, que es el tesauro de la Biblioteca Médica Nacional de los EEUU, que organiza por categorías o clases temáticas las referencias recuperadas y, sobre la base de esa clasificación, presenta los resultados.

Por tanto, estamos ante un buscador semántico basado en minería de texto y diseñado para la web 2.0. Fue desarrollado por la Universidad Técnica de Dresde (Alemania) y la empresa Transinsight GmbH, que desarrolla tecnologías de búsquedas “inteligentes”, esto es, semánticas. Esta herramienta es de acceso libre y la encontramos en: http://gopubmed.com/

Para realizar una consulta en GOPubMed se teclea la estrategia en la ventana de búsqueda. En principio, cualquier estrategia procesable por PubMed lo es también por GoPubMed. El sistema ofrece los resultados a la derecha de la pantalla y, a la izquierda oferta cuatro categorías con las que podemos filtrar los resultados:

  • What: Los resultados aparecen agrupados temáticamente en clases, según las jerarquías controladas de la Gene Ontology y el MeSH. Cada clase se puede explorar las veces necesarias hasta alcanzar la precisión deseada.
  • Who: Informa sobre el/los autor/es, permite precisar los autores más productivos y extraer las redes sociales de colaboración científica.
  • Where: Indica dónde encontramos la publicación (Revista, Internet, Institución…) y permite conocer qué revistas son las más productivas.
  • When: Nos data la información, fechas, pudiendo elegir entre los años más destacados o buscar por fecha concreta.

GOPubMed entrega las 1000 primeras referencias que devolvería PubMed, pero indica el número total de registros existentes y, utilizando búsqueda avanzada, se puede trabajar con todos ellos.
Existe la posibilidad de ver estadísticamente los resultados, en tablas y gráficos (Opción “Show statistics for this1000 articles”) que nos muestran los países o ciudades y las revistas más productivos sobre el tema, la distribución de la producción por años, el interés sobre el tema durante el periodo consultado y la distribución de la producción sobre la temática consultada en un mapamundi.
A la derecha del título del artículo se muestra el PMID (número que asigna PubMed a cada uno de sus registros), con la opción “Related articles”podemos encontrar los artículos relacionados en GOPubMed.
A la izquierda del texto hay un icono que permite varias opciones: leer el resumen completo, ver el documento en otro formato, señalar que el artículo visualizado no es pertinente para la selección realizada…

De todas las posibilidades que ofrece la minería de texto que realiza GOPubMed, las que encuentro más interesantes para los investigadores de mi centro, Hospital Universitario Virgen de las Nieves, son la posibilidad de usarlo para buscar personas con las que colaborar en un proyecto de investigación, por un lado, y la rapidez y claridad con que ofrece los resultados del análisis, por otro.
El buscador nos muestra la red social de los autores principales del tema que se está analizando y, si dos artículos tienen el mismo nombre de autor, GOPubMed utiliza estrategias para comprobar si se trata de la misma persona (por ejemplo, los relaciona con publicaciones de temas similares, con los co-autores, con las revistas donde publican, etc y así cuanto más sean las coincidencias más posibilidades hay de que se trate del mismo autor).
La localización de los autores más productivos en un tema específico, conocer quiénes son los líderes de una técnica determinada, cuáles son las revistas que con mayor frecuencia publican sobre un tema concreto, qué enfermedades se relacionan con un gen concreto, etc de una forma automática, gracias al enfoque semántico, simplifica mucho la tarea de búsqueda del investigador de una información tan complejamente interrelacionada.

Por último mencionar que existen otras herramientas web basadas en el buscador PubMed y que también utilizan un enfoque semántico:

Textpresso: Es un sistema de recuperación de información basado en un conjunto de solo unas 30 categorías de la clasificación GO. http://www.textpresso.org/

XplorMed: Muestra los resultados de PubMed en relación a las ocho principales categorías de el MeSH, extrae las palabras clave del tema y sus concurrencias. http://xplormed.ogic.ca/

Vivisimo: Al igual que GOPubMed, utiliza una ontología para explorar los resultados de la búsqueda, pero aquí deriva automáticamente una ontología de los resultados de búsqueda (coincide estrechamente con los artículos) por lo que no resulta tan bien estructurada como en GO. http://-01.ibm.com/software/data/information-optimization/

GO2PUB: Se basa en la expansión semántica, genera palabras clave adicionales de los términos de GO (nombres de genes, símbolos y sinónimos), por lo que se revela como una excelente herramienta complementaria de GOPubMed. http://go2pub.genouest.org

MEDIE: Desarrollado por el Laboratorio Tsujii de la Universidad de Tokio, es un motor de búsqueda inteligente que localiza correlaciones semánticas en las frases de los resúmenes de la base de datos Medline. http://www.nactem.ac.uk/tsujii/medie/

Quertle: Buscador semántico libre basado en PubMed: http://www.quertle.info/

Anuncios