Sistema unificado de lenguaje médico - Unified Medical Language System

El Sistema Unificado de Lenguaje Médico ( UMLS ) es un compendio de muchos vocabularios controlados en las ciencias biomédicas (creado en 1986). Proporciona una estructura de mapeo entre estos vocabularios y, por lo tanto, permite traducir entre los diversos sistemas de terminología; también puede verse como un tesauro y una ontología completos de conceptos biomédicos. Además, UMLS proporciona instalaciones para el procesamiento del lenguaje natural . Está destinado a ser utilizado principalmente por desarrolladores de sistemas en informática médica .

UMLS consta de fuentes de conocimiento (bases de datos) y un conjunto de herramientas de software. Los UML son útiles para resolver problemas complejos y para explicar el flujo de trabajo.

El UMLS fue diseñado y mantenido por la Biblioteca Nacional de Medicina de EE. UU. , Se actualiza trimestralmente y se puede utilizar de forma gratuita. El proyecto fue iniciado en 1986 por Donald AB Lindberg , MD , entonces Director de la Biblioteca de Medicina, y dirigido por Betsy Humphreys .

Objeto y aplicaciones

La cantidad de recursos biomédicos a disposición de los investigadores es enorme. A menudo, esto es un problema debido al gran volumen de documentos recuperados cuando se busca en la literatura médica. El propósito del UMLS es mejorar el acceso a esta literatura facilitando el desarrollo de sistemas informáticos que entienden el lenguaje biomédico. Esto se logra superando dos barreras importantes: "la variedad de formas en que los mismos conceptos se expresan en diferentes fuentes legibles por máquina y por diferentes personas" y "la distribución de información útil entre muchas bases de datos y sistemas dispares".

Licencia

Los usuarios del sistema deben firmar un "acuerdo UMLS" y presentar breves informes anuales de uso. Los usuarios académicos pueden utilizar el UMLS de forma gratuita con fines de investigación. El uso comercial o de producción requiere licencias de derechos de autor para algunos de los vocabularios fuente incorporados.

Fuentes de conocimiento

Metatesauro

El Metathesaurus forma la base del UMLS y comprende más de 1 millón de conceptos biomédicos y 5 millones de nombres de conceptos, todos los cuales provienen de los más de 100 vocabularios controlados incorporados y sistemas de clasificación. Algunos ejemplos de vocabularios controlados incorporados son CPT , ICD-10 , MeSH , SNOMED CT , DSM-IV , LOINC , Terminología de reacciones adversas a medicamentos de la OMS , Términos clínicos del Reino Unido , RxNorm , Ontología genética y OMIM (consulte la lista completa ).

El metatesauro está organizado por concepto, y cada concepto tiene atributos específicos que definen su significado y está vinculado a los nombres de concepto correspondientes en los diversos vocabularios fuente. Se representan numerosas relaciones entre los conceptos, por ejemplo, las jerárquicas como " isa " para las subclases y "es parte de" para las subunidades, y las asociativas como "es causado por" o "en la literatura a menudo ocurre cerca de" (el este último derivado de Medline ).

El alcance del Metathesaurus está determinado por el alcance de los vocabularios fuente. Si diferentes vocabularios usan diferentes nombres para el mismo concepto, o si usan el mismo nombre para diferentes conceptos, entonces esto se representará fielmente en el Metathesaurus. Toda la información jerárquica de los vocabularios de origen se conserva en el Metathesaurus. Los conceptos de metatesauro también pueden vincularse a recursos fuera de la base de datos, por ejemplo, bases de datos de secuencias de genes.

Red semántica

A cada concepto en el Metathesaurus se le asigna uno o más tipos semánticos (categorías), que están vinculados entre sí a través de relaciones semánticas . La red semántica es un catálogo de estos tipos y relaciones semánticas. Ésta es una clasificación bastante amplia; hay 127 tipos semánticos y 54 relaciones en total.

Los principales tipos semánticos son organismos, estructuras anatómicas, funciones biológicas, sustancias químicas, eventos, objetos físicos y conceptos o ideas. Los vínculos entre los tipos semánticos definen la estructura de la red y muestran relaciones importantes entre las agrupaciones y los conceptos. El vínculo principal entre los tipos semánticos es el vínculo " isa ", que establece una jerarquía de tipos. La red también tiene 5 categorías principales de relaciones no jerárquicas (o asociativas), que constituyen los 53 tipos de relaciones restantes. Estos están "físicamente relacionados con", "espacialmente relacionados con", "temporalmente relacionados con", "funcionalmente relacionados con" y "conceptualmente relacionados con".

La información sobre un tipo semántico incluye un identificador, una definición, ejemplos, información jerárquica sobre los tipos semánticos que lo abarcan y relaciones asociativas . Las relaciones asociativas dentro de la Red Semántica son muy débiles. Capturan a lo sumo relaciones de algunos-algunos, es decir, capturan el hecho de que alguna instancia del primer tipo puede estar conectada por la relación destacada con alguna instancia del segundo tipo. Expresados ​​de manera diferente, capturan el hecho de que una aserción relacional correspondiente es significativa (aunque no tiene por qué ser cierta en todos los casos).

Un ejemplo de una relación asociativa es " puede causar ", aplicado a los términos (fumar, cáncer de pulmón) que produciría: fumar " puede causar " cáncer de pulmón.

Léxico ESPECIALISTA

El SPECIALIST Lexicon contiene información sobre vocabulario común en inglés, términos biomédicos, términos que se encuentran en MEDLINE y términos que se encuentran en UMLS Metathesaurus. Cada entrada contiene información sintáctica (cómo se juntan las palabras para crear significado), morfológica (forma y estructura) y ortográfica (ortografía). Un conjunto de programas Java utiliza el léxico para trabajar a través de las variaciones en los textos biomédicos relacionando las palabras por sus partes del habla, lo que puede ser útil en búsquedas web o búsquedas a través de un registro médico electrónico .

Las entradas pueden ser términos de una palabra o de varias palabras. Los registros contienen cuatro partes: forma base (es decir, "ejecutar" para "ejecutar"); partes del discurso (de las cuales el especialista reconoce once); un identificador único; y cualquier variante ortográfica disponible. Por ejemplo, una consulta de "anestésico" devolvería lo siguiente:

{ base=anaesthetic
      spelling_variant=anesthetic
      entry=E0008769
          cat=noun
          variants=reg
}
{ base=anaesthetic
      spelling_variant=anesthetic
      entry=E0008770
          cat=adj
          variants=inv
          position=attrib(3)
}

El léxico ESPECIALISTA está disponible en dos formatos. El formato de "registro unitario" se puede ver arriba y comprende ranuras y rellenos . Un espacio es el elemento (es decir, "base =" o "variante ortográfica =") y los rellenos son los valores atribuibles a ese espacio para esa entrada. El formato de " tabla relacional " aún no está normalizado y contiene una gran cantidad de datos redundantes en los archivos.

Inconsistencias y otros errores

Dado el tamaño y la complejidad del UMLS y su política permisiva sobre la integración de términos, los errores son inevitables. Los errores incluyen ambigüedad y redundancia, ciclos de relación jerárquica (un concepto es a la vez un ancestro y descendiente de otro), ancestros faltantes (los tipos semánticos de conceptos padre e hijo no están relacionados) e inversión semántica (la relación hijo / padre con los tipos semánticos es no coherente con los conceptos).

Estos errores se descubren y resuelven mediante la auditoría de UMLS. Las auditorías manuales pueden llevar mucho tiempo y ser costosas. Los investigadores han intentado abordar el problema de varias formas. Se pueden utilizar herramientas automatizadas para buscar estos errores. Para inconsistencias estructurales (como bucles), una solución trivial basada en el orden funcionaría. Sin embargo, no se aplicaría lo mismo cuando la inconsistencia está en el nivel de término o concepto (significado específico del contexto de un término). Esto requiere que se utilice una estrategia de búsqueda informada ( representación del conocimiento ).

Herramientas de software de apoyo

Además de las fuentes de conocimiento, la Biblioteca Nacional de Medicina también proporciona herramientas de apoyo.

Software de terceros

Ver también

Referencias

  1. ^ Sistema de lenguaje médico unificado , 1996
  2. ^ Ellison D, Humphreys BL, Mitchell J (julio de 2010). "Entrega del premio Morris F Collen 2009 a Betsy L Humphreys, con comentarios del destinatario" . Revista de la Asociación Estadounidense de Informática Médica . 17 (4): 481–5. doi : 10.1136 / jamia.2010.005728 . PMC   2995660 . PMID   20595319 .
  3. ^ a b Biblioteca Nacional de Medicina (2009). "Capítulo 5 - Redes semánticas" . Manual de referencia de UMLS . Bethesda, MD: Biblioteca Nacional de Medicina de EE. UU., Institutos Nacionales de Salud.
  4. ^ Browne AC, McCray AT, Srinivasan S (junio de 2000). El léxico del especialista (PDF) . Bethesda, MD: Centro Nacional de Comunicaciones Biomédicas Lister Hill, Biblioteca Nacional de Medicina. pag. 1.
  5. ^ Morrey CP, Geller J, Halper M, Perl Y (junio de 2009). "La herramienta de auditoría de vecindario: una interfaz híbrida para auditar el UMLS" . Revista de Informática Biomédica . 42 (3): 468–89. doi : 10.1016 / j.jbi.2009.01.006 . PMC   2891659 . PMID   19475725 .
  6. ^ Geller J, Morrey CP, Xu J, Halper M, Elhanan G, Perl Y, Hripcsak G (noviembre de 2009). "Comparación de configuraciones de relaciones inconsistentes que indican errores UMLS" . AMIA ... Actas del Simposio Anual. Simposio AMIA . 2009 : 193–7. PMC   2815406 . PMID   20351848 .
  7. ^ Zhu X, Fan JW, Baorto DM, Weng C, Cimino JJ (junio de 2009). "Una revisión de los métodos de auditoría aplicados al contenido de terminologías biomédicas controladas" . Revista de Informática Biomédica . 42 (3): 413-25. doi : 10.1016 / j.jbi.2009.03.003 . PMC   3505841 . PMID   19285571 .
  8. ^ "Noticias de Unified Medical Language System® (UMLS®): Acuerdo de licencia revisado, nuevos servicios de terminología UMLS y navegador, UMLSKS descontinuado y cambios en la API" . Boletín técnico de NLM . Biblioteca Nacional de Medicina de EE. UU. 29 de julio de 2010.

Otras lecturas

enlaces externos