Cómo Mapear CIE-10-ES a SNOMED-CT para OMOP CDM: Guía Práctica
Guía técnica paso a paso para mapear diagnósticos CIE-10-ES al vocabulario SNOMED-CT dentro del modelo OMOP CDM, con herramientas OHDSI y mejores prácticas.
Cómo Mapear CIE-10-ES a SNOMED-CT para OMOP CDM
Uno de los desafíos más críticos al implementar el modelo OMOP CDM en un hospital español es el mapeo de vocabularios clínicos. Los hospitales del SNS codifican sus diagnósticos en CIE-10-ES (la adaptación española de la Clasificación Internacional de Enfermedades, 10.a revisión), pero el modelo OMOP requiere que los conceptos clínicos se expresen en vocabularios estándar, siendo SNOMED-CT el vocabulario de referencia para diagnósticos y condiciones clínicas.
Este artículo es una guía práctica para ingenieros de datos clínicos, equipos de documentación médica y responsables de proyectos OMOP que necesitan realizar este mapeo de forma rigurosa y reproducible.
¿Por Qué es Necesario el Mapeo?
El modelo OMOP CDM distingue entre conceptos fuente (source concepts) y conceptos estándar (standard concepts):
- Conceptos fuente: Son los códigos tal como aparecen en los sistemas del hospital (en nuestro caso, códigos CIE-10-ES como
E11.9para “Diabetes mellitus tipo 2, sin complicaciones”). - Conceptos estándar: Son los códigos normalizados que OMOP utiliza para el análisis. Para condiciones clínicas, el vocabulario estándar es SNOMED-CT.
Esta separación es fundamental porque permite que datos de hospitales de diferentes países, cada uno con su propia codificación local, sean comparables y analizables de forma conjunta. Un análisis de cohortes en la red DARWIN EU o un estudio multicéntrico con OHDSI solo funciona si todos los centros “hablan” el mismo idioma: SNOMED-CT.
La Jerarquía de Vocabularios OHDSI
Para entender el mapeo, es esencial conocer cómo OHDSI organiza los vocabularios en su repositorio Athena:
- Vocabularios fuente (CIE-10, CIE-10-ES, CIE-10-CM, Read, etc.): Contienen los códigos tal como se usan en los sistemas clínicos locales.
- Vocabularios estándar (SNOMED-CT, RxNorm, LOINC): Son los vocabularios de referencia para el análisis.
- Relaciones de mapeo: Athena contiene relaciones predefinidas del tipo “Maps to” que conectan conceptos fuente con sus equivalentes estándar.
El flujo lógico es: Código CIE-10-ES —> concept_id fuente —> (relación “Maps to”) —> concept_id estándar (SNOMED-CT).
Punto clave: OHDSI mantiene mapeos oficiales para CIE-10 y CIE-10-CM (la versión estadounidense), pero CIE-10-ES tiene códigos adicionales específicos de España que pueden no tener mapeo directo en Athena. Estos requieren mapeo manual.
Herramientas OHDSI para el Mapeo
La comunidad OHDSI proporciona un conjunto de herramientas de código abierto diseñadas específicamente para el proceso ETL y el mapeo de vocabularios:
White Rabbit: Perfilado de Datos Fuente
White Rabbit es la herramienta de data profiling que analiza las bases de datos origen del hospital y genera un informe detallado con:
- Listado de todas las tablas y campos disponibles.
- Distribución de valores en cada campo (frecuencias, nulos, formatos).
- Identificación de los códigos CIE-10-ES presentes y su frecuencia de aparición.
Este informe es el punto de partida imprescindible: no se puede mapear lo que no se conoce.
Rabbit-in-a-Hat: Diseño de la Especificación ETL
Rabbit-in-a-Hat utiliza la salida de White Rabbit para crear una especificación visual del ETL: qué tablas y campos del sistema origen se transforman en qué tablas y campos del modelo OMOP CDM. Es un documento de diseño que sirve como contrato entre ingenieros de datos y clínicos antes de escribir código.
Usagi: Mapeo de Vocabularios
Usagi es la herramienta central del proceso de mapeo semántico. Permite:
- Importar la lista de códigos fuente (por ejemplo, todos los códigos CIE-10-ES presentes en su hospital).
- Buscar automáticamente el concept_id estándar SNOMED-CT más cercano para cada código fuente, utilizando algoritmos de similitud de texto.
- Que un revisor humano acepte, rechace o modifique las sugerencias automáticas.
- Exportar la tabla de mapeo final en el formato requerido por OMOP (
SOURCE_TO_CONCEPT_MAP).
Proceso de Mapeo Paso a Paso
Paso 1: Perfilar los Datos Fuente con White Rabbit
Conecte White Rabbit a la base de datos de su HIS o CMBD y ejecute el escaneo. El resultado es un fichero que describe la estructura y el contenido de sus datos, incluyendo la lista completa de códigos CIE-10-ES utilizados en su centro, con sus frecuencias.
Consejo práctico: Priorice el mapeo por frecuencia. En la mayoría de hospitales, el 80% de los registros se concentra en un 20% de los códigos CIE-10-ES. Empiece por los más frecuentes.
Paso 2: Diseñar la Especificación ETL con Rabbit-in-a-Hat
Abra el informe de White Rabbit en Rabbit-in-a-Hat y defina las correspondencias tabla a tabla. Para diagnósticos, el destino principal es la tabla CONDITION_OCCURRENCE de OMOP. Documente las reglas de transformación: qué campo del sistema origen alimenta condition_source_value, condition_source_concept_id y condition_concept_id.
Paso 3: Mapear CIE-10-ES a SNOMED-CT con Usagi
Este es el paso más laborioso y crítico:
- Exporte la lista de códigos CIE-10-ES de su hospital desde White Rabbit.
- Importe la lista en Usagi y lance el proceso de mapeo automático.
- Revise cada sugerencia: Usagi propone el concepto SNOMED-CT más similar, pero muchas sugerencias requieren ajuste manual, especialmente para códigos CIE-10-ES específicos de España que no existen en CIE-10-CM.
- Clasifique los mapeos como “APPROVED” (correcto), “UNCHECKED” (pendiente) o “FLAGGED” (requiere revisión clínica).
Paso 4: Revisión Clínica de los Mapeos
Este paso no es opcional. Los mapeos de vocabularios clínicos deben ser validados por un profesional sanitario (médico documentalista, farmacéutico clínico o especialista en terminología) que verifique que la equivalencia semántica es correcta. Un ingeniero de datos no debe aprobar mapeos clínicos sin supervisión clínica.
Organice sesiones de revisión conjunta donde el equipo técnico presenta los mapeos y el equipo clínico los valida o corrige.
Paso 5: Validar con el Data Quality Dashboard (DQD)
Una vez cargados los datos mapeados en la instancia OMOP, ejecute el Data Quality Dashboard de OHDSI para verificar:
- Integridad: ¿Qué porcentaje de registros fuente se han mapeado correctamente a conceptos estándar?
- Plausibilidad: ¿Los códigos mapeados son clínicamente coherentes? (Por ejemplo, diagnósticos pediátricos en pacientes adultos).
- Conformidad: ¿Los datos cumplen las reglas de integridad del modelo OMOP?
Un porcentaje de mapeo a concepto estándar inferior al 90% debería activar una revisión del proceso.
Errores Comunes y Cómo Evitarlos
- Mapear solo a nivel de categoría: CIE-10-ES tiene granularidad variable. No acepte mapeos genéricos cuando existe un concepto SNOMED-CT más específico.
- Ignorar los códigos “sin mapeo” en Athena: Los códigos CIE-10-ES exclusivos de España requieren mapeo manual con Usagi. No los deje como
concept_id = 0. - Omitir la revisión clínica: Los errores de mapeo se propagan a todos los análisis posteriores. Una diabetes tipo 1 mapeada como tipo 2 invalida un estudio entero.
- No versionar los mapeos: Mantenga un control de versiones (Git) de sus tablas de mapeo. Los vocabularios OHDSI se actualizan trimestralmente y los mapeos deben revisarse.
- Mapear sin perfilar: Si no conoce la distribución real de sus datos, gastará esfuerzo en códigos que aparecen una vez e ignorará los que aparecen miles de veces.
¿Cómo Puede Ayudar Tiviztech?
En Tiviztech realizamos el mapeo completo de CIE-10-ES a SNOMED-CT para hospitales españoles que implementan OMOP CDM. Nuestro servicio incluye:
- Perfilado completo de datos fuente con White Rabbit, incluyendo análisis de calidad y cobertura.
- Mapeo semántico experto con Usagi, realizado por ingenieros de datos clínicos con experiencia en terminologías médicas españolas.
- Revisión clínica coordinada: Organizamos y facilitamos las sesiones de validación con su equipo médico.
- Validación con DQD: Ejecutamos el Data Quality Dashboard y proporcionamos un informe detallado de calidad de mapeo.
- Mantenimiento continuo: Actualizamos los mapeos con cada nueva versión de los vocabularios OHDSI.
¿Necesita mapear sus datos CIE-10-ES a OMOP CDM? Solicite una evaluación de viabilidad y le proporcionaremos un plan de trabajo detallado con estimación de esfuerzo y plazos.
Palabras clave: mapeo CIE-10 SNOMED-CT, OMOP CDM España, Usagi OHDSI, White Rabbit, ETL datos clínicos, vocabularios OHDSI, estandarización datos hospitalarios.