DATA MINING

Buenos Aires, Argentina
DATA MINING Y LA MEDICINA BASADA EN LA EVIDENCIA.

Por el  Dr. Carlos Alberto Porta (BA)

Con el advenimiento de los modernos sistemas tecnológicos de Informática Médica, los profesionales de la Salud han podido tener acceso a un mundo insospechado de información actualizado y veloz.

La búsqueda bibliográfica por Internet, merced a las bondades de Medline y otras librerías, permitió que el médico dedicara su tiempo en menesteres profesionales mientras la Informática le conseguía la preciada documentación.

Pero con el tiempo, surgió el problema del control de calidad y seriedad científica de la información en Medicina, con lo cual la "Medicina Basada en la Evidencia" apareció como el paladín de los que con el pasar de los años veíamos con grandes dudas todo lo que se escribía sobre nuestras especialidades. A la primera visión surgió un autocuestionamiento de paranoia larvada, pero el análisis minucioso de la situación permitió detectar infinidad de procedimientos erroneamente elegidos, resultados criticables, seguridad epidemiológica ausente, y fue entonces cuando la MBE se consagró como la única forma de saber si las conductas estratégicas de los profesionales de la Salud eran sensatas o arrastraban las costumbres sin fundamentos a través de los tiempos.

Paralelamente, se produce un fenómeno que caracteriza la Informática de fin de siglo: nuestras habilidades para recolectar datos resultaron muy superiores a las facilidades con que podíamos analizarlos.  Y así fue como se impuso la necesidad de manejar coherentemente los enormes volúmenes de información que se recogen a diario, llegando al momento actual amparados bajo un concepto muy especial de la "Teoría del Conocimiento".

Cualquier data entry, o administrador de una base de datos sabe perfectamente que con el porcedimiento habitual de análisis solamente se  recoge una mínima parte de la información almacenada. El término "almacén de datos" tiene una palabra específica en Informática, que es "DATAWAREHOUSING". Se pretende con este término describir un depósito de información de gran magnitud, imposible de procesar por métodos habituales de manejo de base de datos. El ejemplo clásico es la lista de códigos que compramos en un supermercado, y la asociación de ellos en una misma compra.

La tecnología moderna nos permite hoy recolectar infinidad de datos. Pero no solamente fallamos en la velocidad del análisis. Siempre se sabe que quedan zonas y paquetes de información donde el análisis no llega.

Y así es como nació el "Descubrimiento del conocimiento en base de datos" (KDD; Knowledge Discovery in Databases), lo cual constituye una revolución dentro del proceso de manejo de información.  Su definición, es tan clara que se autodefine por su aplicación práctica:

"Es la extracción no trivial, desde los datos, de información implícita, previamente desconocida y potencialmente útil".

 Como manifestación estratégica no puede ser mas interesante para descubrir que la MBE se puede sentir alimentada en el futuro por la información codificada y almacenada en el mega datawarehouse de la Salud.

Es escalofriante pensar en la recolección de datos codificados en las consultas médicas del mundo entero, donde cada enfermedad puede tener síntomas hasta ahora no sospechados, por la sencilla razón de que hasta ahora a nadie se le ocurrió atar los cabos sueltos de la información dispersa.

La revolución de la MBE puede encontrar aquí una fuente no sólo de inspiración, sino de confirmación o rechazo de  viejas teorías que se perpetuan sin bases científicas ni estadísticas de valor.

Un trabajo colaborativo multicéntrico mundial con protocolos de recolección de datos uniforme, permitiría obtener información de singular valor como para permitir afirmar que la enfermedad XXX se presenta con el síntoma YYY en el x% de los casos.

Hasta ahora, hablamos de la estrategia del KDD. Pero para implementar la técnica debemos aplicar ciertos algoritmos para la extracción de patrones que utilizen los datos disponibles. Y eso, la exploración (o explotación) y análisis a través de algoritmos, por medios automáticos o semiautomáticos de grandes cantidades de datos con el fin de descubrir reglas y patrones significativos, se llama "DATAMINING". 

Solamente hay que querer sacar provecho de la información disponible. A la información existente en Salud, el mundo le queda chico. Con el Datamining de la base de datos de síntomas clínicos, la MBE puede llegar a decirnos que lo que creíamos que era de una forma, en realidad es de otra forma. 

Las raices de la Medicina clásica pueden llegar a temblar a la luz del "Nuevo conocimiento"  bajo el paraguas de la MBE, y dentro del Datawarehouse de la Salud.

Debemos pensar con la mentalidad de un minero. El yacimiento es el datawarehouse y todo lo que a diario recolectamos como información. Pero está inexplotado. Hay que buscar la veta de información desaprovechada y explotar la mina. Y eso es el datamining. Tenemos todo, menos las ganas y la decisión. 

Es un desafío, pero el nuevo siglo nos está acostumbrando a ponernos a prueba. Sólo que esta vez está de por medio la Salud del mundo entero.

Bibliografía:

"Data mining, o cómo transformar datos en Información".  Lic. Juan M. Ale. Universidad de Palermo, B. Aires. Comunicación personal.

 

"Data mining". Pieter Adriaans & Dolf Zantinge.  Ed. Addison-Wesley, USA. 1998


Cafetería / Lobby / Capilla

  CLINICA VIRTUAL GINECOLOGICA, Buenos Aires (Argentina)