¿Por qué los hospitales no invierten masivamente en científicos de datos, ya que están sentados en una pila de datos?

En mi opinión, se debe en gran medida a los diversos esquemas de protección de datos y confidencialidad del paciente y a las obligaciones legales que se han establecido. Existe una gran oportunidad para que el aprendizaje automático revolucione la atención médica, pero siempre existe la posibilidad de que esto no se pueda usar legalmente. O incluso si es así, los medios y el público en general adorarían un escándalo sobre esas proporciones. Vea aquí un ejemplo de cómo Google DeepMind pudo haber fallado en cumplir algunos requisitos legales hace unos meses y el caos que siguió.

Una razón un poco más técnica es que Machine Learning puede y fallará. Los médicos tienen que lidiar con no diagnosticar algo de vez en cuando. Sin embargo, tienen protocolos que se presentan para minimizar estas ocurrencias, que son similares a la revisión por pares. La otra cosa de su lado es que (la mayoría) de los médicos son humanos y eventualmente cometerán errores. Sin embargo, los modelos avanzados de Machine Learning generalmente compartirán datos entre los “doctores” de robots individuales para una mayor precisión, rompiendo algunos de estos protocolos. No hacerlo terminará con menos precisión para los “médicos” individuales. Además, el consenso público es que las máquinas no deben fallar, por lo tanto, si bien un médico puede ser perdonado por un error, un robot no puede.

Además, si observa algunos de los algoritmos de aprendizaje automático más avanzados, como los modelos de aprendizaje por refuerzo con aproximación de funciones, se supone que fallan para mejorar, y otros, como los codificadores automáticos variables, son inherentemente estocásticos. Fracasarán, y cuando lo hagan, el jurado no será indulgente.

A pesar de todo mi pesimismo, todavía hay oportunidades en el cuidado de la salud que la ciencia de datos está tratando de llenar, y lo hará, tarde o temprano. Creo firmemente que Intelligent Healthcare (no sabía cómo llamarlo) es un paso hacia el futuro y la forma en que DeepMind está tratando de hacer un trato con el NHS es, por supuesto, extremadamente admirable.

Si tiene la impresión de que los datos médicos no se utilizan o que los hospitales no están involucrados en la mejora de la atención médica y los resultados, no está informado.

O tal vez presume que los “científicos de datos” están mejor calificados para obtener valor de esos datos que los profesionales como enfermeras, médicos, estadísticos, actuarios y otros que ya utilizan los datos del hospital.

Mire esto desde el punto de vista de un administrador de atención médica, alguien que controla el presupuesto. La práctica médica, las operaciones hospitalarias y los datos médicos se rigen por una miríada de obligaciones legales, éticas y contractuales.

El administrador ya tiene un equipo de personas que comprende esas obligaciones y ha refinado ese entendimiento a través de la educación formal, la experiencia laboral y, en muchos casos, requiere educación continua.

Supongamos por un momento que el administrador tiene un presupuesto de sobra y quiere usarlo en mejores análisis. Muchos profesionales de la salud tienen habilidades de análisis de datos. Por lo tanto, el primer recurso es utilizar el personal actual, barajando responsabilidades o aprovechando el personal infrautilizado. El entrenamiento puede corregir cualquier falta de habilidad.

Si las necesidades de asistencia de análisis o gestión de datos superan la capacidad del personal interno, existe una industria de proveedores especializados de terceros que conocen el panorama de la atención médica y tienen un historial de rendimiento significativo.

¿Los científicos de datos saben algo que estas personas no saben? Tal vez. Pero pocos, si los hay, tienen el conocimiento de la industria que ofrecen otros profesionales competidores.

Antes de responder, voy a hacer muchas suposiciones. 1) está hablando de datos de análisis de sangre regulares, etc. 2) Estamos ignorando la investigación médica realizada por laboratorios y universidades. Nos estamos centrando en la investigación en entornos clínicos.

El primer problema que veo es que los datos de atención médica son notoriamente desordenados. Flatiron Health, una compañía que identificó este problema, está trabajando para resolverlo a través de una plataforma personalizada. Hasta que esto se resuelva, no hay mucho que podamos hacer. Además, la mayoría de las condiciones de salud son raras (en la población general). Por lo tanto, las medidas básicas, como la presión arterial, la temperatura y otras comprobables (es decir, de análisis de sangre), no explican bien las cosas cuando el evento es muy raro.

Por otro lado, los centros de salud están utilizando sus sistemas electrónicos de registros médicos para comenzar a explorar los datos que tienen.

Además, las características que son más importantes para una buena salud, como una dieta baja en sal, un menor consumo de carne roja y muy pocas bebidas azucaradas son tan predictivas que otras características más raras realmente no están agregando mucho para varios resultados finales, como una mayor esperanza de vida . Hasta donde yo sé, nadie ha encontrado ninguna característica misteriosa que no hayamos identificado utilizando medidas tradicionales y técnicas antiguas para la salud general y el bienestar contra las enfermedades del estilo de vida.

Por último, se realiza mucha investigación en los laboratorios, por lo que puede haber más interacción entre los hospitales y los laboratorios que realmente no consideramos por los supuestos que hice.

En una palabra, causalidad.

La profesión médica ya está plagada del problema de no usar los datos adecuadamente para conducir las decisiones clínicas. El modelo histórico consistía en utilizar la “sabiduría” médica transmitida de un médico con mayores niveles de autoridad a médicos menores, en una especie de forma heredada de “mejores prácticas”. Y aunque ciertamente hay espacio en cualquier profesión para la sabiduría anecdótica no probada y analizada formalmente, la medicina utilizada (y tal vez aún) se basa demasiado en este modelo. Incluso hay un movimiento llamado “medicina basada en la evidencia” que quiere impulsar la toma de decisiones del médico hacia el uso de los resultados de la investigación más reciente para tomar decisiones clínicas. ¡Como si hubiera una alternativa viable!

Entonces, la medicina apenas está llegando al lugar donde pueden incorporar los resultados de la evidencia aleatoria (o cuasi-experimental) de la investigación académica en la práctica médica. Y los ensayos aleatorios son bastante fáciles de entender en términos de causalidad. Los métodos de aprendizaje automático puramente predictivos empleados por la mayoría de los científicos de datos de rangos y archivos tienen muy poco que ofrecer a la comunidad médica, ya que los típicos métodos de aprendizaje automático listos para usar. soportes Estos métodos generalmente no ofrecen causalidad, lo cual es crucial para la medicina, y definitivamente no ofrecen ningún tipo de causalidad en la que los médicos sean capaces y estén dispuestos a creer y arriesgar la vida de sus pacientes.

Agregue además el hecho de que la profesión médica generalmente es un poco analfabeta y tecnófoba en informática, y tiene una batalla cuesta arriba. Los sistemas informáticos de un hospital típico del condado son de los años 80 y horrorizarían a la mayoría de los programadores. Cada vez que se actualizan, se les vende un software empresarial bizantino hecho por una corporación monopolista que se parece a todas las peores ideas de software de los años 90, y les cuesta un brazo y una pierna. ¡No es de extrañar que odien las computadoras!

Eso no quiere decir que no pueda haber un intercambio fructífero en el futuro, y la mayoría de los expertos dicen que es solo cuestión de tiempo. Pero la actual generación de médicos no está lista para las tareas de la computadora en tareas que solo requieren predicción y no causalidad, y la actual generación de datos científicos no tiene nada que ofrecer en términos de causalidad real.

No tienen la capacidad de convertir registros EHR en bases de datos SQL / Hadoop. Esto tendrá que suceder antes de que los científicos de datos puedan acceder efectivamente a los datos. Supongo que pasarán otros 2-3 años antes de que comencemos a ver que la ciencia de datos llegará a la atención médica. Si conoce alguno de los que ya tienen sistemas SQL / Hadoop, estoy muy interesado en consultarlos y configurar sistemas de aprendizaje automático. ¡Envíelos a mi manera!

More Interesting

¿Hay científicos de datos para quienes DevOps es una parte importante de su trabajo?

¿Cómo es posible ser un científico de datos con experiencia en ingeniería industrial?

¿Es necesario el conocimiento de dominio para un científico de datos?

¿Podría comparar la ciencia de los datos y la informática, las complejidades de cada una, las perspectivas profesionales futuras y las trayectorias profesionales en consecuencia? ¡Gracias!

¿Qué piensan los codificadores, matemáticos y científicos de alto nivel sobre la eficiencia de tiro de Steph Curry?

¿Contrataría a un científico de datos sin título?

¿Qué debo aprender para convertirme en un científico / analista de datos?

¿Cuántos datos son suficientes al analizar un conjunto de datos?

Cómo convertirse en un científico de datos

¿Linkedin, Quora, Facebook, Google, Twitter reclutan científicos de datos de universidades de menor rango en los Estados Unidos?

¿Cómo es un día en la vida de un científico de datos? ¿Por qué es esta la carrera más popular en este momento?

¿Qué tipo de científicos de datos se emplearán siempre, incluso durante las caídas del mercado? ¿Es la única forma de lograr la seguridad laboral en tecnología siendo tan bueno que en el instante en que no esté satisfecho con su trabajo, otra compañía lo recibirá con los brazos abiertos?

¿Cuáles son algunos análisis típicos que hacen los científicos de datos en eBay?

¿Qué plan de estudios, si corresponde, debería seguir para convertirme en un científico de datos de Scratch?

¿Cuál es el papel de un ingeniero de datos en Facebook?