Tiempos de estadía de pacientes con Machine Learning

Machine Learning para la predicción de tiempos de estadía de pacientes

Por Juan Paul Idrovo, Data Scientist en Notus

Introducción sobre tiempos de estadía de pacientes

¿Alguna vez has estado hospitalizado? ¿Has tenido a alguien cercano en esta situación? Quizás en estas instancias has podido evidenciar que no sólo tienes que lidiar con tus problemas de salud, sino que también con el alto costo monetario que tiene cada día adicional de cama.

Sin embargo, los tiempos de estadía no sólo son un tema de preocupación para los pacientes, sino también para los mismos centros de salud. Raúl Aguilar, investigador senior del Instituto de Políticas Públicas en Salud de la Universidad San Sebastián (IPSUSS), afirmó, en una entrevista realizada por el mismo IPSUSS el año 2023, que “Chile cuenta con pocas camas y es primordial ser eficientes en el uso de los recursos disponibles”. Esta afirmación es respaldada por el informe Health at a Glance (OCDE, 2021), que indica que en Chile sólo hay dos camas por cada mil habitantes, cifra inferior al promedio de la OCDE de 4.2 camas.

Las camas hospitalarias son recursos escasos de alto costo, y por lo mismo, requieren de una gestión eficiente. Según el estudio “Hospitalizaciones Evitables y su relación con la disponibilidad de Infraestructura de Atención Primaria de Salud” (Alarcón y Aguilar, 2022), 1 de cada 10 pacientes que son dados de alta corresponden a hospitalizaciones “evitables”, y sin embargo, utilizaron un alto porcentaje del recurso. Estos errores de asignación generan tiempos de estadía innecesarias y uso evitable de un recurso escaso, además de exponer al paciente a un riesgo innecesario.

Una de las formas de evitar errores y generar una planificación eficiente de las camas es mediante el uso de modelos predictivos. Esto con el fin de estimar los tiempos de estadía de pacientes, según su información de ingreso, resultados de exámenes y otros datos simples de obtener. Dadas las razones expuestas y la relevancia del problema, en Notus desarrollamos un breve estudio y un modelo predictivo para estimar los tiempos de estadía de pacientes en camas hospitalarias.

Modelos de Machine Learning para la predicción de tiempos de estadía de pacientes

Para comenzar con el estudio de predicción de tiempos de estadía, utilizamos una base de datos anonimizada de pacientes de una institución de salud, que nos permitió experimentar con estas metodologías. La base de datos cuenta con diversas variables de los pacientes y sus tiempos de estadía en las camas.

Sobre la base de datos

De la base de datos se pueden extraer 33 variables explicativas, de las cuales 23 son categóricas y 10 numéricas. El detalle de las variables, con sus descripciones completas, se encuentra en la página Predicting Hospital Length of Stay. A continuación, se expone una pequeña sección de ellas.

Paciente
Caracterización (X)(algunas variables)Valor objetivo (y)
Cantidad re-admisiones últimos 180 díasTiempo estadía [días]
Valor promedio de hematocritos [g/dL]
Valor promedio de sodio [mmol/L]
Presenta deficiencia de hierro [Si/No]
Tabla 1: Representación del problema de predicción en la data Microsoft

Ajuste de modelos y selección de variables

Una vez procesadas las variables, utilizamos distintos modelos de machine learning de regresión para entender el comportamiento de las variables y revisar cómo se ajustan con el objetivo de predecir los tiempos de estancia. El nivel de ajuste que logramos incluyendo todas las variables corresponde a un R^2 de 0.97 en datos de prueba, lo que implica una alta precisión en la predicción de los tiempos de estadía. Sin embargo, tras cuantificar la significancia de las variables, decidimos eliminar las menos relevantes hasta alcanzar un nivel de R^2 de 0.95, con el objetivo de simplificar el modelo. El modelo final cuenta con 14 variables explicativas.

Algunas de las variables que ingresaron el modelo, junto a su importancia relativa, se encuentran expuestas a continuación.


Figura 1: Importancia relativa de variables que ingresaron en el modelo

De la imagen anterior, se aprecia que la cantidad de readmisiones en los últimos 180 días (rcount), la presencia de trastornos psicológicos mayores (psychologicaldisordermajor) y los niveles de hematocritos (hematocrit) son las variables que mejor permiten explicar la cantidad de días de estancia en el centro médico.

Aplicación para predecir tiempos de estadía de pacientes

Una vez entrenado el modelo con la totalidad de los datos, publicamos el modelo y lo pusimos a funcionar detrás de una aplicación que permite obtener una predicción de los días de estadía en el centro médico. En la interfaz es posible modificar los valores de las variables del modelo para obtener el resultado de la predicción. La aplicación se encuentra disponible en el siguiente link: https://tiempo-estancia-notus.streamlit.app/.

Figura 2: Interfaz de la aplicación de predicción de tiempos de estancia

Conclusiones

La predicción del tiempo de estadía de un paciente en un centro médico es una tarea que puede alcanzar niveles altos de precisión, como se evidenció en el ejercicio realizado. El modelo obtuvo un R^2 de 0.95 con 14 variables, que incluyen indicadores de salud del paciente. Estos resultados son excelentes para utilizarlos en una mejor gestión de pacientes, ya que el centro médico puede planificar mejor el uso de sus recursos. 

Con este modelo podemos generar múltiples beneficios a los centros hospitalarios: 

  • La atención de pacientes se puede adaptar de manera anticipada a sus necesidades, lo que mejora los niveles de satisfacción del servicio médico.
  • Se puede mejorar la planificación de turnos del personal y el uso de los recursos hospitalarios, reduciendo costos asociados a la utilización excesiva o insuficiente de estos y mejorando la eficiencia.
  • Promueve la toma de decisiones basada en datos: el modelo puede proporcionar información valiosa sobre tendencias y patrones en la atención del paciente, ayudando a los administradores hospitalarios y a los médicos a tomar decisiones.
  • Promueve mejoras en la planificación de cirugías y uso de pabellones: con mejores predicciones sobre la ocupación de camas y el flujo de pacientes, se puede planificar qué cirugías se hacen cada día.


Todos estos beneficios apuntan a mejorar el sistema de salud del país. ¡Conversemos! 

Referencias bibliográficas

Alarcón, M. Aguilar, R. (2022). Hospitalizaciones Evitables y su relación con la disponibilidad de Infraestructura de Atención Primaria de Salud. En IPSUSS. Recuperado de: https://www.ipsuss.cl/ipsuss/site/docs/20230109/20230109120347/hospitalizaciones_evitables___ipsuss_2022.pdf

Escárate, R. (2023). Hospitalizaciones evitables: 27% disminuye el consumo de días de camas en hospitales por cada SAPU/SAR adicional. En IPSUSS. Recuperado de: https://ipsuss.cl/actualidad/hospitalizaciones-evitables-27-disminuye-el-consumo-de-dias-camas-en

Microsoft Machine Learning Services. (2023) Predicting Hospital Length of Stay. Recuperado de: https://microsoft.github.io/r-server-hospital-length-of-stay/input_data.html