{"id":3319,"date":"2025-06-11T19:06:06","date_gmt":"2025-06-11T19:06:06","guid":{"rendered":"https:\/\/redpandalab.org\/?p=3319"},"modified":"2025-06-11T19:12:04","modified_gmt":"2025-06-11T19:12:04","slug":"machine-learning-para-predecir-la-incidencia-del-cancer-en-chile-asi-fue-nuestra-conversacion-en-cafedata","status":"publish","type":"post","link":"https:\/\/redpandalab.org\/en\/machine-learning-para-predecir-la-incidencia-del-cancer-en-chile-asi-fue-nuestra-conversacion-en-cafedata\/","title":{"rendered":"Machine learning para predecir la incidencia del c\u00e1ncer en Chile. As\u00ed fue nuestra conversaci\u00f3n en Caf\u00e9+Data"},"content":{"rendered":"<body>\n<p class=\"wp-block-paragraph\">En este nuevo episodio del podcast <strong>Caf\u00e9+Data<\/strong>, conversamos con <strong>Kelly N\u00fa\u00f1ez, Ronald Velasque y Luis Guillermo Moreno<\/strong>, autores de la investigaci\u00f3n:<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><br>\ud83d\udcca <em>\u201cProyecciones de Incidencia de C\u00e1ncer en Chile mediante Modelos de Machine Learning para el per\u00edodo 2020-2024.\u201d<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong><a href=\"https:\/\/www.youtube.com\/watch?v=x-ykF0wdKko&amp;t=946s\" data-type=\"link\" data-id=\"https:\/\/www.youtube.com\/watch?v=x-ykF0wdKko&amp;t=946s\">Ac\u00e1 pod\u00e9s ver el episodio completo del podcast.<\/a><\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>\u00bfDe qu\u00e9 trata el estudio?<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Este proyecto fue desarrollado como proyecto final del Mag\u00edster en Ciencia de Datos de la Pontificia Universidad Cat\u00f3lica de Chile, y logr\u00f3 la m\u00e1xima calificaci\u00f3n. Su objetivo fue ambicioso: predecir cu\u00e1ntos nuevos casos de c\u00e1ncer podr\u00edan diagnosticarse en Chile entre 2020 y 2024, usando modelos de machine learning como LightGBM, Random Forest, XGBoost y otros.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Los datos utilizados provienen de seis Registros Poblacionales de C\u00e1ncer (RPC), junto con informaci\u00f3n del Ministerio de Salud, el Instituto Nacional de Estad\u00edsticas y la Agencia Internacional de Investigaci\u00f3n en C\u00e1ncer (IARC). A partir de estos datos, los investigadores construyeron una base que cubre m\u00e1s del 20% de la poblaci\u00f3n chilena, suficiente para generar proyecciones representativas a nivel nacional.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>\u00bfQu\u00e9 compartieron los invitados en el podcast?<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Durante la conversaci\u00f3n con Camilo Mart\u00ednez Zambrana, anfitri\u00f3n del podcast y director de proyectos en Red PandaLab, los autores compartieron:<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u2705 El proceso t\u00e9cnico detr\u00e1s del modelo: limpieza de datos, imputaci\u00f3n, selecci\u00f3n de algoritmos y validaci\u00f3n.<br>\u2705 Los retos metodol\u00f3gicos, como la falta de datos nacionales consolidados y la necesidad de imputar valores faltantes.<br>\u2705 C\u00f3mo la combinaci\u00f3n de regresi\u00f3n de Poisson y regresi\u00f3n lineal super\u00f3 en precisi\u00f3n a modelos m\u00e1s complejos de machine learning.<br>\u2705 El impacto de contar con estimaciones actualizadas en la planificaci\u00f3n de recursos de salud, desde camas oncol\u00f3gicas hasta estrategias de prevenci\u00f3n.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Adem\u00e1s, los invitados hablaron de su trayectoria y c\u00f3mo sus habilidades en ciencia de datos se aplican hoy en diferentes sectores.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>\u00bfPor qu\u00e9 es relevante esta investigaci\u00f3n?<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Chile no cuenta a\u00fan con un registro nacional de c\u00e1ncer, lo que dificulta tomar decisiones informadas. Esta investigaci\u00f3n llena un vac\u00edo cr\u00edtico al proporcionar proyecciones basadas en evidencia, utilizando datos reales y t\u00e9cnicas avanzadas.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Los resultados no solo ofrecen una mirada a futuro sobre la incidencia del c\u00e1ncer, sino que tambi\u00e9n sirven como modelo para otras investigaciones que buscan aplicar ciencia de datos en salud p\u00fablica.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Algunas proyecciones clave para 2024:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Se estima que Chile tendr\u00e1 m\u00e1s de <strong>41.000 nuevos casos de c\u00e1ncer.<\/strong><\/li>\n\n\n\n<li>Las regiones con mayor incidencia proyectada incluyen <strong>Los R\u00edos, Metropolitana y Maule.<\/strong><\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Escucha el episodio<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\ud83c\udf99\ufe0f <a href=\"https:\/\/www.youtube.com\/watch?v=x-ykF0wdKko&amp;t=946s\" data-type=\"link\" data-id=\"https:\/\/www.youtube.com\/watch?v=x-ykF0wdKko&amp;t=946s\"><strong>Dale play al episodio completo aqu\u00ed<\/strong> <\/a>para conocer de primera mano c\u00f3mo esta investigaci\u00f3n puede cambiar la manera en que planificamos y respondemos al c\u00e1ncer en Chile.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Sobre Caf\u00e9+Data<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caf\u00e9+Data<\/strong> es una iniciativa de <a class=\"\" href=\"https:\/\/redpandalab.org\/en\/\">Red PandaLab<\/a>, donde compartimos experiencias, proyectos y aprendizajes del mundo de los datos. Adem\u00e1s de nuestros podcasts, organizamos webinars, talleres y espacios de formaci\u00f3n.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\ud83d\udca1 <em>Si te interesa aplicar los datos a problemas reales como este, suscr\u00edbete a nuestra comunidad o revisa nuestros pr\u00f3ximos eventos.<\/em><\/p>\n<\/body>","protected":false},"excerpt":{"rendered":"<p>En este nuevo episodio del podcast Caf\u00e9+Data, conversamos con Kelly N\u00fa\u00f1ez, Ronald Velasque y Luis Guillermo Moreno, autores de la investigaci\u00f3n: \ud83d\udcca \u201cProyecciones de Incidencia de C\u00e1ncer en Chile mediante Modelos de Machine Learning para el per\u00edodo 2020-2024.\u201d Ac\u00e1 pod\u00e9s ver el episodio completo del podcast. \u00bfDe qu\u00e9 trata el estudio? Este proyecto fue desarrollado [&hellip;]<\/p>\n","protected":false},"author":11,"featured_media":3321,"comment_status":"open","ping_status":"open","sticky":true,"template":"","format":"standard","meta":{"_eb_attr":"","om_disable_all_campaigns":false,"footnotes":""},"categories":[6,11,7],"tags":[],"class_list":["post-3319","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-analisis-de-datos","category-insights","category-investigacion"],"acf":[],"_links":{"self":[{"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/posts\/3319","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/comments?post=3319"}],"version-history":[{"count":3,"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/posts\/3319\/revisions"}],"predecessor-version":[{"id":3324,"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/posts\/3319\/revisions\/3324"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/media\/3321"}],"wp:attachment":[{"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/media?parent=3319"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/categories?post=3319"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/redpandalab.org\/en\/wp-json\/wp\/v2\/tags?post=3319"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}