Validación de una inteligencia artificial usando chatbot para la clasificación BIRADS en el tamizaje de cáncer de mama en Loreto, 2024

Abstract

Introduction: Breast cancer is one of the leading causes of female mortality worldwide, with more than 2.3 million annual cases according to GLOBOCAN 2022. Differences in survival between developed and developing countries reflect inequalities in access to early diagnosis and timely treatment. In the Loreto region of Peru, the shortage of specialists and the limitations in mammography interpretation represent a challenge for effective screening. The BI-RADS system, essential for mammographic classification, largely depends on the radiologist’s expertise, introducing diagnostic variability. Artificial intelligence (AI) has emerged as a promising alternative to improve diagnostic accuracy and reduce access gaps. Objective: To validate the effectiveness of an artificial intelligence chatbot for BI-RADS classification in breast cancer screening at the Regional Hospital of Loreto, 2024. Method: An observational study with a descriptive, cross-sectional, and correlational design was conducted. Population: The sample consisted of 536 probabilistically selected images that were classifiable according to the BI-RADS system. Results: The GMIC model showed an accuracy of 46.49%, with sensitivity of 57.89% and specificity of 46.23%. The positive predictive value was low (2.39%), with high error rates: 53.77% false positives and 42.11% false negatives. Cohen’s Kappa coefficient was 0.003, indicating virtually no agreement with the radiologist’s evaluation, and the McNemar test revealed statistically significant differences in the observed discordances. Conclusions: The validation of the artificial intelligence chatbot for BI-RADS classification revealed limitations in its performance compared with the radiologist’s assessment. Nevertheless, the findings provide local evidence on the applicability of these tools in resource-limited settings, offering a foundation for future methodological refinements and clinical validations in the regional context.
Introducción: El cáncer de mama constituye una de las principales causas de mortalidad femenina a nivel mundial, con más de 2,3 millones de casos anuales según GLOBOCAN 2022. Las diferencias en la supervivencia entre países desarrollados y en vías de desarrollo reflejan desigualdades en el acceso a diagnóstico precoz y tratamiento oportuno. En la región de Loreto, Perú, la escasez de especialistas y las limitaciones en la interpretación de mamografías representan un desafío para el tamizaje efectivo. El sistema BI-RADS, clave en la clasificación mamográfica, depende de la experiencia del radiólogo, lo que introduce variabilidad diagnóstica. La inteligencia artificial (IA) surge como una alternativa prometedora para mejorar la precisión diagnóstica y reducir brechas de acceso. Objetivo: Validar la eficacia de una inteligencia artificial usando un chatbot (IA) para la clasificación BIRADS en el tamizaje de cáncer de mama en el Hospital Regional de Loreto, 2024. Método: Se diseñó un estudio de tipo Observacional con un diseño descriptivo, transversal y correlacional. Población: La muestra estuvo conformada por 854 imágenes seleccionadas de manera probabilística y clasificables según el sistema BI-RADS. Resultados: El modelo GMIC (GREYC's Magic for Image Computing) presentó una exactitud de 46,49%, con sensibilidad de 57,89% y especificidad de 46,23%. El valor predictivo positivo fue bajo (2,39%), con tasas elevadas de error: 53,77% de falsos positivos y 42,11% de falsos negativos. El coeficiente Kappa de Cohen fue 0,003, evidenciando concordancia prácticamente nula respecto al radiólogo, y la prueba de McNemar mostró diferencias estadísticamente significativas en las discordancias. Conclusiones: La validación del chatbot de inteligencia artificial para la clasificación BI-RADS permitió evidenciar limitaciones en su desempeño frente al criterio del radiólogo. No obstante, los hallazgos constituyen un aporte local al conocimiento sobre la aplicabilidad de estas herramientas en contextos con recursos limitados, ofreciendo una base para futuros ajustes metodológicos y validaciones en la práctica clínica regional.

Description

Keywords

Cáncer de mama, Inteligencia artificial, Sensibilidad

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license

Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess