Evaluación de la precisión, claridad, relevancia y legibilidad de ChatGPT 4.0 en respuestas a preguntas frecuentes de pacientes sobre infertilidad
Revista Reproducción
PDF
html

Palabras clave

Infertilidad
Inteligencia Artificial
Comunicación médico-paciente
Consejería
ChatGPT

Cómo citar

Schapira, M., Montiveros, M., Di Biase, F., Formica Muntaner, C., Papier, S., & Glujovsky, D. (2025). Evaluación de la precisión, claridad, relevancia y legibilidad de ChatGPT 4.0 en respuestas a preguntas frecuentes de pacientes sobre infertilidad. Revista Reproducción, 39(2), 12–17. https://doi.org/10.54778/rr.v39i2.78

Resumen

Pregunta de estudio: ¿Las respuestas generadas por ChatGPT 4.0 a preguntas frecuentes de pacientes con infertilidad presentan adecuada precisión, claridad, relevancia y legibilidad? Respuesta resumida: ChatGPT 4.0 brindó respuestas de buena calidad global, con fortalezas en apoyo emocional, pronóstico y estilo de vida, y legibilidad adecuada. Lo que ya se sabe: Los pacientes con infertilidad recurren cada vez más a la inteligencia artificial para obtener información, pero existe escasa evidencia en español y en medicina reproductiva sobre la calidad de estas respuestas. Diseño del estudio: Estudio transversal observacional. Se analizaron 50 preguntas frecuentes; el estudio se desarrolló durante 2024. Materiales y Métodos: Se seleccionaron 50 preguntas recopiladas de foros y blogs de pacientes con infertilidad. Las respuestas fueron generadas por ChatGPT 4.0 mediante un prompt estandarizado solicitando responder como especialista en infertilidad. Diez especialistas (5 senior y 5 junior) evaluaron precisión, claridad y relevancia mediante escalas Likert (1–5). La calidad global se midió con la Global Quality Scale (GQS). La legibilidad se evaluó mediante el índice Flesch-Kincaid en español. El estudio fue exento de evaluación ética al no involucrar participantes humanos ni datos sensibles. Resultados: El 94% de las respuestas obtuvo un puntaje ≥3 en la GQS (media 3,6 ± 0,6). El 62% fue calificada como “muy buena” o “excelente”. Los puntajes más altos correspondieron a apoyo emocional (4,4–4,5), pronóstico (4,2) y estilo de vida (4,2–4,3). El menor desempeño fue diagnóstico de infertilidad (3,7). Todos los especialistas consideraron que ChatGPT podría utilizarse como herramienta complementaria bajo supervisión médica. La legibilidad media fue 19,6 ± 4,2. Limitaciones del estudio: Incluye un número limitado de preguntas, evalúa una sola versión del modelo de IA y no compara con otras herramientas o materiales educativos. Implicancias de los hallazgos: ChatGPT 4.0 podría utilizarse para mejorar la comprensión inicial del paciente, brindar apoyo entre consultas y reducir mitos o desinformación, siempre dentro de un marco supervisado por profesionales.

https://doi.org/10.54778/rr.v39i2.78
PDF
html

Citas

World Health Organization. Infertility prevalence estimates, 1990–2021. Geneva: WHO; 2023.

Inhorn MC, Patrizio P. Infertility around the globe: new thinking on gender, reproductive technologies and global movements in the 21st century. Hum Reprod Update. 2015;21(4):411–26.

Pedro J, et al. Patients’ attitudes towards the use of artificial intelligence in reproductive medicine. Hum Reprod. 2022;37(11):2602–12.

Cascella M, et al. Evaluating the accuracy of ChatGPT in medical information: systematic review. J Med Internet Res. 2023;25:e48602.

Creative Commons License

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.

Derechos de autor 2025 Melina Schapira, Micaela Montiveros, Fiamma Di Biase, Carolina Formica Muntaner, Sergio Papier, Demian Glujovsky

Descargas

Los datos de descargas todavía no están disponibles.