La escritura científica siempre ha sido un campo especializado, que requiere un uso preciso y técnico del lenguaje para transmitir ideas complejas y hallazgos de investigación. Con la llegada de los grandes modelos de lenguaje (LLMs), como GPT-3, el panorama de la escritura científica ha comenzado a cambiar. Sin embargo, ha sido un desafío para las empresas de inteligencia artificial determinar si un texto fue generado utilizando un LLM.
Un grupo de investigadores de la Universidad de Tübingen en Alemania y la Universidad Northwestern introdujeron recientemente un enfoque novedoso para medir el impacto de los LLMs en la escritura científica. Analizaron 14 millones de resúmenes de artículos publicados en PubMed entre 2010 y 2024 para rastrear los cambios en la frecuencia de palabras con el tiempo. Al comparar la frecuencia esperada de palabras basada en las tendencias previas a 2023 con su frecuencia real en resúmenes de 2023 y 2024, los investigadores pudieron identificar cambios significativos en el uso de vocabulario después de la adopción generalizada de LLMs.
Los investigadores encontraron que ciertas «palabras excesivas» comenzaron a aparecer mucho más frecuentemente en los resúmenes de 2023 y 2024, indicando el uso de LLMs en la escritura. Palabras como «profundiza», «mostrando» y «subraya» experimentaron aumentos significativos en su uso después de que los LLMs se volvieran predominantes. Además, palabras comunes como «potencial», «hallazgos» y «crucial» también experimentaron picos notables en su uso en la era post-LLM.
Este cambio en el uso de palabras fue sin precedentes tanto en calidad como en cantidad, lo que señala la influencia de los LLMs en la escritura científica. Al resaltar cientos de «palabras marcadoras» que se volvieron más comunes en la era post-LLM, los investigadores pudieron identificar patrones distintos de uso de LLMs en la escritura científica. Estas palabras marcadoras, como verbos, adjetivos y adverbios, sirvieron como indicadores de la asistencia de los LLMs en la escritura. A través del análisis estadístico de artículos individuales, los investigadores estimaron que al menos el 10 por ciento de los artículos posteriores a 2022 en el corpus de PubMed fueron escritos con algún nivel de asistencia de LLMs. Esto sugiere un impacto significativo en el panorama de la escritura científica.
Los hallazgos de este estudio arrojan luz sobre la naturaleza evolutiva de la escritura científica en la era de los LLMs. A medida que la tecnología continúa avanzando, los investigadores y escritores necesitarán adaptarse a nuevas herramientas y técnicas para una comunicación efectiva. Comprender la influencia de los LLMs en el vocabulario y el estilo de la escritura científica puede ayudar a mejorar la claridad e impacto de las publicaciones de investigación en el futuro. La integración de grandes modelos de lenguaje en la escritura científica ha provocado cambios notables en el vocabulario y el estilo. Al utilizar métodos innovadores para analizar la frecuencia de palabras y los patrones de uso, los investigadores pueden obtener información sobre el impacto de los LLMs en el proceso de escritura. A medida que el campo de la inteligencia artificial continúa evolucionando, es esencial que los escritores e investigadores se mantengan informados sobre los últimos avances y adapten sus prácticas en consecuencia. Al abrazar nuevas tecnologías y metodologías, el futuro de la escritura científica puede ser mejorado y enriquecido para comunicar de manera más efectiva ideas y hallazgos complejos.
Deja una respuesta