De un modo u otro, las herramientas de IA como ChatGPT están decididas a revolucionar nuestras vidas. Pero, ¿hasta qué punto estamos cerca de contar con un asistente con IA en el laboratorio de química?
Los transformadores generativos preentrenados (GPT) son un tipo de modelos de generación de lenguaje natural que pueden aprender y afinar resultados basados en indicaciones, clasificación de respuestas y optimización de políticas proximales. ChatGPT es la aplicación de consumo de más rápido crecimiento de la historia.
Pero más allá de ayudar con las tareas escolares o laborales, y de escribir divertidas poesías, existen algunos usos atractivos para esta potente tecnología. Consideremos la posibilidad de crear asistentes de química con IA. Si podemos entrenar a la IA de esta forma, podría revolucionar el panorama de la química, permitiéndonos aplicar conocimientos de distintas disciplinas y generar eficiencia en tareas como la búsqueda de bibliografía, el examen de compuestos y el análisis de datos.
Los modelos de procesamiento del lenguaje natural (PLN) ya se han utilizado antes de esta forma. Sin embargo, no siempre son eficientes en términos de tiempo y requieren conocimientos de codificación y ciencia de datos. Los programas de PLN tampoco son capaces de generalizar, por lo que deben reescribirse cuando cambia el objetivo. Con estas brechas, herramientas como el ChatGPT podrían transformar radicalmente el proceso de investigación química tal y como lo conocemos.
Los primeros modelos de ChatGPT parecen tener una tendencia a inventar información, un problema inevitable que hace que confiar en ellos en campos científicos sea, cuando menos, un reto. Pero un nuevo estudio publicado en el Journal of the American Chemical Society sugiere que la ingeniería rápida podría ayudar a evitarlo.
Investigadores de la Universidad de California en Berkeley se propusieron entrenar al ChatGPT para minar textos de condiciones de síntesis de marcos metal-orgánicos (MOF) a partir de literatura científica en una amplia gama de formatos y estilos. Para ello utilizan un flujo de trabajo con tres procesos distintos de minería de texto, programados por el propio ChatGPT. Los autores señalan que todos ellos permiten analizar, buscar, filtrar, clasificar, resumir y unificar datos con distintas compensaciones entre trabajo, velocidad y precisión.
Para probar el sistema, el equipo extrajo más de 26.000 parámetros de síntesis distintos relacionados con unos 800 MOF. El uso de la estrategia ChemPrompt Engineering para instruir a ChatGPT en la minería de textos dio como resultado un rendimiento notable en precisión y rendimiento de recuperación.
Con el conjunto de datos resultante, fue posible construir un modelo de aprendizaje automático que proporcionó más de un 87% de precisión en la predicción de los resultados experimentales de cristalización de MOF. Los autores también pudieron crear un chatbot de MOF capaz de responder con fiabilidad a preguntas sobre reacciones químicas y procedimientos de síntesis.
Un trabajo similar publicado en Chemistry of Materials describe el desarrollo de DigiMOF, una base de datos a disposición del público para investigadores que les permite buscar rápidamente MOF con propiedades específicas, analizar vías de producción alternativas y crear analizadores sintácticos adicionales para buscar otras propiedades deseables. Se basa en una versión adaptada de ChemDataExtractor (CDE), una herramienta de procesamiento del lenguaje natural con conocimientos de química.
En lo que parecen estar de acuerdo los equipos que trabajan con IA y MOF es en que, con su capacidad para predecir de forma rápida y racional las condiciones de síntesis, estas herramientas pueden ayudar a acelerar la síntesis de nuevos MOF, evitando los enfoques tradicionales de ensayo y error.
Estos resultados sugieren que un Asistente de Química ChatGPT será muy útil también en otras subdisciplinas de la química. La tecnología se basa en aplicaciones de IA ya existentes, que han permitido avances significativos en el descubrimiento de materiales, como el desarrollo de tecnologías para la investigación medioambiental y la sostenibilidad. Otras investigaciones han combinado búsquedas en árboles de Monte Carlo y redes neuronales recurrentes para descubrir MOF específicos para la captura de carbono en condiciones húmedas, lo que demuestra cómo la IA puede ayudar a superar los límites y descubrir nuevos conocimientos.
Sin embargo, como se señala en un editorial reciente de Chemistry of Materials, debemos tener en cuenta que, aunque la IA ha demostrado un buen rendimiento en los ámbitos en los que se ha entrenado, su fiabilidad suele disminuir cuando se la lleva más allá de esos ámbitos. Por ello, los químicos deben seguir tomando las decisiones críticas, guiados por su propia experiencia humana en la materia.