En noticias recientes, una startup llamada Cognition AI ha sorprendido al revelar un innovador programa de inteligencia artificial llamado Devin. Este desarrollador de software de AI es capaz de realizar tareas que tradicionalmente estaban reservadas para ingenieros de software altamente calificados. Mientras que los chatbots como ChatGPT y Gemini pueden generar código, Devin va un paso más allá al planificar, escribir, probar e implementar código para resolver problemas complejos. El equipo detrás de Devin ha demostrado sus capacidades al generar un plan paso a paso para un proyecto utilizando el modelo de lenguaje de código abierto de Meta, Llama 2, accediendo a varias APIs, realizando pruebas de referencia y creando un sitio web de resumen.
La capacidad de Devin para manejar una amplia gama de tareas ha dejado a inversionistas e ingenieros asombrados. Este desarrollador de software de AI ha demostrado un nivel de competencia que ha generado conversaciones sobre el futuro de la AI en la industria tecnológica. La aparición de agentes de AI, como Devin, señala un cambio hacia la AI que no solo proporciona respuestas, sino que también toma medidas concretas para resolver los problemas presentados por los humanos. Esta tendencia ha ido en aumento, con otros agentes de AI como Auto-GPT y vimGPT mostrando sus capacidades para realizar tareas útiles.
Si bien el rendimiento de estos agentes de AI es impresionante, es esencial reconocer sus limitaciones y riesgos potenciales. El margen de error en los desarrolladores de software de AI es significativamente reducido en comparación con los modelos de lenguaje tradicionales. Incluso un error menor al generar código o tomar acciones podría conducir a un fracaso total y, en algunos casos, consecuencias costosas o peligrosas. Reducir el alcance de las tareas a proyectos específicos de ingeniería de software puede ayudar a mitigar errores, pero los desafíos aún persisten. No solo las startups están invirtiendo en agentes de AI; jugadores principales como Google DeepMind también están desarrollando programas de AI con capacidades diversas.
Por ejemplo, el agente SIMA de Google DeepMind puede jugar videojuegos complejos y realizar más de 600 tareas con éxito. Este agente de AI «generalista» tiene el potencial de extender sus capacidades más allá de los videojuegos, asistiendo a los usuarios en la navegación web o en la operación de software. El uso de videojuegos como campo de pruebas para agentes de AI permite a los desarrolladores refinar sus capacidades en entornos complejos. El CEO de Google DeepMind, Demis Hassabis, ha expresado planes de combinar grandes modelos de lenguaje con programas de entrenamiento de AI para crear agentes más capaces y confiables. Esta inversión en el desarrollo de AI indica un creciente interés en aprovechar los agentes de AI en diversas industrias. A medida que la tecnología continúa avanzando, podemos esperar ver más avances e innovaciones en el campo del desarrollo de software de AI.
Deja una respuesta