En los últimos años, la narrativa que rodea la inteligencia artificial ha fluctuado drásticamente, caracterizada a menudo por oleadas de emoción seguidas de escepticismo. Algunos analistas argumentan que la llamada «burbuja de la IA» ha estallado, señalando un duro invierno para el campo. Sin embargo, figuras pioneras como Fei-Fei Li se niegan a aceptar esta perspectiva derrotista. Conocida como la «madre de la IA», Li no solo está reaccionando a los sentimientos del mercado; se está posicionando activamente para redefinir los límites de la inteligencia artificial.
Actualmente en una licencia parcial de su puesto en la Universidad de Stanford, Li ha cofundado World Labs, una startup que busca ir más allá del panorama actual de la IA generativa, que gira en gran medida en torno al lenguaje. La visión de Li se extiende a la creación de mundos virtuales completos y detallados que reflejen las complejidades de nuestra realidad física. Este ambicioso objetivo desafía la narrativa en curso de estancamiento en el desarrollo de la IA, particularmente entre aquellos que creen que el progreso se ha detenido.
En marcado contraste, World Labs ha asegurado alrededor de 230 millones de dólares en financiamiento, con una impresionante valoración que alcanza mil millones de dólares. La pregunta sigue siendo: ¿puede esta nueva empresa traducir una visión elevada en un producto concreto?
Hace una década, el trabajo innovador de Li con ImageNet avanzó significativamente las capacidades de la IA, permitiendo que las redes neuronales aprendieran de manera más efectiva a través de una base de datos dedicada de imágenes digitales. Al reflexionar sobre el panorama actual, Li enfatiza la necesidad de avances similares en los modelos de aprendizaje profundo de hoy en día. Su objetivo es facilitar la generación de mundos reales, ya sea a través de simulaciones realistas o reinos completamente imaginativos.
Aquí es donde entra en juego el concepto de «inteligencia espacial». Li articula la distinción entre cómo las computadoras perciben el mundo físico y cómo razonan sobre él. «El mundo físico para las computadoras se ve a través de cámaras y el cerebro de la computadora detrás de las cámaras,» afirma. El desafío radica en transformar estos datos visuales en razonamiento e interacciones dinámicas, lo que requiere una comprensión sofisticada de las dinámicas y estructuras espaciales.
World Labs se posiciona como pionero en la inteligencia espacial, estableciendo las bases para su posible importancia en el discurso en evolución en torno a la IA. El viaje hacia la realización de la ambiciosa visión de Li cobró impulso cuando se conectó con Martin Casado, un pionero en redes virtuales, durante una cena íntima a principios de 2023. La perspectiva experimentada de Casado se alinea con las ambiciones de Li, reconociendo paralelismos entre la evolución de la IA y la tecnología de los videojuegos.
Así como los videojuegos evolucionaron de interfaces basadas en texto a experiencias 3D inmersivas, también la IA debe adaptarse, siendo la inteligencia espacial el camino para estos avances. Casado imagina un futuro donde las narrativas de libros queridos podrían ser reimaginadas, permitiendo a las personas entrar directamente en estas historias y experimentarlas a través de una lente interactiva.
Para hacer realidad esta visión, Li comenzó a reunir un equipo talentoso, reclutando a su exalumno Justin Johnson como cofundador. Sus discusiones colaborativas subrayan un nicho emergente en la IA: pasar de grandes modelos de lenguaje a «modelos de mundo» expansivos. Alianzas estratégicas con expertos como Christoph Lassner y Ben Mildenhall refuerzan aún más las ambiciones de World Labs. Lassner aporta experiencia de gigantes de la industria como Amazon y Meta, contribuyendo con un enfoque pionero llamado «3D Gaussian Splatting» que sintetiza escenas.
Mientras tanto, la innovación de Mildenhall en campos de radiación neuronal (NeRF) permite la transformación de imágenes en 2D en gráficos 3D detallados, ofreciendo un activo invaluable para la visión de Li.
El viaje de World Labs se estructura en distintas fases, siendo la primera centrada en crear un modelo robusto que comprenda integralmente el espacio 3D, la fisicalidad y las matices del tiempo. Si bien las aplicaciones inmediatas pueden no estar dirigidas directamente a la robótica, el modelo fundamental desarrollado durante esta fase será esencial para futuros esfuerzos. Al dominar la inteligencia espacial, la empresa podrá mejorar posteriormente las experiencias de realidad aumentada y, eventualmente, emprender la integración de este conocimiento en la robótica.
Las implicaciones de desarrollar exitosamente grandes modelos de mundo van mucho más allá del entretenimiento. Campos como vehículos autónomos, manufactura automatizada y robótica humanoide se beneficiarán enormemente de los avances en comprensión espacial. La perspectiva de permitir que las máquinas interpreten e interactúen con su entorno de manera similar a los humanos es una dirección tentadora que redefine el potencial de la tecnología de la IA.
El viaje hacia la creación de un marco significativo de inteligencia espacial dentro de la inteligencia artificial no es meramente un ejercicio académico; tiene profundas implicaciones sobre cómo interactuamos con la tecnología en los próximos años. A medida que World Labs continúa innovando, la distinción entre los reinos digital y físico puede difuminarse, permitiendo experiencias que redefinen la narrativa, la educación y las aplicaciones prácticas en nuestra vida diaria.
Lejos de señalar un declive, las exploraciones en curso en la IA apuntan hacia un futuro lleno de oportunidades para revolucionar cómo conceptualizamos e interactuamos con nuestra realidad compartida.
Deja una respuesta