Xataka – Llevo dos días enganchado a Sora 2: estoy generando memes absurdos donde yo soy el protagonista y no puedo parar

Llevo dos días enganchado a Sora 2: estoy generando memes absurdos donde yo soy el protagonista y no puedo parar

OpenAI no es una empresa de grises. Cuando presentó la primera versión de Sora, parecía que la IA de vídeo asociada a ChatGPT lo iba a cambiar todo, pero el modelo reducido que acabó llegando a los usuarios 10 meses después fue un completo fiasco.

Ahora han lanzado Sora 2 sin previo aviso y, bueno, no puedo parar. Es totalmente adictivo. Tiene un potencial memético que supera con creces el lanzamiento de nano-banana de Google, y que recuerda más al fenómeno Studio Ghibli de ChatGPT, lo que me hace pensar que, esta vez, OpenAI lo tenía todo fríamente calculado.

Hay que tener empeño para llegar a Sora 2

A falta de API para conseguir acceso al modelo en herramientas de terceros (Freepik dice estar en ello), la única manera de crear vídeos con Sora 2 es a través de Sora, una nueva red social de OpenAI que funciona como TikTok, pero con vídeos generados por la propia inteligencia artificial.

Sora solo está disponible, de momento, en Estados Unidos y Canadá, así que lo primero que tuve que hacer para acceder es instalar una VPN. Después de elegir un nombre de usuario (o importar el que ya tenía en la antigua Sora), subir una foto de perfil y ponerme una bio, por fin podía empezar a generar vídeos con sonido de nueve segundos, en formato panorámico o vertical.

No tan rápido. A la versión web de Sora le faltan varias funciones, entre ellas la más popular de todas: crear un «cameo» con tu cara y con tu voz para convertirte en el protagonista de tus propios vídeos o poder aparecer en los vídeos de otros. Para configurar esa opción hay que descargar la app de Sora, que de momento es exclusiva para iPhone, y solo está disponible en la App Store de Estados Unidos y Canadá. Así que tuve que instalar una VPN en iOS, crear una cuenta de Apple en Estados Unidos, asociar la cuenta nueva a la App Store y descargar Sora.

Una vez dentro, me encontré una interfaz muy familiar. Un feed de contenido recomendado, otro para ver las publicaciones en orden cronológico y otro para ver solo lo que sube la gente que sigues. Además de crear tus propios contenidos, contestar a comentarios, etc. Como novedad, tiene una opción para decirle a la IA en qué «mood» te encuentras: qué tipo de contenido te apetece ver.

OpenAI ha dado en el clavo con los «cameos»

Cualquiera que haya generado imágenes y vídeos con IA en los últimos años sabe que los modelos tienden a cambiarte la cara. Tampoco se les da muy bien mantener una misma cara en distintas escenas. Hasta hace poco, la solución eran los LoRAs: entrenar un modelo con tus fotos (técnicamente, afinar un modelo ya entrenado) para poder generar vídeos con tu cara.

Pero los LoRAs son una solución compleja y costosa, que ha dado lugar a nuevas técnicas para mejorar la consistencia de los modelos de imagen. Flux Kontext de la empresa alemana Black Forest Labs o Gemini 2.5 flash image nano-banana de Google son ejemplos paradigmáticos que han empujado a todo el sector a mejorar su consistencia. Y ahora llegan los cameos de Sora.

Cuando abres la aplicación de Sora por primera vez, puedes configurar directamente tu cameo con la cámara del teléfono, leyendo unos números que aparecen en la pantalla y girando la cabeza en las direcciones que indica la app. La grabación se usa para generar vídeos con tu cara y tu voz en el contexto que se te ocurra. Hay una guía enorme de OpenAI para mejorar tus cameos, pero el punto más importante es estar en una habitación bien iluminada.

Con la grabación basta para que los resultados sean convincentes, pero puedes añadir instrucciones personalizadas en un cuadro de texto: soy risueño, soy serio, soy gordo, soy flaco, etc. Lo más importante es seleccionar quién va a poder usar tu cameo para hacer vídeos: solo tú, solo la gente a la que le hayas aprobado el acceso, todos tus amigos o todos los usuarios.

Sam Altman, el CEO de OpenAI, tiene un cameo público que carga con el peso del éxito inicial de Sora. Casi todos los vídeos que se han viralizado tienen a Altman como protagonista. El primer gran meme de Sora son vídeos incómodos de Sam desesperado por que le den más servidores: Sam Altman robando tarjetas gráficas en un Target, Sam Altman pidiendo donativos, Sam Altman gritando en la sede de NVIDIA que necesita más GPUs.

El vídeo de presentación de Sora 2 incluía a los ingenieros de OpenAI volando sobre dragones o cabalgando patos gigantes. Una misma generación de Sora puede tener varios cameos, así que una de las funciones estrella podría acabar siendo mezclarte con famosos. El problema es encontrar famosos dispuestos a ceder su imagen de esa forma. En uno de mis vídeos, iJustine me cuenta lo fino que es el iPhone Air y Sam Altman le contesta que «es un tamaño respetable, funcional diría yo». Los vídeos tardan unos minutos en generarse. Puedes hacer varios a la vez (hasta 100 al día) y luego publicarlos o dejarlos en borradores.

Más parecida a Vine que a TikTok o Instagram

Sora es ante todo un dardo envenenado contra Meta. La reina de las redes sociales no solo ha estado pescando ingenieros de OpenAI con sus sueldos astronómicos, sino que hace apenas una semana acababa de lanzar su propia red social de contenido autogenerado: «Vibes». Con un enfoque más creativo o artístico que Sora, Vibes ha sido descrita por los comentarios menos halagüeños como un vertedero de «AI slop», contenido basura generado con IA.

Sora no deja de ser, en buena parte, contenido basura generado con IA. Pero la sensación que tengo mientras hago scroll es la de haber vuelto a los tiempos de Vine, el precursor de TikTok que fue comprado por Twitter para luego cerrar. Un amalgama de sketches mordaces y momentos anónimos con la inocencia propia de un tiempo en el que el vídeo corto no monetizaba ni competía por tu atención contra millones y millones y millones de otros vídeos verticales.

Por ahora, la gente está en Sora para pásarselo bien. Y para poner a Sam Altman en aprietos. Algunos parecen haber apostado en corto a que Altman acabará demandado y obligado a despublicar su cameo. Una serie de vídeos muestra al CEO de OpenAI rodeado de personajes protegidos por derechos de autor: Pokémon, Bob Esponja… Y en todos los vídeos, «remixes» del original, Altman acaba diciendo algo así como: «espero que Nintendo no nos demande».

La app tiene un par de mecanismos para facilitar la «imitación» del contenido de otros. Además de la opción de crear remixes de un vídeo, la descripción de un vídeo es por defecto el prompt que usó el usuario. Sorprende la facilidad que tiene Sora de entender la intencionalidad de un prompt, que pueden ser unas pocas indicaciones.

Tengo la sensación de que el modelo está afinado para que tanto el vídeo como la voz tengan un componente humorístico. A diferencia de Veo 3 de Google, que suele terminar los vídeos con situaciones surrealistas marca de la casa, Sora tiene cortes abruptos o todo lo contrario, lo que funcione mejor. En este vídeo en el que discuto con una cajera del Mercadona, yo no le pedí a Sora que el silencio final fuera tan incómodo y gracioso. Y en este en el que le pido a alguien usar su baño, tampoco especifiqué que hubiera una mirada de reojo al final. Simplemente lo hizo así.

Esta IA se ha visto hasta los programas de Canal Sur

La aparente laxitud de Sora con el tema del copyright también está llamando la atención de los usuarios. La app no te deja generar un vídeo de Los Simpson o Dragon Ball, pero muchos encuentran palabras que no están censuradas para acabar poniendo a personajes como Super Mario, Peter Griffin, Pikachu o Rick y Morty en situaciones surrealistas.

La cosa ha llegado a ponerse incómoda para OpenAI. Un usuario de Reddit consiguió mezclar en un mismo vídeo personajes de un montón de animes distintos, como Dragon Ball y One-Punch Man, con resultados impresionantes que seguramente hayan llamado la atención de las productoras de esas obras audiovisuales protegidas. OpenAI se libró de tener problemas con el fenómeno Studio Ghibli porque un estilo no está protegido, pero los personajes sí lo están.

Esta IA ha visto todo el contenido que puedas imaginar. Desde los archivos del NO-DO (el generalísimo firma un acuerdo con Sam Altman para cederle el agua de los pantanos) hasta la televisión actual (Sam Altman va a First Dates a buscar la AGI), pasando por la programación de Canal Sur con Jesús Quintero y el Risitas partiéndose de risa. Hasta he conseguido que me ponga los brazacos y tatuajes de Jordi Wild. Eso sí, las caras de las personas nunca son las de los personajes reales; solo con personajes animados se puede engañar al modelo.

Si el prompt está censurado o no es suficiente, otro mecanismo para añadir complejidad a los vídeos es la opción de cargar una imagen de partida. En este vídeo, un presentador de informativos que no existe hace una nota informativa a partir de una gráfica real de intención de voto de los diferentes partidos políticos. Nada que no pudieran hacer otros modelos, pero con una accesibilidad mucho mayor a través de Sora. Y lo más importante: por ahora, gratis.

Sora 2 no es tan importante como Sora

El modelo, Sora 2, es muchísimo mejor que lo que ofrecía OpenAI hasta ahora. Es multimodal: puede generar vídeo y voz a partir de un texto, de una imagen o de tu cameo. Y entiende muy bien las físicas del mundo. Según OpenAI, mejor que ningún otro modelo. Uno de los vídeos más vistos de Sora 2 muestra a un chico haciendo un backflip sobre una tabla de paddle surf. Es muy difícil notar que está hecho con IA. Quizá si te fijas mucho en las ondas del agua.

Sora 1 nos había prometido una simulación del mundo, pero a la hora de la verdad hacía que las gimnastas hicieran torsiones físicamente imposibles o que los balones desaparecieran o se multiplicaran al botar. Sora 2 está mucho más cerca de la promesa original y, lo que es más sorprendente, está al alcance de cualquiera (al menos, con una VPN y un iPhone).

La facilidad para mezclar no solo tu imagen, sino objetos de tus fotos en las generaciones de Sora es adictiva. Permite crear contenido entretenido o evocador a partir de una idea en segundos. Y por primera vez alguien ha empaquetado todo esto en una red social que no da cringe. Sí, muchos vídeos son basura o tienen artefactos propios de una generación rápida para reducir la factura de los servidores. Pero llorado de risa con otros muchos.

La cuestión es que, para OpenAI, el producto más importante no es Sora 2, que es una proeza tecnológica pero está pendiente de escalar de una forma rentable al resto del mundo. Sino Sora, la red social. Porque si Sora logra convencer a millones de usuarios y les muestra publicidad, será una fuente de ingresos crucial para la compañía que hace ChatGPT, una que además será un petardazo directo a la línea de flotación de Meta.

Así que, sí. OpenAI quiere que estos vídeos de Sam Altman en situaciones incómodas sean contenido que consumamos durante muchas horas. Y que las personas que hasta ahora no habían creado contenido, solo lo habían consumido por falta de recursos para grabar o x motivo, se conviertan en creadores activos gracias a las bondades de Sora 2, el modelo.

¿Me imagino en un scroll infinito viendo contenido generado por IA cuando pasen unos días después del boom inicial? Si me sigo divirtiendo, entonces sí. Es gracioso, es creativo y tiene un potencial viral que me recuerda a los mejores días de Vine. También estoy explotando al máximo la parte de crear memes privados con mis amigos usando nuestros propios cameos.

¿Me preocupa que me esté divirtiendo con un contenido que, si bien es original, no habría sido posible sin los programas de televisión, los vídeos de YouTube, los tiktoks y los reels que OpenAI seguramente haya usado para entrenar Sora 2?

Es posible que este mismo artículo se use para entrenar futuros modelos de OpenAI sin que intermedie ningún acuerdo, así que sí, hay un debate de fondo mucho más profundo y urgente que los memes de Sam Altman. Pero no cabe duda de que ese señor pequeño de ojos azules que ha colapsado mi feed sabe empaquetar y lanzar productos. Especialmente si logra fastidiar a homólogos como Mark Zuckerberg por el camino.

Imágenes | Sora

En Xataka | YouTube se está convirtiendo en algo mucho más importante para Google que su plataforma de vídeos: en su buscador


La noticia

Llevo dos días enganchado a Sora 2: estoy generando memes absurdos donde yo soy el protagonista y no puedo parar

fue publicada originalmente en

Xataka

por
Matías S. Zavia

.