¿Los videos generados por IA superan a Sora? Últimos desarrollos explorados

Explore las últimas herramientas de generación de videos de IA como Cling, Toncraftey, Domo AI y Stable Audio, así como los anuncios de Nvidia, AMD, Intel, Qualcomm y Cisco sobre el avance de las capacidades de IA. Descubre cortometrajes generados por IA en el Festival de Cine de Tribeca y el asistente de juegos impulsado por IA de Microsoft.

15 de febrero de 2025

party-gif

Descubre los últimos avances en la generación de videos de IA, animación y efectos de sonido que están ampliando los límites de lo posible. Explora los emocionantes desarrollos de las principales empresas tecnológicas y cómo estas herramientas pueden revolucionar la creación de contenido.

El auge del pegamento: impresionante generador de videos de IA

Esta nueva generadora de videos de IA llamada Cling, que proviene de China, ha sido el tema de conversación del mundo de la IA esta semana. Si tienes un número de teléfono chino, puedes registrarte en la aplicación y usarla de inmediato.

Los videos generados por Cling suelen durar alrededor de 5 segundos, pero también hay ejemplos de videos más largos. Un video muestra a un niño montando una bicicleta, con el entorno cambiando de un desierto a paisajes nevados a medida que avanza el video. Si bien los videos son claramente generados por IA, son impresionantemente realistas.

Cling también tiene una función que te permite cargar una imagen y una plantilla de acción, y animará la imagen para que coincida con la acción. Esto ha dado lugar a algunos ejemplos creativos y entretenidos, como un hombre bailando en la playa o personas comiendo diferentes alimentos.

En general, el generador de videos de IA Cling parece estar produciendo resultados mejores que muchos otros generadores de videos que hemos visto últimamente, aunque aún no igualan la calidad de Sora. Será interesante ver cómo se desarrolla esta herramienta y si se vuelve más accesible fuera de China.

Ton Crafter: animación entre fotogramas

Ton Crafter es una herramienta de IA genial que puede animar entre dos fotogramas. Le proporcionas una imagen de inicio y una imagen final, y generará la animación entre ellas.

La herramienta funciona mejor con imágenes de estilo de dibujos animados o anime, en lugar de fotografías reales. Puede tomar un simple giro de cabeza o un personaje dando un paso y animar la transición sin problemas.

Puedes usar Ton Crafter de forma gratuita en Hugging Face en este momento. Simplemente carga tus imágenes de inicio y final, y la herramienta generará la animación. Es un proyecto de código abierto, por lo que también puedes descargar el código y ejecutarlo localmente en tu propia computadora.

Algunos ejemplos de Ton Crafter en acción incluyen:

  • Un hombre caminando por la calle con un paraguas
  • Una esfera o gema brillante pulsando y cambiando
  • La cabeza de un personaje de dibujos animados girando ligeramente y parpadeando

En general, Ton Crafter proporciona una forma sencilla pero efectiva de animar entre dos fotogramas, lo que lo convierte en una herramienta práctica para crear animaciones cortas y en bucle sin tener que dibujar manualmente cada fotograma.

Domo AI: convertir videos en dibujos animados

Domo AI es una herramienta que permite a los usuarios transformar metraje de video regular en animaciones con estilo de dibujos animados. Así es como funciona:

  • Los usuarios pueden cargar un archivo de video a la plataforma de Domo AI.
  • La herramienta luego procesa el video, aplicando filtros y efectos de estilo de dibujos animados para crear una versión animada del metraje original.
  • Esto se puede hacer para una variedad de fuentes de video, incluidos clips de películas, programas de televisión y contenido generado por el usuario.
  • Los videos animados resultantes mantienen el movimiento y las acciones originales, pero con una estética acartonada y dibujada a mano.
  • Domo AI incluso maneja tareas como la sincronización de labios, asegurando que las bocas de los personajes de dibujos animados se muevan al ritmo del audio.

Esta herramienta proporciona una forma sencilla de dar a los videos estándar un aspecto y una sensación únicos y animados. Se puede usar para proyectos creativos, ensayos de video o simplemente para agregar un toque visual a un metraje existente. Domo AI hace que el proceso de transformación en dibujos animados sea accesible para una amplia gama de usuarios.

El pincel mágico de Verse: animación selectiva

Proper prompter compartió recientemente una nueva herramienta llamada Verse, que incluye una función llamada Magic Brush. Esta función te permite seleccionar una parte específica de una imagen y animar solo esa área seleccionada.

Aquí hay algunos ejemplos de lo que puede hacer la función Magic Brush:

  • Animar la varita de Harry Potter, con la mano y la varita moviéndose.
  • Animar el rostro de Elon Musk, haciéndolo asentir.
  • Animar un cohete despegando, con el vapor saliendo.
  • Animar el tren Expreso de Hogwarts, con el vapor y el movimiento del tren.

La función Magic Brush parece dar mejores resultados que herramientas similares como Runway, permitiendo animaciones más naturales y fluidas de las áreas seleccionadas. Los usuarios pueden cargar una imagen, seleccionar la parte que quieren animar, y la IA de Verse traerá esa selección a la vida.

Esta herramienta proporciona otra forma poderosa para que los creadores agreguen animación y movimiento a sus imágenes, sin tener que animar toda la escena. La naturaleza selectiva de Magic Brush la convierte en una herramienta versátil para una variedad de casos de uso, desde efectos visuales hasta proyectos creativos.

Generación de audio: efectos de sonido de próximo nivel

Esta semana se vieron algunos desarrollos emocionantes en el mundo de los efectos de audio generados por IA. Dos anuncios notables se destacaron:

  1. Efectos de sonido generados por IA de 11 Labs: 11 Labs presentó su nueva función que permite a los usuarios solicitar cualquier efecto de sonido, que la IA luego genera. Los ejemplos incluían un "ogro diciendo 'aléjate, humano insignificante'" y un efecto de sonido único que se asemejaba a una criatura estilo Warcraft.

  2. Modelo de audio estable de Stability AI: Stability AI lanzó un modelo de código abierto llamado Stable Audio, que puede generar hasta 47 segundos de muestras de audio y efectos de sonido, incluidos ritmos de batería, riffs de instrumentos, sonidos ambiente y elementos de producción. La calidad de audio demostrada en los ejemplos fue bastante impresionante.

Estos avances en audio generado por IA resaltan el rápido progreso que se está logrando en este campo. Los usuarios ahora pueden solicitar efectos de sonido o muestras de audio específicos, y los modelos de IA pueden producir resultados realistas y de alta calidad. Esto abre nuevas posibilidades para la creación de audio, el diseño de sonido e incluso la post-producción de audio en diversas industrias.

A medida que estas herramientas continúen evolucionando, podemos esperar ver capacidades aún más impresionantes y versátiles de generación de audio impulsada por IA en un futuro cercano.

Nvidia en Computex: anuncios revolucionarios

Jensen Huang, el CEO de Nvidia, hizo varios anuncios significativos durante el evento Computex. Aquí están los aspectos más destacados:

  1. Earth 2: Nvidia presentó Earth 2, un gemelo digital de toda la Tierra diseñado para ayudar a predecir mejor el cambio climático y el clima. Puede hacer pronósticos hiperlocales de hasta decenas de metros, entrenado en grandes cantidades de datos meteorológicos.

  2. Nvidia Aces: Nvidia mostró su suite de tecnologías de humanos digitales, que permiten la dispersión de trazado de ruta en tiempo real para simular la forma en que la luz interactúa con la piel, dándole una apariencia suave y translúcida.

  3. Rendimiento y eficiencia de GPU: Nvidia demostró que el poder de cálculo de sus GPU está superando muy por encima la Ley de Moore, mientras que el consumo de energía ha estado disminuyendo significativamente, lo que permite un procesamiento de IA más eficiente.

  4. Hoja de ruta de GPU: Nvidia esbozó su hoja de ruta de GPU, con los próximos Blackwell, Reuben y futuras generaciones, planeando lanzar una nueva GPU cada año para impulsar avances continuos.

  5. Proyecto G Assist: Nvidia presentó el Proyecto G Assist, un asistente impulsado por IA que puede ayudar a los jugadores respondiendo preguntas y brindando orientación mientras juegan videojuegos.

  6. Posición de mercado de Nvidia: Nvidia superó brevemente a Apple para convertirse en la segunda empresa más grande del mundo, lo que destaca la creciente importancia de su tecnología de GPU en la era de la IA.

Estos anuncios muestran el liderazgo continuo de Nvidia en el campo de la IA, desde sus avances en gemelos digitales y humanos digitales hasta su hoja de ruta para hardware de GPU aún más potente y eficiente. El enfoque de la empresa en impulsar la innovación en IA es evidente en toda su cartera de productos y planes futuros.

AMD e Intel en Computex: enfocados en IA

AMD hizo algunos anuncios importantes en Computex, incluido su próxima generación de procesador portátil, el Ryzen AI 300 series. Este chip cuenta con el NPU XDNA 2 de AMD, que afirman tener 5 veces más capacidad de cómputo y el doble de eficiencia energética en comparación con la generación anterior. El Ryzen AI 300 llegará a algunas de las computadoras co-piloto a partir de julio de 2024.

Intel también presentó su arquitectura de procesador cliente Lunar Lake, continuando con el crecimiento de la categoría de PC impulsada por IA. Mostraron su "Patio de juegos de IA" que incluye un generador de imágenes utilizando modelos de difusión estable, así como una sección de "Respuesta" que proporciona un modelo de lenguaje grande similar a ChatGPT que se ejecuta localmente en la computadora del usuario.

La idea clave es que todos los principales fabricantes de chips, como Nvidia, AMD, Intel y Qualcomm, se enfocan en desarrollar hardware específicamente optimizado para el procesamiento de IA. Esto refleja la creciente importancia de las capacidades de IA en la computación de consumo y empresarial. Los nuevos chips y tecnologías anunciados en Computex tienen como objetivo permitir aplicaciones de IA más eficientes y poderosas en una amplia gama de dispositivos.

Cisco Live: mejorando la resiliencia digital

El enfoque de Cisco en su reciente evento Cisco Live fue mejorar la "resiliencia digital", es decir, la capacidad de las empresas para manejar los problemas que puedan surgir en el mundo digital, como ataques, amenazas de ciberseguridad y problemas de integridad de datos.

Cisco está usando la IA para ayudar a las empresas a monitorear y gestionar mejor su infraestructura digital. Han desarrollado una herramienta llamada ThousandEyes, que usa IA para mantener un ojo en todo el entorno digital de una empresa, alertándoles sobre problemas y ayudándolos a identificar rápidamente la fuente.

Si bien los consumidores es posible que no usen directamente las tecnologías de Cisco, las empresas que brindan los servicios y herramientas que usamos probablemente dependan de la infraestructura de Cisco. Al mejorar la resiliencia digital a través de la IA, Cisco tiene como objetivo mejorar la seguridad y confiabilidad general de los sistemas digitales de los que todos dependemos.

Además de desarrollar sus propias herramientas impulsadas por IA, Cisco anunció un fondo de inversión global en IA de $1 mil millones para apoyar el crecimiento de soluciones innovadoras de IA en este espacio. La empresa reconoce el papel vital que desempeñará la IA para garantizar la seguridad y estabilidad de nuestro mundo digital en el futuro.

WWDC de Apple: expectativas de avances en IA

Se espera que la próxima Conferencia Mundial de Desarrolladores de Apple (WWDC) sea un evento importante para los anuncios de IA. Según informes, la empresa tecnológica planea presentar una gama de nuevas funciones y capacidades de IA en toda su línea de productos.

Una de las principales expectativas es la introducción de una plataforma de "Inteligencia Apple" renovada, que probablemente reemplazará a la actual inteligencia artificial Siri. El nuevo sistema se espera que ofrezca mejoras significativas en el procesamiento del lenguaje natural, la finalización de tareas y la integración con el ecosistema de Apple.

Además, se rumorea que Apple está integrando capacidades de IA más avanzadas en sus productos principales, como el iPhone, iPad y Mac. Esto podría incluir funciones como un mejor reconocimiento de imágenes, comandos de voz mejorados y funcionalidades más inteligentes de asistente personal.

La compañía también se espera que muestre avances en sus tecnologías de realidad aumentada (AR) y realidad mixta (MR), que probablemente aprovecharán la IA para tareas como el reconocimiento de objetos, la comprensión de escenas y la integración fluida con contenido digital.

Además, Apple podría presentar nuevas herramientas y API para desarrolladores que les permitan aprovechar las capacidades de IA de la empresa en sus propias aplicaciones. Esto podría dar lugar a una oleada de experiencias impulsadas por IA en todo el ecosistema de Apple.

En general, las expectativas para el evento WWDC de Apple son altas, con el potencial de innovaciones significativas impulsadas por IA que podrían dar forma al futuro de los productos y servicios de la compañía. A medida que la industria tecnológica continúa priorizando el desarrollo de IA, los anuncios de Apple serán observados de cerca tanto por los consumidores como por los analistas de la industria.

Características de recuperación de Microsoft y Google: preocupaciones de privacidad

Cuando un pirata informático desarrolló una herramienta para extraer datos de la nueva función de "recuperación" de Microsoft, esto generó preocupaciones sobre la privacidad y la protección de datos. En respuesta, Microsoft ha realizado varias actualizaciones para abordar estos problemas:

  • La función de recuperación ahora estará desactivada de forma predeterminada, lo que requerirá que los usuarios la habiliten específicamente.
  • Se requerirá una prueba de presencia para ver la línea de tiempo y buscar en los datos de recuperación.
  • Se agregarán medidas de protección de datos adicionales, incluida la descifración just-in-time y el almacenamiento local de instantáneas (no en la nube).
  • Los usuarios tendrán más control para pausar, filtrar y eliminar lo que se guarda en la función de recuperación.

Microsoft está claramente tratando de abordar el "factor espeluznante" y asegurar que los usuarios tengan más transparencia y control sobre sus datos.

Google también está explorando una función de "memoria" similar para Chromebooks, y también están apuntando a eliminar las posibles preocupaciones de privacidad en torno a dicha función.

La idea clave es que a medida que estas funciones de productividad impulsadas por IA se vuelven más prevalentes, las empresas tecnológicas deben equilibrar cuidadosamente los beneficios con salvaguardas sólidas de privacidad. Los desarrolladores deberán ser proactivos en abordar el posible mal uso o explotación de estas tecnologías.

Desafíos para la innovación en IA: el proyecto de ley de California

El proyecto de ley propuesto en California, SB 1047 (Innovación Segura y

Preguntas más frecuentes