Revelado el video de IA de calidad de Hollywood: explorando los últimos avances en video de IA

Descubre los últimos avances en tecnología de video de IA, incluyendo la herramienta Odyssey de nivel de Hollywood y herramientas como Live Portrait y PaintSUndo. Aprende cómo la IA está transformando la creación de video y habilitando nuevas posibilidades creativas. Explora los últimos desarrollos de OpenAI, Meta y otras empresas líderes de IA.

24 de febrero de 2025

party-gif

Descubre los últimos avances en la tecnología de video de IA, desde la generación de video de IA de "calidad de Hollywood" hasta herramientas innovadoras que dan vida a tus imágenes. Explora los desarrollos de vanguardia que están transformando el mundo de la narración visual.

Benefíciese de la generación de videos de IA de calidad cinematográfica

Odisea, una nueva herramienta de video de IA, afirma ofrecer capacidades visuales de nivel de Hollywood. Desarrollado por un equipo con experiencia en automóviles autónomos y proyectos cinematográficos importantes, Odyssey tiene como objetivo permitir el control total sobre las capas básicas de la narración visual, incluida la geometría de alta calidad, los materiales fotorrealistas, la iluminación impresionante y el movimiento controlable.

La herramienta actualmente no está disponible públicamente, pero el equipo está trabajando junto a Hollywood para dar forma a la tecnología. Los modelos generativos de Odyssey están diseñados para proporcionar una configuración precisa de los detalles de la escena, lo que permite a los creadores dar vida a sus visiones con visuales sin errores y sorprendentes.

A medida que el panorama de los videos de IA continúa evolucionando, herramientas como Odyssey ofrecen el potencial de democratizar el acceso a la generación de videos de alta calidad y nivel cinematográfico, empoderando a los creadores a dar vida a sus proyectos creativos de maneras que antes podían estar fuera de su alcance.

Dé vida a las imágenes con Live Portrait

Live Portrait es una herramienta que te permite animar una imagen usando un video de conducción. Así es como funciona:

  1. Cargas una imagen estática y un video de conducción.
  2. La herramienta luego anima la imagen para que coincida con los movimientos y expresiones del video de conducción.
  3. El resultado es un video donde la imagen parece cobrar vida, con la boca, los ojos y los movimientos de la cabeza del sujeto sincronizados con el video de conducción.

La herramienta está disponible en GitHub y también puedes usarla a través de un espacio de Hugging Face de forma gratuita. Si bien funciona bien para rostros expresivos, puede tener dificultades con algunas características como las barbas.

Para usar Live Portrait, simplemente selecciona la imagen de entrada y el video de conducción, luego haz clic en "Animar" para generar el video de salida final. Verás una comparación de lado a lado, con la imagen animada a la izquierda y el video de conducción original a la derecha.

Esta herramienta es un gran ejemplo de los avances en la generación de videos impulsada por IA, lo que te permite dar vida a imágenes estáticas de una manera fluida y realista.

Ingeniería inversa de su obra de arte digital con Paints Undo

El proyecto de investigación llamado "Paints Undo" es una herramienta fascinante que te permite revertir la ingeniería de obras de arte digital. La idea es simple: cargas una imagen terminada, como un personaje de anime, y la herramienta generará un proceso paso a paso que te mostrará cómo recrear esa obra de arte.

Esto es esencialmente lo contrario de lo que hemos visto con los generadores de arte de IA como Midjourney o DALL-E. En lugar de comenzar con un mensaje de texto y generar una imagen, Paints Undo toma la imagen final y la descompone en sus bocetos iniciales, pintura y pasos de sombreado.

Los ejemplos presentados en la página de GitHub del proyecto demuestran este proceso para varias obras de arte con estilo de anime. Puedes ver cómo la herramienta descompone la imagen final, revelando las capas subyacentes y las técnicas utilizadas para crearla.

Si bien el código está actualmente disponible en GitHub, los desarrolladores señalan que el tiempo de procesamiento a menudo es más largo que las tareas típicas de Hugging Face. Como resultado, no recomiendan desplegarlo directamente en Hugging Face. En su lugar, planean lanzar un cuaderno de Google Colab en el futuro, que proporcionará una forma más accesible de usar la herramienta Paints Undo.

Si estás interesado en explorar este enfoque de ingeniería inversa del arte digital, mantén un ojo en el próximo lanzamiento del cuaderno de Colab. Esta herramienta podría ser un recurso valioso para los artistas que buscan aprender y replicar las técnicas utilizadas en sus obras de arte digitales favoritas.

Mejore su creación de videos con nid AI

Crear videos de alta calidad puede ser increíblemente laborioso, desde la redacción hasta la edición y la búsqueda del metraje de archivo adecuado. Es mucho trabajo. Ahí es donde entra nid AI.

nid es el creador de videos de IA más utilizado del mundo con más de 25 millones de usuarios en todo el mundo. Imagina tener un asistente capacitado que pueda manejar todas las tareas tediosas y molestas de edición de video, dejándote libre para concentrarte en tu creatividad.

Aquí es cómo funciona:

  1. Comienza con un mensaje de texto simple, como "un video corto que explique por qué los avances en robótica se están acelerando".
  2. Haz clic en generar video y agrega algunos detalles adicionales, como convertirlo en un video corto de YouTube.
  3. nid crea un borrador para ti, siguiendo el mensaje que acabas de ingresar.
  4. A partir de ahí, estás al mando. ¿Quieres cambiar la introducción? Hazlo con un mensaje. ¿Necesitas mejores imágenes para una escena? Simplemente haz clic en editar, elige el clip que quieres reemplazar y reemplázalo con el metraje de video de alta calidad de su biblioteca.
  5. ¿Quieres traducir todo el video al español? Eso también es fácil, solo escribe el mensaje y haz clic en generar.

nid AI realiza la tarea de más de 10 herramientas combinadas en una sola plataforma fácil de usar. Esto puede ahorrarte cientos de dólares al mes en tarifas recurrentes, y comienza en solo $20 por mes.

Recomiendo encarecidamente que revises nid AI, especialmente si te tomas en serio la creación de videos. Puedes comenzar de forma gratuita, pero los planes de pago eliminarán la marca de agua, te darán acceso al clonado de voz y te proporcionarán metraje de video adicional de alta calidad.

Solo ve al enlace de la descripción y usa mi código de cupón "mw50" o usa el código QR en la pantalla para obtener el doble de créditos de video en tu primer mes. Revisa nid AI hoy y lleva tu creación de videos al siguiente nivel.

Descubra el poder de los avances más recientes de Po Previews y Anthropic

Si has estado usando el chatbot Po, esta semana recibió una nueva actualización llamada Previews. Esta es una nueva función que te permite ver e interactuar con aplicaciones web generadas directamente en Chats en Po.

Los Previews funcionan particularmente bien con LLM que se destacan en codificación, incluidos Clae 3.5, Sonet GPT 4.0 y Gemini 1.5. Po es un chatbot de suscripción, pero cuando lo estás usando, puedes elegir el modelo que quieres usar, no estás atado a usar solo GPT, Claud o Gemini. Esto parece muy similar a lo que Anthropic acaba de lanzar con sus Artifacts, pero está en Po y puedes usarlo con varios modelos diferentes.

Puedes ver en el clip proporcionado que después de recibir el mensaje, Po realmente generó el código y lo ejecutó en tiempo real directamente en la ventana de chat. Los Previews se pueden compartir con cualquiera a través de un enlace dedicado, por lo que si creas algo genial codificado dentro de Po, puedes compartir un enlace con otros y ellos tendrán acceso a ello en su cuenta de Po.

Hablando de Anthropic, también hicieron que Artifacts se pueda compartir esta semana. Artifacts no es nuevo, donde ingresas tu mensaje en el lado izquierdo y genera el código y la vista previa en el derecho, y puedes interactuar con él. Pero la capacidad de compartirlo con otros, para que puedan usarlo, probarlo y remezclarlo, es una nueva función.

Anthropic está mejorando constantemente la calidad de vida para usar su aplicación. También lanzaron la capacidad de evaluar mensajes dentro de la consola del desarrollador. Esto te permite generar mensajes mejorados, comparar varios mensajes y probar variables individuales dentro de cada mensaje para ver cómo cambian los resultados.

En otras noticias, Meta anunció un nuevo modelo de lenguaje llamado Mobile LLM, un modelo mucho más pequeño desarrollado para dispositivos móviles. Según el gráfico proporcionado, la precisión parece ser mucho mayor que la de la mayoría de otros modelos móviles.

En general, estamos viendo avances y mejoras continuas en el mundo de la IA, con herramientas como Po Previews y Artifacts de Anthropic que facilitan la creación y el intercambio de aplicaciones interactivas. La capacidad de elegir diferentes modelos y evaluar mensajes también es un desarrollo bienvenido, que empodera a los usuarios a sacar el máximo provecho de estos poderosos sistemas de IA.

Manténgase al día con las últimas noticias sobre Open AI, Stability AI y las implicaciones de derechos de autor

Open AI ha estado acaparando titulares esta semana con varios desarrollos significativos:

  • Open AI ha bloqueado el acceso a ChatGPT en China, cortando un resquicio legal que permitía a los usuarios eludir la prohibición. Sin embargo, China aún tiene acceso a GPT-4 a través de Microsoft Azure, lo que lleva a especular sobre la posible llegada de GPT-5.
  • Tanto Microsoft como Apple se han retirado de sus planes de tener roles de observadores en la junta directiva de Open AI, probablemente debido a preocupaciones sobre el escrutinio antimonopolio.
  • Open AI ha anunciado una asociación con el Laboratorio Nacional de Los Álamos para la investigación en biociencias y también está trabajando con Arianna Huffington's Thrive Global para desarrollar un entrenador de salud personal de IA.

Stability AI, la empresa detrás de Stable Diffusion, también ha realizado algunas actualizaciones notables:

  • Han actualizado sus términos de licencia, permitiendo un mayor uso comercial de sus modelos, siempre que los ingresos anuales no superen los $1 millón.
  • Stability AI ha lanzado nuevas funciones para su Stable Assistant, incluida la búsqueda y reemplazo, y las capacidades de texto a audio.

En el ámbito de las implicaciones de derechos de autor, una reciente sentencia judicial sugiere que los sistemas de IA podrían estar a salvo siempre que su producción sea suficientemente diferente del material de entrada, lo que proporciona un precedente para futuras demandas.

Además, un proyecto de ley propuesto en California (SB 1047) tiene el potencial de obstaculizar gravemente a los investigadores de IA, y está siendo activamente rechazado por líderes de la industria como Ananth Raman de A16Z.

En general, el panorama de la IA continúa evolucionando rápidamente, con desarrollos significativos de gigantes de la industria como Open AI y Stability AI, así como importantes consideraciones legales y regulatorias que darán forma al futuro de este campo.

Explore los gadgets con IA de Samsung

La última línea de productos de Samsung muestra la integración de la IA en todos sus dispositivos. Algunos aspectos clave incluyen:

  • Galaxy Z Fold 6: Equipado con las últimas funciones de IA de Samsung, incluida la función Circle para buscar, traducir y transcribir documentos PDF, generar imágenes basadas en IA a partir de personas u objetos en fotos y una función de boceto a imagen que convierte bocetos rápidos en imágenes de alta calidad.

  • Galaxy Z Flip 6: La pantalla externa presenta respuestas sugeridas del IA incorporado, y fondos de pantalla impulsados por IA.

  • Galaxy Watch 7: El primer dispositivo portátil autorizado por la FDA para reconocer signos de apnea del sueño, impulsado por un algoritmo de sueño basado en IA. También proporciona puntajes de energía integrales basados en actividad, calidad del sueño y otras métricas de salud.

  • Galaxy Ring: Usa Galaxy AI para generar un puntaje de energía basado en actividad, calidad del sueño y otros datos de salud, con seguimiento del sueño impulsado por IA.

  • Galaxy Buds 3 Pro: Cuenta con un ajuste de intérprete que aprovecha la IA para traducir diálogos en idiomas extranjeros en tiempo real, directamente al oído del usuario.

Estos dispositivos impregnados de IA muestran el compromiso de Samsung de integrar capacidades inteligentes en toda su línea de productos, mejorando las experiencias de los usuarios a través de la personalización, el monitoreo de la salud y la traducción de idiomas.

Presencia de la destreza de navegación de Gemini en las oficinas de Google Deepmind

Finalmente, aquí hay un robot que navegó por las oficinas de Google deepmind usando Gemini. Está usando ese modelo de Visión para ver lo que hay a su alrededor y se desplaza por los pasillos, asegurándose de no chocar con nada porque el modelo de visión sabe exactamente dónde está y puede ver a su alrededor para asegurarse de no chocar con nada.

Los videos del artículo de TechCrunch no tienen audio, pero dice que el robot puede caminar por la oficina y señalar diferentes puntos de referencia con voz. Utilizan lo que se llama "visión-lenguaje-acción" que combina el entendimiento del entorno y el poder de razonamiento de sentido común. Una vez que se combinan los procesos, el robot puede responder a comandos escritos y dibujados, así como a gestos.

Por ahora, es como un guía turístico de IA: podría recorrer un edificio y señalar cosas y darte información sobre lo que está señalando.

Preguntas más frecuentes