De la Rebelión de OpenAI al AGI Seguro: La Nueva Empresa de IA de Ilia Suk

Explore las últimas noticias de IA, incluyendo la nueva empresa de Ilia Suk, la granja de servidores de IA de Elon Musk y los avances en AGI segura, IA multimodal y el premio de $1M a la AGI. Sumerge en los desarrollos de vanguardia que están dando forma al futuro de la inteligencia artificial.

15 de febrero de 2025

party-gif

Descubre los últimos avances en el mundo de la IA, desde el lanzamiento de la nueva empresa de Ilia Suk centrada en la superinteligencia segura, hasta la enorme granja de servidores de IA de Elon Musk, el surgimiento de QAR y los emocionantes nuevos lanzamientos de Meta AI. Mantente a la vanguardia y aprende sobre las innovaciones revolucionarias que están dando forma al futuro de la inteligencia artificial.

Ilia Suk lanza la nueva empresa 'Safe Super Intelligence Inc' para perseguir la superinteligencia segura

Ilia Suk, el ex empleado de Open AI que intentó iniciar un motín contra Sam Altman, ha lanzado una nueva empresa llamada "Safe Super Intelligence Inc." La empresa se dedica a la búsqueda de una superinteligencia segura, que Suk cree que es el problema técnico más importante de nuestro tiempo.

Suk ha reunido a un equipo de ingenieros y investigadores experimentados, incluidos los cofundadores Daniel Gross y Daniel Levy, para trabajar hacia este objetivo. La misión de la empresa es avanzar en las capacidades lo más rápido posible, asegurando que la seguridad se mantenga por delante, en contraste con las preocupaciones de Suk sobre las prioridades de Open AI.

Safe Super Intelligence Inc. está tomando un enfoque de "tiro directo", con un solo enfoque y producto. La empresa es una entidad con sede en Estados Unidos con oficinas en Palo Alto y Tel Aviv, lo que le permite reclutar a los mejores talentos técnicos. Suk enfatiza que el modelo de negocio, los inversores y toda la hoja de ruta de productos de la empresa están alineados para lograr una superinteligencia segura, sin las distracciones de la sobrecarga de gestión o los ciclos de productos.

Elon Musk y Michael Dell construyen una enorme granja de servidores de IA

Elon Musk y Tesla están construyendo una granja de servidores absolutamente masiva con la ayuda de Dell y Nvidia. Esta granja de servidores está diseñada para alimentar modelos de lenguaje a gran escala y sistemas de IA.

El proyecto se insinuó por primera vez hace unos meses, con una imagen que mostraba la escala del sistema de refrigeración necesario para esta empresa de gran envergadura. Ayer, Michael Dell, el fundador de Dell, confirmó que están "construyendo una fábrica de IA de Dell con Nvidia para alimentar a GPT para XAI".

La granja de servidores se encuentra en Texas, donde el clima cálido requiere un sistema de refrigeración sólido. Las imágenes muestran el inmenso tamaño de los ventiladores que se están instalando para mantener frescos a los servidores.

Aparición del posible algoritmo 'Q*' y su impresionante rendimiento

El artículo de investigación publicado recientemente parece introducir una implementación de una técnica similar a Q*, un poderoso algoritmo que combina la búsqueda de árboles de Monte Carlo y el aprendizaje profundo. Este enfoque permite que los agentes aprendan la toma de decisiones y el razonamiento a través de un proceso de prueba y error, al igual que los humanos.

La innovación clave es el uso de MCTS (búsqueda de árboles de Monte Carlo) y el autoajuste, lo que permite que el modelo planifique con anticipación, pruebe diferentes opciones y aprenda de sus errores. Esto es un avance significativo con respecto a los modelos de lenguaje tradicionales que se basan únicamente en predecir la siguiente palabra.

Los resultados son impresionantes, con el modelo alcanzando una precisión del 96,66% en un punto de referencia matemático, superando incluso a los grandes modelos de lenguaje como GPT-4 y Gemini, mientras usa 200 veces menos parámetros. Esto demuestra el poder de combinar la planificación, el razonamiento y el aprendizaje en un solo marco.

Los últimos lanzamientos de Meta AI: Meta Chameleon, predicción de varios tokens y modelos de texto a música

Meta AI ha lanzado recientemente varios modelos y tecnologías nuevos y emocionantes:

  1. Meta Chameleon: Un modelo de lenguaje de 7 mil millones y 34 mil millones de parámetros que admite entrada multimodal y texto de salida. Este modelo puede manejar nativamente entradas multimodales, a diferencia de los modelos de código abierto anteriores que requerían complementos. Actualmente solo está disponible bajo una licencia de investigación, pero esta tecnología es un paso significativo hacia las capacidades de IA multimodal.

  2. Predicción de varios tokens: Meta ha propuesto un nuevo enfoque para el modelado del lenguaje que predice varias palabras futuras a la vez, en lugar del método tradicional de una a la vez. Esto mejora las capacidades del modelo y la eficiencia del entrenamiento, al tiempo que permite velocidades más rápidas. Meta está lanzando modelos preentrenados para la finalización de código bajo una licencia de investigación no comercial.

  3. Modelos generativos de texto a música: Meta ha desarrollado modelos capaces de generar música a partir de entradas de texto, con varios datos de condicionamiento para una mayor controlabilidad. El modelo preentrenado y el código de inferencia se lanzarán a finales de este mes bajo una licencia MIT, lo que permitirá a los investigadores explorar esta emocionante nueva capacidad.

Anthropic lanza Claude 3.5 Sonet, su modelo más inteligente hasta ahora

Antropic acaba de lanzar una nueva versión de su modelo de lenguaje Claude, llamada Claude 3.5 Sonet. Según el anuncio, este es su "modelo más inteligente hasta ahora" y el primer lanzamiento de su familia de modelos 3.5.

Los aspectos clave de Claude 3.5 Sonet incluyen:

  • Supera a los modelos competidores en evaluaciones clave, incluido GSM 8K (96,4%), razonamiento de nivel de posgrado (60%) y código (92%), todo ello a una velocidad dos veces mayor que Claude 3 y Opus, y a 1/10 del costo.

  • Supera a Claude 3 Opus en todos los puntos de referencia estándar de visión, convirtiéndolo en el modelo de visión más fuerte de Anthropic hasta la fecha.

  • Introduce una nueva función llamada "Artifacts", que permite a los usuarios pedirle a Claude que genere documentos, código, diagramas, gráficos vectoriales e incluso juegos sencillos.

El premio de $1M a la AGI: un concurso para lograr la inteligencia general artificial

El Premio Arc es una competencia pública de un millón de dólares para desarrollar una solución que pueda vencer al Abstraction and Reasoning Corpus (ARC), que se considera el único punto de referencia formal para la Inteligencia General Artificial (AGI).

Los puntos clave sobre esta competencia son:

  • El punto de referencia ARC mide la inteligencia general, no solo habilidades específicas. Prueba la capacidad de adquirir nuevas habilidades de manera eficiente, que es el sello distintivo de la verdadera inteligencia.

  • Si bien los modelos de IA existentes han podido superar rápidamente otros puntos de referencia, el punto de referencia ARC sigue siendo un desafío significativo, con la implementación líder actual solo logrando una tasa de éxito del 38%.

  • La competencia es organizada por Mike Mirzayanov, François Chollet y Greg Brockman, con el objetivo de impulsar el progreso hacia el elusivo objetivo de la AGI.

  • Se otorgará un premio de $1 millón a la primera persona o equipo que pueda desarrollar un sistema de IA capaz de resolver el punto de referencia ARC.

Preguntas más frecuentes