Da Rebelião da OpenAI ao AGI Seguro: A Nova Empreitada de IA de Ilia Suk

Explore as últimas notícias de IA, incluindo a nova empreitada de Ilia Suk, a fazenda de servidores de IA de Elon Musk e os avanços em AGI segura, IA multimodal e o prêmio de $1M em AGI. Mergulhe nos desenvolvimentos de ponta que estão moldando o futuro da inteligência artificial.

24 de fevereiro de 2025

party-gif

Descubra os últimos avanços no mundo da IA, desde o lançamento da nova empresa de Ilia Suk focada em superinteligência segura, até a enorme fazenda de servidores de IA de Elon Musk, o surgimento do QAR e os novos lançamentos empolgantes da Meta AI. Fique à frente da curva e aprenda sobre as inovações revolucionárias que estão moldando o futuro da inteligência artificial.

Ilia Suk lança a nova empresa 'Safe Super Intelligence Inc' para buscar a superinteligência segura

Ilia Suk, o ex-funcionário da Open AI que tentou iniciar uma rebelião contra Sam Altman, lançou uma nova empresa chamada "Safe Super Intelligence Inc." A empresa é dedicada à busca de superinteligência segura, que Suk acredita ser o problema técnico mais importante de nosso tempo.

Suk reuniu uma equipe de engenheiros e pesquisadores experientes, incluindo os cofundadores Daniel Gross e Daniel Levy, para trabalhar neste objetivo. A missão da empresa é avançar nas capacidades o mais rápido possível, garantindo que a segurança permaneça à frente, em contraste com as preocupações de Suk sobre as prioridades da Open AI.

A Safe Super Intelligence Inc. está adotando uma abordagem "direto ao ponto", com um único foco e produto. A empresa é uma entidade americana com escritórios em Palo Alto e Tel Aviv, permitindo-lhe recrutar os melhores talentos técnicos. Suk enfatiza que o modelo de negócios, os investidores e todo o roteiro de produtos da empresa estão alinhados para alcançar a superinteligência segura, sem as distrações da sobrecarga de gestão ou dos ciclos de produtos.

Elon Musk e Michael Dell estão construindo uma enorme fazenda de servidores de IA

Elon Musk e a Tesla estão construindo uma fazenda de servidores absolutamente massiva com a ajuda da Dell e da Nvidia. Essa fazenda de servidores está sendo projetada para alimentar grandes modelos de linguagem e sistemas de IA.

O projeto foi inicialmente sugerido há alguns meses, com uma imagem mostrando a escala do sistema de resfriamento necessário para essa empreitada gigantesca. Ontem, Michael Dell, o fundador da Dell, confirmou que eles estão "construindo uma Fábrica de IA da Dell com a Nvidia para alimentar o GPT para XAI".

A fazenda de servidores está localizada no Texas, onde o clima quente exige um sistema de resfriamento robusto. As imagens mostram o tamanho imenso dos ventiladores sendo instalados para manter os servidores frios.

Essa colaboração entre Elon Musk, Michael Dell e Nvidia destaca o investimento significativo e a infraestrutura necessária para apoiar o desenvolvimento de sistemas de IA avançados. Ao construir essa enorme fazenda de servidores, eles estão se posicionando para alimentar a próxima geração de grandes modelos de linguagem e aplicativos de IA.

Surgimento do potencial 'Algoritmo Q*' e seu impressionante desempenho

O artigo de pesquisa publicado recentemente parece introduzir uma implementação de uma técnica semelhante ao Q*, um algoritmo poderoso que combina a pesquisa de árvore de Monte Carlo e o aprendizado profundo. Essa abordagem permite que os agentes aprendam a tomada de decisão e o raciocínio por meio de um processo de tentativa e erro, muito semelhante à forma como os humanos aprendem.

A principal inovação é o uso de MCTS (pesquisa de árvore de Monte Carlo) e autoaprimoramento, o que permite que o modelo planeje com antecedência, experimente diferentes opções e aprenda com seus erros. Isso é um avanço significativo em relação aos modelos de linguagem tradicionais que dependem apenas da previsão da próxima palavra.

Os resultados são impressionantes, com o modelo atingindo 96,66% de precisão em um benchmark de matemática, superando até mesmo grandes modelos de linguagem como o GPT-4 e o Gemini, enquanto usa 200 vezes menos parâmetros. Isso demonstra o poder de combinar planejamento, raciocínio e aprendizado em uma estrutura única.

Últimos lançamentos da Meta IA: Meta Chameleon, Previsão Multi-Token e Modelos de Texto para Música

A Meta AI lançou recentemente vários novos modelos e tecnologias empolgantes:

  1. Meta Chameleon: Um modelo de linguagem com 7 bilhões e 34 bilhões de parâmetros que suporta entrada multimodal e texto na saída. Esse modelo pode lidar nativamente com entradas multimodais, diferentemente dos modelos de código aberto anteriores que exigiam complementos. Atualmente, está disponível apenas sob uma licença de pesquisa, mas essa tecnologia é um passo significativo em direção a capacidades de IA multimodal.

  2. Previsão de Vários Tokens: A Meta propôs uma nova abordagem para a modelagem de linguagem que prevê várias palavras futuras de uma vez, em vez do método tradicional de uma por vez. Isso melhora as capacidades do modelo e a eficiência do treinamento, permitindo velocidades mais rápidas. A Meta está lançando modelos pré-treinados para conclusão de código sob uma licença de pesquisa não comercial.

  3. Modelos Geradores de Texto para Música: A Meta desenvolveu modelos capazes de gerar música a partir de entradas de texto, com vários inputs de condicionamento para maior controlabilidade. O modelo pré-treinado e o código de inferência serão lançados no final deste mês sob uma licença MIT, permitindo que os pesquisadores explorem essa nova e empolgante capacidade.

A Anthropic lança o Claude 3.5 Sonet, seu modelo mais inteligente até o momento

A Anthropic acaba de lançar uma nova versão de seu modelo de linguagem Claude, chamada Claude 3.5 Sonet. De acordo com o anúncio, este é seu "modelo mais inteligente até o momento" e o primeiro lançamento na família de modelos 3.5.

Os principais destaques do Claude 3.5 Sonet incluem:

  • Ele supera os modelos concorrentes em avaliações-chave, incluindo GSM 8K (96,4%), raciocínio de nível de pós-graduação (60%) e código (92%) - tudo isso a uma velocidade duas vezes maior que o Claude 3 e o Opus, e a 1/10 do custo.

  • Ele supera o Claude 3 Opus em todos os principais benchmarks de visão, tornando-o o modelo de visão mais forte da Anthropic até o momento.

  • Ele introduz um novo recurso chamado "Artefatos", que permite que os usuários peçam ao Claude para gerar documentos, código, diagramas, gráficos vetoriais e até mesmo jogos simples.

Perguntas frequentes