O Mundo da IA Esta Semana: Anúncios Revolucionários da Google e OpenAI

Mergulhe nos últimos avanços da IA da Google e da OpenAI. Descubra os recursos avançados do GPT-4, as mudanças na liderança da OpenAI e o turbilhão de anúncios de IA da Google no I/O 2024. Fique por dentro da paisagem da IA em rápida evolução.

24 de fevereiro de 2025

party-gif

Esta semana testemunhou uma enxurrada de importantes anúncios de IA de empresas de tecnologia líderes como Google e OpenAI. Desde o lançamento do GPT-4, um poderoso novo modelo de linguagem, até avanços emocionantes em áreas como geração de vídeo e realidade aumentada, este é um momento decisivo no mundo em rápida evolução da inteligência artificial. Mergulhe para descobrir os últimos avanços que estão prontos para moldar o futuro.

GPT-40: O Assistente de IA Multimodal

O último modelo da Open AI, o GPT-40, é um assistente de IA multimodal revolucionário que pode lidar com uma ampla gama de entradas e saídas. Alguns destaques-chave:

  • Capacidades Multimodais: O GPT-40 pode entender e gerar conteúdo em vários formatos, incluindo texto, áudio, imagens e vídeo. Isso permite interações mais naturais e contextuais.

  • Acesso Gratuito para Todos: Os recursos avançados do GPT-40, como navegação na internet, interpretação de código e análise de dados, agora estão disponíveis para todos os usuários gratuitos do ChatGPT. Os membros do ChatGPT Plus recebem benefícios adicionais, como tempos de resposta mais rápidos e limites de saída mais altos.

  • Habilidades Conversacionais: O GPT-40 pode se envolver em conversas semelhantes às humanas, com a capacidade de entender o tom, fornecer suporte emocional e até contar histórias com entrega expressiva.

  • Compreensão Visual: O modelo pode interpretar informações visuais, como resolver problemas de matemática analisando imagens, e gerar imagens com base em descrições de texto.

  • Integração com a Área de Trabalho: A Open AI lançou um aplicativo de área de trabalho que permite que os usuários acessem o GPT-40 diretamente em seus computadores, com a capacidade de compartilhar o conteúdo da tela e obter assistência contextual.

Explorando as Capacidades do GPT-40

O novo modelo GPT-40 da Open AI é um modelo de linguagem poderoso e versátil que vai além da simples geração de texto. Aqui estão algumas das principais capacidades do GPT-40 que foram apresentadas:

Habilidades Multimodais

O GPT-40 é um modelo multimodal, o que significa que pode lidar e entender diferentes tipos de mídia, como áudio, vídeo e imagens, além de texto. Isso permite que ele realize tarefas que combinam várias modalidades, como descrever o conteúdo de uma imagem ou vídeo.

Conversação Avançada

O modelo demonstrou impressionantes habilidades conversacionais, envolvendo-se em diálogos de ida e volta e até assumindo diferentes tons e personas emocionais. Ele foi capaz de entender o contexto e fornecer respostas relevantes e coerentes.

Resolução de Problemas Passo a Passo

Quando apresentado a um problema de matemática, o GPT-40 não forneceu apenas a resposta final. Em vez disso, ele percorreu o processo passo a passo para resolver o problema, explicando seu raciocínio ao longo do caminho.

Saída de Voz Personalizável

O GPT-40 pode gerar saída de fala com tom, emoção e expressividade personalizáveis. Isso permite que ele soe mais natural e semelhante a um humano durante a conversa.

Geração de Imagens

Além do texto, o GPT-40 tem a capacidade de gerar imagens. Os exemplos mostrados incluíam a criação de imagens detalhadas com texto legível, bem como a geração de designs de personagens consistentes em várias cenas.

Síntese de Objetos 3D

O modelo pode pegar imagens 2D e gerar reconstruções 3D, animá-las e colocar logotipos ou outros elementos em objetos 3D.

Ilia Sutskever Deixando a Open AI

Ilia Sutskever, um dos fundadores originais da OpenAI, decidiu se afastar da empresa. Após quase uma década na OpenAI, Sutskever tomou a decisão de deixar a empresa.

Sutskever fez parte do conselho que tomou a decisão de demitir o CEO da OpenAI, Sam Altman, em novembro de 2023. No entanto, Sutskever posteriormente se arrependeu dessa decisão e se desculpou publicamente, afirmando que foi um erro se livrar de Altman.

Embora as razões de Sutskever para sair não estejam totalmente claras, parece que ele pode não ter estado totalmente alinhado com a direção que a OpenAI está seguindo. Como pesquisador e acadêmico, Sutskever provavelmente está mais interessado na ciência e na tecnologia por trás da IA, em vez da monetização e comercialização da tecnologia.

Em sua mensagem de despedida, Sutskever expressou confiança na liderança da OpenAI sob Altman, Greg Brockman e Mira Murati, e afirmou que está animado com o que está por vir em seu próprio projeto pessoal, sobre o qual compartilhará detalhes em breve.

A partida de Sutskever é uma perda significativa para a OpenAI, pois ele era um dos membros fundadores da empresa e uma luz orientadora no campo da IA. No entanto, a empresa parece estar avançando com seus planos ambiciosos, incluindo o lançamento recente do poderoso modelo GPT-4.

Principais Saídas da Equipe de Super Alinhamento

De acordo com os relatórios, vários membros-chave da equipe de super alinhamento da OpenAI deixaram a empresa. Isso inclui Yan Lecun, Leopold Ashenbrener e William Saunders.

Esses indivíduos faziam parte da equipe responsável por garantir que os sistemas de IA desenvolvidos pela OpenAI, como o GPT-4, permaneçam seguros e benéficos. Sua partida é preocupante, pois sugere possíveis problemas ou discordâncias dentro da empresa em torno da direção e da segurança de seus modelos de IA avançados.

A equipe de super alinhamento desempenha um papel fundamental na tentativa de mitigar os riscos de sistemas de IA poderosos. Sua saída poderia sinalizar tensões internas ou uma mudança de prioridades na OpenAI que prioriza o desenvolvimento rápido em detrimento de medidas de segurança robustas.

Essa notícia vem logo após a partida de Ilya Sutskever, um dos co-fundadores da OpenAI, que anunciou que estava deixando a empresa para se dedicar a um novo projeto "pessoalmente significativo".

A perda dessas figuras-chave, especialmente aquelas focadas na segurança da IA, é um desenvolvimento preocupante que merece atenção. Isso levanta questões sobre a futura direção e prioridades da OpenAI, à medida que eles continuam a empurrar os limites dos modelos de linguagem de grande porte e outras capacidades avançadas de IA.

Google IO 2024: Modelos Gêmeos, Projeto Astra e Muito Mais

O maior anúncio do Google IO 2024 foi a introdução dos modelos de IA Gemini. O Gemini 1.5 Flash e o Gemini 1.5 Pro são os novos modelos de linguagem de grande porte da Google.

O Gemini 1.5 Flash é um modelo mais rápido, enquanto o Gemini 1.5 Pro é projetado para a melhor saída possível. Ambos os modelos têm uma janela de contexto de 1 milhão de tokens, com planos de aumentá-la para 2 milhões de tokens no futuro. Isso permite entrada e saída de aproximadamente 1,5 milhão de palavras.

Outro destaque foi o Projeto Astra, que permite que um telefone celular veja o que a câmera está observando e responda a perguntas sobre isso. A demonstração mostrou o telefone lembrando detalhes como a localização de um par de óculos, e o apresentador pôde continuar interagindo com o sistema usando um par de óculos de realidade aumentada, sugerindo futuras capacidades semelhantes ao Google Glass.

A Google também apresentou seu novo modelo de texto para imagem, o Imagine 3, que se aproxima do realismo de modelos como o Midjourney. Eles demonstraram um novo modelo de geração de vídeo chamado Veo, que pode criar vídeos em 1080p com mais de 1 minuto de duração, embora não atinja a qualidade do Sorai, da Anthropic.

Outras Atualizações de IA: Anthropic, Hume e o Futuro dos Relacionamentos

Começando com a Anthropic, a empresa contratou o co-fundador do Instagram, Mike Krieger, como seu novo Head of Product. Krieger, que foi um dos co-fundadores do Instagram e também co-fundador do aplicativo de notícias Artifact, terá a tarefa de criar boas experiências do usuário para entusiasmar mais pessoas a usar as ferramentas da Anthropic, como o Claude.

A Anthropic também lançou um novo recurso de gerador de prompts em seu console. Os usuários agora podem gerar prompts prontos para produção, descrevendo o que querem alcançar, e o sistema usará técnicas de engenharia de prompts, como o raciocínio da Cadeia de Pensamento, para criar prompts mais eficazes, precisos e confiáveis.

Passando adiante, a empresa de IA Hume lançou uma nova ferramenta chamada Chatter - uma experiência de podcast interativa. O Chatter é um podcast que permite que você direcione a conversa, fazendo perguntas ao host de IA e recebendo respostas personalizadas para seus interesses, neste caso, focadas nas últimas notícias de IA.

Finalmente, um clipe da fundadora do Bumble, Whitney Wolfe Herd, viralizou na semana passada, onde ela especulou sobre o futuro dos relacionamentos envolvendo concierges de namoro de IA. A ideia é que seu concierge de IA pessoal sairia em encontros com os concierges de IA de outras pessoas para determinar a compatibilidade, antes de apresentar as pessoas reais. Embora isso pareça um enredo do Black Mirror, destaca como a IA poderia potencialmente desempenhar um papel em futuras experiências de namoro.

Conclusão

Na semana passada, houve uma avalanche de notícias sobre IA, com grandes anúncios tanto da Google quanto da OpenAI.

A OpenAI apresentou seu último modelo de linguagem, o GPT-4, que é um poderoso sistema multimodal capaz de lidar com uma variedade de entradas, como áudio, imagens e vídeo. O aspecto mais impressionante é que o GPT-4 agora estará disponível para todos os usuários gratuitos do ChatGPT, dando-lhes acesso a recursos avançados anteriormente reservados apenas para assinantes pagos.

A Google, por outro lado, adotou uma abordagem diferente em seu evento I/O - bombardeando a audiência com mais de 100 anúncios relacionados à IA. Os destaques incluem os novos modelos de linguagem Gemini, o impressionante Projeto Astra que pode entender visualmente uma cena e os avanços na geração de texto para imagem e vídeo.

Embora a Google possa ter sobrecarregado com o volume de atualizações, ambas as empresas demonstraram progresso significativo em tornar a IA mais acessível e capaz. A disputa pela supremacia da IA está esquentando, e será emocionante ver como essas tecnologias evoluirão e impactarão nosso dia a dia nos próximos anos.

Como a temporada de eventos de IA continua, com próximos eventos da Microsoft, Cisco, Qualcomm e Apple, não haverá falta de desenvolvimentos inovadores de IA a serem aguardados. Este é um momento empolgante para a indústria de IA, e estou ansioso para continuar compartilhando as últimas notícias e insights com você.

Perguntas frequentes