Notícias de IA: Uma Semana Movimentada em Avanços e Desenvolvimentos de IA
Descubra os últimos avanços e desenvolvimentos da IA da semana passada, incluindo o recurso de voz avançado da OpenAI, as capacidades de saída longa do GPT-4, as reivindicações de competição de IA da Microsoft e atualizações da Google, Anthropic, Meta e muito mais. Fique à frente da curva no mundo em constante evolução da IA.
14 de fevereiro de 2025

Este post de blog fornece uma visão geral abrangente dos últimos avanços no mundo da IA, cobrindo uma ampla gama de tópicos, desde novos recursos de voz no ChatGPT da OpenAI até a aquisição da Leonardo AI pela Canva. Os leitores obterão insights sobre o cenário da IA em rápida evolução e os emocionantes desenvolvimentos que estão moldando o futuro desta tecnologia.
Recurso Avançado de Voz da Open AI
Saída Longa do GPT-4
Open AI como Concorrente da Microsoft
Endosso da Open AI à Regulamentação da IA
Anthropic Lança o Claud no Brasil
Gemini 1.5 Pro da Google e Outros Modelos de IA
Novos Recursos de IA no Chrome da Google
Chatbots da Meta Desativados e Novo Estúdio de IA
Modelo Segment Anything 2 da Meta
Programa de Editores da Perplexity
Leonardo AI Adquirida pela Canva
Atualização 6.1 do Mid Journey
Novos Geradores de Modelos 3D
Novo Modelo Flux da Black Forest Labs
Imagem para Vídeo e Gen 3 Alpha Turbo da Runway
Avatares e Influenciadores Gerados por IA
Tradução Automática de Vídeos do Vimeo
Resposta da Anthropic a Processos Judiciais
A Controvérsia do Colar de IA "Amigo"
Outras Notícias de IA
Recurso Avançado de Voz da Open AI
Recurso Avançado de Voz da Open AI
A Open AI começou a implementar um recurso de voz avançado para alguns usuários selecionados. Este novo recurso permite que os usuários gerem vozes semelhantes a humanos, incluindo a capacidade de imitar vozes como a de Scarlett Johansson.
Principais destaques do modo de voz avançado:
- Os usuários com acesso podem tentar a opção "Modo de Voz Avançado" na parte inferior da janela de bate-papo.
- Ele pode gerar vozes com som muito realista, incluindo a capacidade de imitar vozes de celebridades e figuras públicas.
- Os usuários podem interromper a voz enquanto ela está falando, um recurso não disponível no aplicativo padrão do chat GPT.
- Demonstrações mostram que o modelo de voz pode contar muito rapidamente, simulando até a necessidade de respirar.
Saída Longa do GPT-4
Saída Longa do GPT-4
A Open AI lançou recentemente uma versão experimental do GPT-4 chamada "GPT-4 Long Output". Este novo modelo tem uma saída máxima de 64.000 tokens por solicitação, permitindo respostas muito mais longas e detalhadas em comparação com o modelo GPT-4 padrão.
O modelo GPT-4 Long Output está atualmente disponível apenas para um grupo seleto de participantes Alpha e ainda não é acessível ao público em geral. Esta versão experimental é projetada para fornecer aos usuários a capacidade de gerar saídas extremamente longas e abrangentes em resposta às suas consultas.
Embora os detalhes da arquitetura do modelo e do processo de treinamento não tenham sido divulgados publicamente, o aumento do comprimento da saída provavelmente é alcançado por meio de avanços nas capacidades de memória e raciocínio do modelo. Isso permite que o modelo mantenha o contexto e a coerência em um texto muito mais longo, possibilitando respostas mais detalhadas e aprofundadas.
Open AI como Concorrente da Microsoft
Open AI como Concorrente da Microsoft
Esta semana, a Microsoft está agora afirmando que a Open AI é uma concorrente em IA e pesquisa. Isso é interessante porque a Microsoft investiu famosamente US$ 13 bilhões na Open AI e possui 49% da empresa.
Em seus relatórios financeiros, a Microsoft listou empresas, incluindo Anthropic, Open AI, Meta e outras ofertas de código aberto, como concorrentes de suas ofertas de IA. Isso é estranho de ver, já que a Open AI é 49% de propriedade da Microsoft e eles têm acordos de parceria com a Meta também.
Parece que a Microsoft agora está vendo a Open AI como uma concorrente de seu próprio negócio de pesquisa e publicidade de notícias, mesmo que eles tenham uma participação significativa na empresa. Essa é uma dinâmica muito interessante que se desenvolveu entre as duas empresas.
Endosso da Open AI à Regulamentação da IA
Endosso da Open AI à Regulamentação da IA
A Open AI desta semana endossou alguns projetos de lei do Senado relacionados à regulamentação e segurança da IA. Isso inclui o Future of AI Innovation Act, que formalmente autorizaria o United States AI Safety Institute como um órgão federal para estabelecer padrões e diretrizes para modelos de IA.
A Open AI também endossou o NSF AI Education Act e o CREATE AI Act, que fornecem bolsas federais para pesquisa em IA e estabelecem recursos educacionais em IA em faculdades e escolas do ensino fundamental e médio.
Esses endossos da Open AI provavelmente servem para ajudar a empresa a ter uma cadeira na mesa em futuras conversas sobre regulamentação de IA. Como uma grande empresa de IA, a Open AI é um candidato provável a enfrentar escrutínio regulatório no futuro. Ao endossar esses projetos de lei, a Open AI pode ajudar a moldar a direção da regulamentação e garantir que seus interesses sejam representados.
Anthropic Lança o Claud no Brasil
Anthropic Lança o Claud no Brasil
Ótimas notícias para quem está no Brasil - a Anthropic lançou seu assistente de IA Claud no país esta semana. O Claud agora está disponível para que os usuários no Brasil possam acessar e interagir.
Gemini 1.5 Pro da Google e Outros Modelos de IA
Gemini 1.5 Pro da Google e Outros Modelos de IA
A Google também tem feito grandes ondas no mundo da IA esta semana. Eles lançaram uma nova versão do Gemini 1.5 Pro, chamando-a de versão 0801, que já está disponível para uso no Google's AI Studio.
Para acessá-lo, você pode ir para AI Studio .g google.com e, no menu suspenso "Modelo", você verá "Gemini 1.5 Pro experimental 0801" - esse é o modelo que você quer usar.
Quando você conversa com esse novo modelo Gemini 1.5 Pro, ele lidera o ranking no lm.org, superando até mesmo o GPT-4, o GPT-4 Mini, o CLAE 3.5 e o Sonet.
A Google também lançou uma nova versão menor de seu modelo Gemini 2 esta semana - um modelo de 2 bilhões de parâmetros construído para um desempenho e eficiência mais rápidos, provavelmente para dispositivos móveis. Curiosamente, esse modelo de 2 bilhões de parâmetros supera modelos muito maiores, como o Mixdral 8X 7B, o GPT-3.5 Turbo e o LLaMA 2 70 bilhões.
Novos Recursos de IA no Chrome da Google
Novos Recursos de IA no Chrome da Google
Esta semana, a Google adicionou alguns novos recursos alimentados por IA ao seu navegador Chrome:
-
Google Lens no Chrome Desktop: Agora você pode usar o Google Lens para pesquisar informações sobre objetos em imagens diretamente do navegador Chrome. Basta selecionar uma área da imagem e o Lens pesquisará por produtos semelhantes ou identificará o objeto.
-
Comparação de Produtos: O Chrome agora tem um recurso integrado que permite comparar produtos entre diferentes guias e sites. Isso facilita a pesquisa e a comparação de itens sem ter que alternar entre guias.
-
Histórico de Pesquisa em Linguagem Natural: Agora você pode usar linguagem natural para pesquisar seu histórico de navegação no Chrome. Por exemplo, você pode perguntar "Qual foi a sorveteria que eu olhei na semana passada?" e o Chrome exibirá as informações relevantes do seu histórico de pesquisa.
Chatbots da Meta Desativados e Novo Estúdio de IA
Chatbots da Meta Desativados e Novo Estúdio de IA
Esta semana, a Meta encerrou um dos recursos que anunciou na última Connect da Meta. Eles haviam mostrado chatbots de IA que pareciam pessoas famosas, mas não eram os chatbots reais dessas pessoas famosas - eles apenas usavam o rosto delas, mas eram treinados em informações diferentes. No entanto, ninguém realmente gostou deles, então a Meta os eliminou.
Mas eles o substituíram por outra coisa - agora, qualquer pessoa pode criar sua própria IA personalizada. A Meta lançou um Estúdio de IA, e um dos meus amigos, Don Allen Stevenson, é uma das pessoas que obteve acesso antecipado.
Este novo recurso permite que qualquer pessoa crie personagens de IA com base em seus interesses. Você pode ir para ai.meta.com/AI-Studio e criar seu próprio personagem de IA personalizado, escolhendo opções como animal de estimação de IA, tutor particular, fã companheiro, artista imaginativo, painel de ideias, designer criativo, personal stylist e muito mais.
Modelo Segment Anything 2 da Meta
Modelo Segment Anything 2 da Meta
A Perplexity, o mecanismo de pesquisa alimentado por IA, anunciou o Programa de Editores da Perplexity. Este programa visa compartilhar a receita com parceiros específicos cujo conteúdo é usado como fonte de notícias na plataforma Perplexity.
O lote inicial de parceiros incluídos neste programa são:
- Time
- Der Spiegel
- Fortune
- Entrepreneur
- The Texas Tribune
- WordPress.com
Embora este programa atualmente inclua apenas grandes editoras, a Perplexity expressou a esperança de que, no futuro, ela possa incentivar blogueiros e criadores de conteúdo normais a licenciar seu conteúdo para a plataforma também. No entanto, no momento, o Programa de Editores da Perplexity está focado em organizações de notícias estabelecidas.
Programa de Editores da Perplexity
Programa de Editores da Perplexity
Esta semana, a grande notícia é que a Leonardo AI, uma das principais ferramentas de geração de imagens por IA, foi adquirida pela plataforma de design Canva. Esse é um desenvolvimento significativo por algumas razões:
-
Integração com a Canva: Com a Leonardo AI agora fazendo parte do ecossistema Canva, os usuários eventualmente poderão acessar os poderosos recursos de geração de imagens diretamente na plataforma Canva. Isso facilitará a criação de imagens de alta qualidade geradas por IA sem ter que alternar entre várias ferramentas.
-
Melhoria da IA da Canva: Os recursos atuais de geração de imagens por IA da Canva têm sido um pouco deficientes em comparação com outras ferramentas como DALL-E e Midjourney. Ao integrar o modelo proprietário "Phoenix" da Leonardo, a geração de imagens por IA da Canva está prestes a melhorar drasticamente, permitindo que os usuários criem visuais ainda mais impressionantes.
Leonardo AI Adquirida pela Canva
Leonardo AI Adquirida pela Canva
Esta semana, a Mid Journey lançou a versão 6.1, que melhora muito a qualidade da imagem, a coerência e o manuseio de texto. Alguns destaques-chave:
-
Melhorias significativas na qualidade e coerência da imagem. Os exemplos mostrados demonstram um alto nível de realismo difícil de distinguir de imagens reais.
-
Melhor manuseio de prompts de texto, mesmo para palavras sem sentido ou inventadas. O modelo parece entender a intenção por trás do texto e gera imagens apropriadas.
-
Um novo modelo de ampliação e personalização que aprimora ainda mais as imagens geradas.
Atualização 6.1 do Mid Journey
Atualização 6.1 do Mid Journey
Existem alguns novos avanços no mundo da geração de modelos 3D usando IA:
-
Edify 3D da NVIDIA e Shutterstock:
- O Edify 3D é um novo modelo desenvolvido em colaboração entre a NVIDIA e a Shutterstock.
- Ele permite que você gere modelos 3D a partir de prompts de texto no site build.nvidia.com.
- Por exemplo, você pode inserir um prompt como "um lobo cinza uivando para a lua" e ele gerará visualizações de modelos 3D.
- Você pode então selecionar a visualização de que gosta e gerar o modelo 3D completo.
-
Stable Fast 3D da Stability AI:
- O Stable Fast 3D é um modelo de geração rápida de ativos 3D da Stability AI.
- Ele pode gerar modelos 3D a partir de imagens únicas em menos de um segundo.
- O modelo está disponível via API do Stable Assistant e no Hugging Face.
- Embora os resultados não sejam tão refinados quanto o modelo Edify 3D, a velocidade é impressionante.
Novos Geradores de Modelos 3D
Novos Geradores de Modelos 3D
A Runway, a plataforma de criação de vídeos alimentada por IA, fez avanços significativos esta semana com a introdução de dois novos recursos: imagem para vídeo e Gen 3 Alpha Turbo.
Imagem para Vídeo
A Runway agora lançou um modelo de imagem para vídeo, permitindo que os usuários convertam imagens estáticas em conteúdo de vídeo dinâmico. Este recurso é uma adição significativa às capacidades da Runway, pois permite que os usuários deem vida a suas imagens de maneira suave e envolvente.
Gen 3 Alpha Turbo
Além do modelo de imagem para vídeo, a Runway também anunciou o lançamento do Gen 3 Alpha Turbo, uma versão mais rápida e eficiente de seu modelo de geração de vídeo Gen 3 Alpha. De acordo com as demonstrações da Runway, o Gen 3 Alpha Turbo pode gerar saídas de vídeo muito mais rapidamente do que a versão anterior, com um tempo de geração de apenas 11 segundos.
Novo Modelo Flux da Black Forest Labs
Novo Modelo Flux da Black Forest Labs
O aumento de avatares e influenciadores gerados por IA é uma tendência fascinante e preocupante. Embora a tecnologia por trás dessas ferramentas seja impressionante, o potencial de abuso e disseminação de desinformação é preocupante.
Por um lado, os avatares alimentados por IA podem ser usados para criar representações digitais altamente realistas de pessoas, permitindo a criação de "gêmeos digitais" que podem ser usados para várias aplicações. Isso poderia ser benéfico em áreas como entretenimento, onde avatares de IA poderiam ser usados para criar novas formas de conteúdo e experiências.
No entanto, o potencial de uso indevido dessas ferramentas é significativo. Influenciadores gerados por IA, por exemplo, poderiam ser usados para espalhar propaganda, promover produtos sem a devida divulgação ou até mesmo imitar pessoas reais. Isso poderia minar a confiança no conteúdo online e dificultar cada vez mais a distinção entre o que é real e o que é fabricado.
Imagem para Vídeo e Gen 3 Alpha Turbo da Runway
Imagem para Vídeo e Gen 3 Alpha Turbo da Runway
O Vimeo, a popular plataforma de hospedagem de vídeos, está lançando um novo recurso que permite que os usuários traduzam automaticamente seus vídeos para qualquer idioma usando a própria voz do orador. Este recurso é particularmente útil para criadores que desejam localizar seu conteúdo e torná-lo acessível a um público global.
O funcionamento é o seguinte: o sistema do Vimeo pegará o áudio do vídeo original e o traduzirá para o idioma desejado, mantendo a voz do orador. Isso significa que a versão traduzida soará natural e fluida, sem a necessidade de regravação ou contratação de um ator de voz.
Avatares e Influenciadores Gerados por IA
Avatares e Influenciadores Gerados por IA
A Anthropic respondeu às ações judiciais movidas contra eles, afirmando que eles usaram dados publicamente disponíveis em toda a internet para treinar seus modelos. Eles reconhecem que esses dados podem ter incluído algumas informações com direitos autorais, mas afirmam que essa não era sua intenção.
A Anthropic argumenta que seus modelos aprendem de maneira semelhante à forma como os humanos aprendem - consumindo grandes quantidades de informações publicamente disponíveis. Eles afirmam ter implementado salvaguardas para evitar a geração de conteúdo que reproduza diretamente obras com direitos autorais.
Tradução Automática de Vídeos do Vimeo
Tradução Automática de Vídeos do Vimeo
Esta semana houve uma história interessante se desenrolando em torno de um novo dispositivo de colar alimentado por IA chamado "Friend". Aqui está um resumo dos principais pontos:
-
Uma empresa chamada Avi Shiffman lançou um novo produto chamado "Friend" - um colar que usa IA para ouvir o usuário e enviar-lhe mensagens de texto com observações e comentários.
-
No entanto, descobriu-se que havia um produto "Friend" existente lançado anteriormente por uma empresa diferente, Nick Shenko. Shenko acusou Shiffman de copiar seu conceito e estilo.
-
Shenko até lançou um vídeo de rap "contra-ataque", criticando Shiffman por "roubar seu estilo" e investir US$ 1,9 milhão para comprar o domínio "friend.com".
-
Mais drama surgiu quando M
Perguntas frequentes
Perguntas frequentes