×

OpenAi e Microsoft adicionam novas gerações de imagem e recursos de agente de IA – e mostram sua vantagem de plataforma

OpenAi e Microsoft adicionam novas gerações de imagem e recursos de agente de IA - e mostram sua vantagem de plataforma

OpenAi e Microsoft adicionam novas gerações de imagem e recursos de agente de IA – e mostram sua vantagem de plataforma



Olá e bem -vindo ao olho na IA. Na edição de hoje … o OpenAI libera um gerador de imagens mais capaz, enquanto a Microsoft planta sua participação em agentes de raciocínio; O Google estreia modelos Gemini 2.5 “Thinking”; A Amazon testa os assistentes de IA para saúde e compras; Personagem.ai dá aos pais uma lente no tempo de seus filhos na plataforma; E os rastreadores agressivos das empresas de IA dominam projetos de código aberto.

Nesta semana, o OpenAi e seu patrocinador (e o antigo rival … é complicado) a Microsoft lançou alguns dos seus mais novos e mais poderosos recursos de IA em suas principais plataformas. O OpenAI estreou um novo recurso de geração de imagens para o GPT-4O em seu principal serviço de chatgpt, oferecendo recursos aprimorados de criação de imagens e edição granular com base em prompts de texto. Isso torna a geração de imagens muito superior ao que era possível com seu modelo Dall-E anterior. E a Microsoft anunciou que aumentava sua oferta da Microsoft 360 Copilot com dois “agentes de raciocínio profundo”, bem como “fluxos de agente” projetados para remover parte da imprevisibilidade que vem com o uso de agentes de IA.

O ChatGPT já tinha um gerador de imagens e a Microsoft já lançou vários tipos de agentes voltados para a empresa. Ambos os lançamentos, no entanto, oferecem uma nova reviravolta sobre o que estavam oferecendo – e mostra o poder de poder lançar instantaneamente um novo recurso em uma plataforma que já possui centenas de milhões de usuários. Ter esse tipo de distribuição é uma grande vantagem, pois a competição entre produtos similares aquece.

A geração de imagens 4O aumenta a barra

Agora, lançando para os usuários ChatGpt Plus, Pro, Team e Free, o OpenAI descreve a nova integração como seu “gerador de imagens mais avançado até agora”. E devo dizer que os resultados são impressionantes.

No geral, a geração de imagens 4O pode produzir cenas realistas vívidas e produzir impressionantes transformações de “transferência de estilo” de imagens carregadas com base em prompts. (Você também pode editar os principais recursos das imagens carregadas, apenas a partir de avisos também.) Com base na infinidade de imagens inundando o Chatgpt subredditesse recurso de transferência de estilo está se mostrando popular. Uma imagem O modelo criado depois que um usuário levou a mudar o meme “namorado distraído” no estilo de “South Park”, por exemplo, é honestamente meio chocante em como é o ponto de vista para a aparência visual do programa-nenhuma empresa maravilhosa criando modelos generativos de IA estão sendo inundados com ações de direitos autorais. Em outra nota, Os usuários já estão testando os limites de criar imagens de figuras públicas como Donald Trump e Elon Musk. O Openai confirmou a AI na IA de que não está restringindo o novo modelo de imagem de criar imagens de pessoas reais, exceto em casos de nudez ou violência gráfica. Isso representa uma mudança de suas restrições para Dall-e, que se recusaria a gerar imagens de pessoas reais.

Talvez o avanço mais interessante, no entanto, seja o grande salto na capacidade do modelo de gerar texto. Dall-E e outros modelos de geração de imagens anteriores geralmente criam texto ilegal, mas a geração de imagens 4O pode criar seqüências de texto longas, detalhadas e precisas de texto dentro das imagens. O primeiro exemplo em Postagem do blog do OpenAI Mostra um quadro branco inteiro de texto que é facilmente legível e preciso para o prompt.

Um ‘pesquisador’ e ‘analista’ juntam -se ao seu espaço de trabalho 365

Microsoft descreve Seus novos “agentes de raciocínio profundo” para o 365 Copilot da Microsoft como sendo projetados para “lidar com tarefas complicadas que exigem análise detalhada, pensamento metódico e entendimento diferenciado”. Com base no modelo de raciocínio O1 da OpenAI, o agente do pesquisador é voltado para pesquisas em várias etapas e se integra a plataformas externas como SalesforceAssim, ServiceNowe confluência para obter informações de todos os dados de uma empresa. Depois, há o agente do analista, que se baseia no modelo de raciocínio Open O3-Mini da IA. A Microsoft afirma que está otimizada para fazer uma análise avançada de dados no trabalho, usa o raciocínio da cadeia de pensamentos e pode executar o Python para enfrentar consultas de dados complexas. Ambos devem começar a ser lançados em abril.

Além dos novos agentes, a Microsoft também anunciou uma nova capacidade que chama de “fluxos de agentes”, que deve adicionar previsibilidade ao uso de agentes. Os fluxos de agentes fornecem fluxos de trabalho estruturados e baseados em regras que incorporam ações de IA, seguindo caminhos predefinidos e determinísticos. Isso é importante porque, como eu escrevi em Newsletter de quinta -feira passadaOs agentes da IA ​​têm problemas sérios com confiabilidade e podem ser arriscados, especialmente quando se trata de ações críticas ou dados sensíveis.

Várias empresas lançam agentes de IA apontados para “pesquisa profunda” ultimamente, mas o papel da Microsoft 365 como a plataforma central de muitas empresas – e integração com todos os outros produtos de dados que eles usam – adivinha a Microsoft uma vantagem única. O campo da IA ​​está lotado de empresas competindo com produtos semelhantes, cada um disputando a diferenciação. Essas atualizações tornam a IA avançada facilmente acessível, onde os usuários de produtos populares já operam, o que provavelmente será uma vantagem significativa no mercado. Além disso, a Microsoft e o Google se moveram para agrupar seus recursos de IA em seu software corporativo por padrão-e elevou os preços dos principais produtos-depois de permitir que os clientes optem pelos recursos da IA ​​por um custo extra. Essa é a vantagem da plataforma.

E com isso, aqui estão mais notícias da IA.

Sábio Lazzaro
sage.lazzaro@consultant.fortune.com
sagelazzaro.com

Esta história foi originalmente apresentada em Fortune.com


Publicar comentário