Por que o Openai cedeu ao código aberto no mesmo dia que seu flexão de US $ 300 bilhões (dica: não é apenas sobre Deepseek)

Para julgar por seus feeds sociais, o CEO da Openai, Sam Altman, é um campista muito feliz, pois sua empresa entra em um sucesso atraente após o outro. A startup que ele co-fundou em 2015 justo criado US $ 40 bilhões em uma avaliação de US $ 300 bilhões, a maior rodada de financiamento de todos os tempos por uma empresa de tecnologia privada; Todos na internet parecem estar postando Imagens do estilo Ghibli do estúdio Cortesia do novo modelo de geração de imagens GPT-4O da OpenAI; e chatgpt agora tem 500 milhões de usuários semanais, contra 400 milhões no mês passado.

E, no entanto, junto com todas essas boas notícias, Altman revelou segunda-feira que o Openai está fazendo o que parece ser uma grande parte em sua estratégia: em vários meses, Altman disseO OpenAI estará lançando um modelo de código aberto.

A mudança marcou a primeira vez que a empresa lançou um modelo abertamente desde o lançamento do GPT-2 em 2019, aparentemente revertendo a mudança da empresa para modelos fechados nos últimos anos. É verdade que o próximo modelo não estará 100% aberto – como em outras empresas que oferecem modelos de IA “abertos”, incluindo Meta E Mistral, o OpenAI não oferecerá acesso aos dados usados para treinar o modelo. Ainda assim, a licença de uso permitiria que pesquisadores, desenvolvedores e outros usuários acessem o código subjacente e os “pesos” do novo modelo (que determinam como o modelo processa informações) para usar, modificar ou melhorar.

Por que a reviravolta?

Em sua superfície, a causa direta do abraço de código aberto do OpenAI pode parecer vir da China, especificamente, o surgimento da startup Deepseek, que virou o script da IA a favor da fonte aberta em janeiro. Mas de acordo com vários insiders da indústria de IA que Fortuna Falou, um conjunto de fatores mais amplo e mais sutil também está provavelmente motivando a mudança de coração de Altman em código aberto. À medida que a tecnologia de IA entra nas empresas, os clientes desejam a flexibilidade e a transparência dos modelos de código aberto para muitos usos. E à medida que a diferença de desempenho entre o OpenAi e seus concorrentes se estreita, tornou -se mais difícil para o OpenAI justificar sua abordagem 100% fechada – algo que Altman reconheceu em janeiro, quando ele admitido Aquela Deepseek havia diminuído a liderança do OpenAI na IA, que o OpenAI está “do lado errado da história” quando se trata de abordar suas tecnologias.

O OpenAI precisa de uma presença além dos modelos

Naveen Rao, vice -presidente de inteligência artificial do Databricks, disse que a mudança do Openai é mais uma admissão de que o cenário da IA está mudando. O valor está se afastando dos próprios modelos para os aplicativos ou sistemas que as organizações usam para personalizar um modelo para suas necessidades específicas. Embora existam muitas situações em que uma empresa possa querer usar um LLM de última geração, um modelo de pesos abertos permitiria que o OpenAI tenha uma presença em cenários em que os clientes não querem usar o ChatGPT, por exemplo, ou a API do desenvolvedor da empresa. Por exemplo, uma empresa financeira pode não querer que seus dados de clientes deixem sua própria infraestrutura e se mudem para uma nuvem externa, ou um negócio de manufatura pode querer IA incorporado em hardware de fábrica que não está conectado à Internet.

“O código aberto não é uma curiosidade, é uma grande parte do uso da IA”, ele me disse. “O Openai quer fazer parte disso através de sua marca e seus modelos”.

Rowan Curran, analista sênior da Forrester Research, focado na IA, concordou, dizendo que o retorno do OpenAi ao código aberto fala do ecossistema cada vez mais diverso da IA, do OpenAi, GoogleAntrópico, Amazon Meta ao Alibaba da China e Deepseek, Mistral da França, Coree do Canadá e laboratórios AI21 de Israel.

Ele disse que muitas empresas empresariais estão empolgadas com os modelos de IA de código aberto-não apenas por causa da precisão de que são ou de quão bem eles respondem perguntas, mas porque são flexíveis. O fato de serem portáteis é essencial, ele explicou – o que significa que eles podem executar em diferentes plataformas em nuvem ou mesmo no próprio data center de uma empresa, estação de trabalho, laptop ou robô, em vez de estar vinculado a um provedor.

Curran também explicou que a liberação de um modelo aberto poderia tornar os serviços do OpenAI mais atraentes para seus próprios clientes corporativos. Se o OpenAI estiver construindo um projeto para um cliente e precisar executar parte de seu trabalho no próprio data center da empresa ou em modelos ainda menores, por exemplo, eles não podem fazer isso com modelos OpenAI como 4O, porque esses funcionam de servidores baseados em nuvem. “Isso limita sua capacidade de fornecer uma solução de ponta a ponta da nuvem até a borda”, seja um laptop, um smartphone, um robô ou um carro autônomo, disse ele. Semelhante ao que o Google faz com Gemini (é a maior família de modelos fechados) e Gemma (é um modelo aberto menor), o OpenAI pode ter sua própria solução aberta sem ter que procurar modelos de código aberto de terceiros.

Um ato de equilíbrio complicado

Embora Rao não veja um modelo OpenAI de código aberto como uma grande reação aos lançamentos do Deepseek, o “Momento Deepseek” mostrou que as startups chinesas não estão mais atrasadas na corrida de IA.

“Muitos de nós no campo já sabíamos disso”, disse ele. Se o Openai não tem como alvo a comunidade de código aberto agora, ele acrescentou: “Ele perderá muita influência, boa vontade e inovação comunitária”.

Anteriormente, o Openai havia dito que um dos motivos pelos quais eles não podiam divulgar modelos abertos é porque as empresas chinesas tentariam usar sua tecnologia para melhorar seus próprios modelos. Em janeiro, o Openai divulgou um comunicado que dizia: “É extremamente importante que estamos trabalhando em estreita colaboração com o governo dos EUA para melhor proteger os modelos mais capazes dos esforços de adversários e concorrentes para levar a tecnologia dos EUA”. E, de fato, embora a DeepSeek não divulgasse os dados usados para treinar seu modelo R1, há indicações de que ele pode ter usado saídas do Open O1 do OpenAI para iniciar o treinamento das habilidades de raciocínio do modelo.

À medida que o Openai agora se segue em direção a código aberto novamente, ele se encontra tentando reconciliar mensagens aparentemente contraditórias. Testemunha Opening Oficial de Assuntos Globais do OpenAI Chris Lehane’s LinkedIn postNa segunda-feira: “Para a IA democrática liderada pelos EUA prevalecer sobre a IA autoritária liderada por CCP, está ficando cada vez mais claro que precisamos encontrar um equilíbrio entre modelos abertos e fechados. O código aberto coloca ferramentas poderosas nas mãos de desenvolvedores em todo o mundo, expandindo o alcance dos principais modelos democratas e os inovadores que se fecham em todos os lugares, que podem ser ampliados.

“Eles estão definitivamente falando de ambos os lados”, disse Rao, descrevendo as mensagens do Openai como “ainda é realmente perigoso (lançar modelos abertos), mas precisamos aproveitar a comunidade que está construindo e tem influência”.

Há também um ato de equilíbrio comercial para o OpenAI: ele não pode lançar um modelo aberto que compete com seus próprios pagos. Para direcionar os desenvolvedores de IA com influência, Rao sugeriu que o Openai divulgaria um modelo grande – mas não muito grande.

Jogando sombra na meta

Se o movimento estratégico do OpenAI para o código aberto, um modelo não estiver exclusivamente em reação a Deepseek, pode muito bem ser sobre jogar sombra em outro grande concorrente de código aberto: a Meta deve lançar a quarta iteração de sua família de modelos de código aberto, Llama, no final deste mês. A LLAMA foi divulgada notavelmente com uma licença aberta, exceto por serviços com mais de 700 milhões de usuários ativos mensais – significado para limitar empresas como o Openai Building nele.

“Não faremos nada bobo como dizer que você não pode usar nosso modelo aberto se seu serviço tiver mais de 700 milhões de usuários ativos mensais”, Altman Postado ontem sobre X.

“A Meta se tornou o portador padrão da IA de código aberto, pelo menos no Ocidente”, disse Rao. “Se eles querem arrancar alguma influência no ecossistema, precisam assumir a meta.”

No entanto, Curran, da Forrester, disse que os vagos comentários de Altman à parte, não há razão para pensar que o modelo de código aberto da OpenAI será mais transparente – em termos de dados ou métodos de treinamento, por exemplo – do que qualquer outra versão aberta comercial da Meta ou Mistral.

“Espero que seja muito mais opaco e fechado em comparação com outros modelos abertos”, disse ele, “com significativamente menos transparência”.

Esta história foi originalmente apresentada em Fortune.com