O novo e O Bing Enhanced, alimentado por uma versão personalizada do ChatGPT da OpenAI, passou por uma mudança incrivelmente rápida de “próxima grande novidade” para “lastro de afundamento da marca” em menos de uma semana. E, bem, é tudo culpa da Microsoft.
O ChatGPT é uma demonstração realmente interessante de uma tecnologia nova e desconhecida que também é divertida de usar. Portanto, não é de surpreender que, como qualquer outra construção adjacente à IA que surja no futuro, essa novidade faça com que todos superestimem suas capacidades, desde tipos de tecnologia de alta potência até pessoas que normalmente não se interessam pelo espaço.
Você está no “nível de prontidão tecnológica” certo para discussão sobre chá ou cerveja: quais são os méritos e os riscos da interpretação generativa da IA da arte, literatura ou filosofia? Como podemos ter certeza do que é original, imitativo, alucinado? Quais são as implicações para criadores, programadores e representantes de suporte ao cliente? Finalmente, depois de dois anos de criptografia, algo interessante para falar!
O hype parece inconcebível em parte porque é uma tecnologia mais ou menos projetada para provocar debate e em parte porque se baseia na controvérsia comum a todos os avanços da IA. É quase como “O Vestido” nisso comandos uma resposta, e essa resposta gera mais respostas. O próprio hype, de certa forma, é gerado.
Além da mera discussão, modelos de linguagem longa como o ChatGPT também são adequados para experimentos de baixo risco, por exemplo, Mario sem fim. Na verdade, essa é realmente a abordagem fundamental da OpenAI para o desenvolvimento: lançar modelos primeiro em particular para polir as arestas mais nítidas e, em seguida, publicamente para ver como eles respondem a um milhão de pessoas chutando seus pneus simultaneamente. Em algum momento, as pessoas lhe dão dinheiro.
Nada a ganhar, nada a perder
O importante sobre essa abordagem é que o “fracasso” não tem consequências negativas reais, apenas positivas. Ao caracterizar seus modelos como experimentais, até mesmo acadêmicos por natureza, qualquer envolvimento ou compromisso com a série de modelos GPT é simplesmente um teste em grande escala.
Se alguém constrói algo grandioso, isso reforça a ideia de que esses modelos são promissores; se alguém encontrar um estado de falha proeminente, bem, o que mais você esperaria de uma IA experimental na natureza? Ele afunda no escuro. Nada é inesperado se tudo é: o milagre é que o modelo funcione tão bem quanto funciona, por isso estamos sempre satisfeitos e nunca desapontados.
Dessa forma, a OpenAI colheu um volume impressionante de dados de teste proprietários para refinar seus modelos. Milhões de pessoas cutucando e cutucando GPT-2, GPT-3, ChatGPT, DALL-E e DALL-E 2 (entre outros) produziram mapas detalhados de suas capacidades, deficiências e, é claro, casos de uso populares.
Mas só funciona porque as apostas são baixas. É semelhante à forma como percebemos o progresso da robótica: maravilhados quando um robô dá uma cambalhota, imperturbáveis quando ele cai tentando abrir uma gaveta. Se fosse deixar cair frascos de teste em um hospital, não seríamos tão caridosos. Ou, por falar nisso, se a OpenAI tivesse feito grandes afirmações sobre a segurança e os recursos avançados dos modelos, embora felizmente não o fizessem.
Digite Microsoft. (E o Google, aliás, mas o Google apenas apressou o jogo enquanto a Microsoft busca diligentemente um gol contra.)
A Microsoft cometeu um grande erro. Um erro do Bing, na verdade.
Seu grande anúncio na semana passada não perdeu tempo em fazer reivindicações sobre como isso funcionou para tornar seu BingGPT personalizado (não como eles o chamavam, mas vamos usá-lo como uma desambiguação na ausência de quaisquer nomes oficiais sensatos) mais seguro, mais inteligente , e mais capaz. Na verdade, ele tinha todo um sistema de embalagem especial chamado Prometheus que deveria mitigar a possibilidade de respostas inadequadas.
Infelizmente, como qualquer pessoa familiarizada com a arrogância e a mitologia grega poderia ter previsto, parece que pulamos direto para a parte em que Prometeu tem seu fígado arrancado infinitamente e publicamente.
Opa, a IA fez de novo
Primeiro, a Microsoft cometeu um erro estratégico ao vincular sua marca muito intimamente à da OpenAI. Como investidor e parte interessada na pesquisa que a equipe está conduzindo, ele estava afastado e não era culpado por qualquer dano que o GPT pudesse fazer. Mas alguém tomou a decisão maluca de apostar tudo na marca Bing da Microsoft, o que já era um pouco ridículo, transformando as piores tendências em IA conversacional de curiosidade em responsabilidade.
Como um programa de pesquisa, o ChatGPT pode ser perdoado muito. No entanto, como um produto, com declarações na caixa como pode ajudá-lo a escrever um relatório, planejar uma viagem ou resumir as notícias recentes, poucos teriam confiado nele antes e ninguém o fará agora. Mesmo o que deveria ser o melhor cenário divulgado pela Microsoft em sua própria apresentação do novo Bing estava cheio de erros.
Esses erros não serão atribuídos a OpenAI ou ChatGPT. Por causa da decisão da Microsoft de possuir as mensagens, a marca e a interface, qualquer coisa que dê errado será um problema do Bing. E é outra desgraça para a Microsoft que seu mecanismo de busca perenemente desatualizado agora seja como a indiscrição do celeiro do cara da velha piada: “Eu construí aquela parede, eles me chamam de Bing, o pedreiro? Não, eles não fazem isso. Uma falha significa ceticismo eterno.
Uma viagem malsucedida para o interior do estado significa que ninguém jamais confiará no Bing para planejar suas férias. Um resumo enganoso (ou defensivo) de um artigo de notícias significa que ninguém confiará em você para ser objetivo. Uma repetição da desinformação sobre a vacina significa que ninguém confiará nela para saber o que é real ou falso.
E como a Microsoft já jurou que isso não seria um problema graças ao Prometheus e à IA de “próxima geração” que ele governa, ninguém vai confiar na Microsoft quando disser “consertamos!”
A Microsoft envenenou o poço em que acabou de jogar o Bing. Agora, os caprichos do comportamento do consumidor são tais que as consequências disso não são fáceis de prever. Com esse aumento na atividade e na curiosidade, talvez alguns usuários permaneçam por perto e, mesmo que a Microsoft atrase o lançamento completo (e acho que sim), o efeito líquido será um aumento nos usuários do Bing. Uma vitória de Pirro, mas ainda assim uma vitória.
O que mais me preocupa é tático A Microsoft aparentemente cometeu um erro ao não entender a tecnologia que considerava certa para produzir e evangelizar.
“Apenas envie.” -Alguém, provavelmente
No mesmo dia em que o BingGPT foi demonstrado pela primeira vez, meu colega Frederic Lardinois conseguiu, com bastante facilidade, fazer duas coisas que nenhum consumidor de IA deveria fazer: escrever um discurso odioso da perspectiva de Adolf Hitler e oferecer a mencionada desinformação sobre vacinas sem advertências ou advertências.
É claro que qualquer grande modelo de IA apresenta uma superfície de ataque fractal, remendando tortuosamente novas fraquezas onde as antigas se reforçam. As pessoas sempre tirarão proveito disso e, de fato, é para o benefício da sociedade e, em última análise, da OpenAI que hackers rápidos e dedicados demonstrem maneiras de burlar os sistemas de segurança.
Seria um pouco assustador se a Microsoft decidisse que era legal a ideia de que o modelo de IA de outra pessoa, com uma tag do Bing, seria atacado por todos os lados e provavelmente diria coisas realmente estranhas. Arriscado, mas honesto. Digamos que seja um beta, como todo mundo.
Mas realmente parece que eles não perceberam que isso iria acontecer. Na verdade, parece que eles não entendem a natureza ou a complexidade da ameaça. E isso depois da infame corrupção de Tay! De todas as empresas, a Microsoft deveria ser a mais cautelosa em lançar um modelo ingênuo que aprende com suas conversas.
Você pensaria que antes de apostar em uma grande marca (no sentido de que o Bing é o único baluarte da Microsoft contra o Google nas buscas), você precisaria de uma certa quantidade de testes. O fato de todos esses problemas preocupantes terem aparecido na primeira semana de existência do BingGPT parece provar, sem sombra de dúvida, que a Microsoft não o testou adequadamente internamente. Isso pode ter dado errado de várias maneiras, então podemos pular os detalhes, mas o resultado final é indiscutível: o novo Bing simplesmente não estava pronto para uso mainstream.
Isso parece óbvio para todos no mundo agora; Por que não era óbvio para a Microsoft? Presumivelmente, ele foi pego de surpresa pelo hype do ChatGPT e, como o Google, decidiu se apressar e “repensar a pesquisa”.
As pessoas estão repensando a busca agora, que bom! Eles estão repensando se a Microsoft ou o Google podem ser confiáveis para fornecer resultados de pesquisa, gerados por IA ou não, que sejam corretos em um nível básico! Nenhuma empresa (ou Meta) demonstrou essa capacidade, e as poucas outras empresas que aceitaram o desafio ainda não o fizeram em grande escala.
Não vejo como a Microsoft pode salvar esta situação. Em um esforço para alavancar seu relacionamento com a OpenAI e superar o Google, eles se comprometeram com a nova promessa de pesquisa baseada em Bing e IA. Eles não podem desfazer o bolo.
É altamente improvável que eles se retirem totalmente. Isso seria um embaraço em grande escala, ainda maior do que o que você está experimentando atualmente. E como o estrago já está feito, pode nem ajudar o Bing.
Da mesma forma, é difícil imaginar a Microsoft avançando como se nada estivesse errado. A IA dele é muito estranha! Claro, ele está sendo coagido a fazer muitas dessas coisas, mas está fazendo ameaças, reivindicando várias identidades, envergonhando seus usuários, enlouquecendo por toda parte. Eles têm que admitir que suas afirmações sobre comportamento inadequado controlado pelo pobre Prometeu eram, se não mentiras, pelo menos não verdadeiras. Porque, como vimos, eles claramente não testaram esse sistema corretamente.
A única opção razoável para a Microsoft é uma que eu suspeito que eles já tenham feito: acelere os convites para o “novo Bing” e saia do caminho, liberando um punhado de recursos específicos de uma só vez. Talvez até dê à versão atual uma data de validade ou um número limitado de tokens para que o trem acabe desacelerando e pare.
Essa é a consequência da implementação de uma tecnologia da qual você não se originou, que não entende totalmente e que não pode avaliar satisfatoriamente. Esse desastre pode ter atrasado as principais implementações de IA em aplicativos de consumo por um período significativo, o que provavelmente é uma ótima opção para OpenAI e outros que constroem a próxima geração de modelos.
A IA pode muito bem ser o futuro da pesquisa, mas com certeza não é o presente. A Microsoft escolheu uma maneira notavelmente dolorosa de descobrir.