durante o passado seis meses, testemunhamos alguns desenvolvimentos incríveis em IA. O lançamento de Stable Diffusion mudou para sempre o mundo da arte, e o ChatGPT-3 abalou a Internet com sua capacidade de escrever músicas, imitar trabalhos de pesquisa e fornecer respostas abrangentes e aparentemente inteligentes para as perguntas mais frequentes no Google.

Esses avanços na IA generativa oferecem mais evidências de que estamos à beira de uma revolução da IA.

No entanto, a maioria desses modelos de IA generativa são modelos fundamentais: sistemas de aprendizado não supervisionados de alta capacidade que treinam em grandes quantidades de dados e exigem milhões de dólares em poder de processamento para isso. Atualmente, apenas instituições bem financiadas com acesso a muito poder de GPU são capazes de construir esses modelos.

A maioria das empresas que desenvolve a IA da camada de aplicativos que está impulsionando a adoção generalizada da tecnologia ainda depende do aprendizado supervisionado, usando grandes faixas de dados de treinamento rotulados. Apesar das proezas impressionantes dos modelos básicos, ainda estamos nos primeiros dias da revolução da IA ​​e vários gargalos estão impedindo a proliferação da IA ​​na camada de aplicativos.

A jusante do conhecido problema de rotulagem de dados, existem gargalos de dados adicionais que tornarão mais difícil para a IA ser desenvolvida posteriormente e implantada em ambientes de produção.

Essas questões são o motivo pelo qual, apesar da promessa inicial e das inundações de investimento, tecnologias como carros autônomos estão a apenas um ano desde 2014.

Esses empolgantes modelos de prova de conceito têm um bom desempenho em conjuntos de dados de referência em ambientes de pesquisa, mas lutam para prever com precisão quando publicados no mundo real. Um grande problema é que a tecnologia se esforça para atender ao limite de desempenho mais alto exigido em ambientes de produção de alto risco e falha em atender a importantes referências de robustez, confiabilidade e capacidade de manutenção.

Por exemplo, esses modelos geralmente não conseguem lidar com exceções e casos extremos; portanto, os carros autônomos confundem os reflexos das bicicletas com as próprias bicicletas. Eles não são confiáveis ​​nem robustos, e é por isso que um robô barista faz um cappuccino perfeito duas em cinco vezes, mas derrama o copo nas outras três.

Como resultado, a lacuna de produção de IA, a lacuna entre “isso é legal” e “isso é útil”, tem sido muito maior e mais formidável do que os engenheiros de ML previram.

Contraintuitivamente, os melhores sistemas também têm a maior interação humana.

Felizmente, à medida que mais e mais engenheiros de ML adotaram uma abordagem centrada em dados para o desenvolvimento de IA, a implementação de estratégias de aprendizado ativo aumentou. As empresas mais sofisticadas aproveitarão essa tecnologia para superar a lacuna de produção de IA e construir modelos capazes de rodar em estado selvagem mais rapidamente.

O que é aprendizagem ativa?

O aprendizado ativo torna o treinamento de um modelo supervisionado um processo iterativo. O modelo treina em um subconjunto inicial de dados rotulados de um grande conjunto de dados. Em seguida, ele tenta fazer previsões sobre o restante dos dados não rotulados com base no que aprendeu. Os engenheiros de ML avaliam a precisão do modelo em suas previsões e, usando uma variedade de funções de aquisição, podem quantificar o benefício adicional de desempenho de anotar uma das amostras não rotuladas.

Ao expressar incerteza em suas previsões, o modelo decide por si mesmo quais dados adicionais serão mais úteis para seu treinamento. Ao fazer isso, você pede aos anotadores que forneçam mais exemplos apenas desse tipo específico de dados para que você possa treinar mais intensivamente nesse subconjunto durante sua próxima rodada de treinamento. Pense nisso como questionar um aluno para descobrir onde está sua lacuna de conhecimento. Depois de saber quais problemas estão faltando, você pode fornecer a eles livros didáticos, apresentações e outros materiais para que possam focar seu aprendizado para entender melhor aquele aspecto específico do assunto.

Com o aprendizado ativo, o treinamento do modelo passa de um processo linear para um circular com um forte ciclo de feedback.

Por que empresas sofisticadas devem estar preparadas para aproveitar o aprendizado ativo

O aprendizado ativo é fundamental para preencher a lacuna entre a prototipagem e o aumento da confiabilidade do modelo.

É um equívoco comum sobre os sistemas de IA como um software estático, mas os sistemas de IA devem aprender e evoluir constantemente. Caso contrário, eles cometem os mesmos erros repetidamente ou, quando soltos na natureza, encontram novos cenários, cometem novos erros e não têm a chance de aprender com eles.