O que é GPT-4 e como ele difere do ChatGPT?

A OpenAI, startup apoiada pela Microsoft, abalou o mundo quando lançou em 30 de novembro do ano passado o amplamente popular ChatGPT. Agora, na última atualização, a empresa lançou em 14 de março uma versão mais poderosa do modelo de inteligência artificial, o GPT-4, que sucede a versão anterior 3.5 usada no ChatGPT.

Em termos simples, o GPT-4 é multimodal, o que significa que pode gerar conteúdo a partir de prompts de imagem e texto. Na essência GPT-4 é uma máquina para criar texto. Mas é muito boa nisso, e ser muito boa em criar texto acaba sendo confundida como alguém capaz de “entender e raciocinar” sobre o mundo.

“GPT-4 pode resolver problemas difíceis com maior precisão, graças ao seu conhecimento geral mais amplo e habilidades de resolução de problemas”

O sistema pode passar no exame da ordem dos advogados, resolver quebra-cabeças lógicos e até dar uma receita para usar as sobras com base em uma foto da sua geladeira – mas seus criadores alertam que ele também pode espalhar fatos falsos, incorporar ideologias perigosas e até enganar as pessoas, fazendo tarefas em seu nome.

E assim:

  • se você der ao GPT-4 uma pergunta de um exame da ordem dos EUA, ele escreverá um ensaio que demonstra conhecimento jurídico;
  • se você lhe der uma molécula medicinal e pedir variações, parecerá aplicar conhecimentos bioquímicos;
  • e se você pedir para ele contar uma piada sobre um peixe, ele parecerá ter senso de humor – ou pelo menos uma boa memória para piadas ruins.

O GPT-4 vai além do ChatGPT, pois possui um banco de memória mais amplo e uma contagem máxima de tokens de 32.768, o que se traduz em cerca de 64.000 palavras ou 50 páginas de texto.

É o mesmo que ChatGPT?

Não exatamente. Se o ChatGPT é o carro, então e o GPT-4 é o motor: uma poderosa tecnologia geral que pode ser moldada para vários usos diferentes, inclusive para uso em outras ferramentas como o Bing.

Com relação a versão anterior 3.5:

  • ele pode responder melhor a perguntas de matemática,
  • é levado a dar respostas falsas com menos frequência,
  • pode pontuar bastante em testes padronizados

O GPT-4 supera o ChatGPT ao pontuar em percentis aproximados mais altos entre os participantes do teste”, disse o comunicado da OpenAI. “Passamos 6 meses tornando o GPT-4 mais seguro e mais alinhado. O GPT-4 tem 82% menos probabilidade de responder a solicitações de conteúdo não permitido e 40% mais probabilidade de produzir respostas factuais do que o GPT-3.5 em nossas avaliações internas“, disse o especialista da OpenAI.

O GPT-4 tem um senso de ética mais firmemente incorporado ao sistema do que a versão antiga: o ChatGPT pegou seu mecanismo original, GPT-3.5, e adicionou filtros na parte superior para tentar impedir que ele desse respostas a perguntas maliciosas ou prejudiciais. Agora, esses filtros são incorporados diretamente ao GPT-4, o que significa que o sistema se recusará educadamente a executar tarefas como classificar raças por atratividade, contar piadas sexistas ou fornecer diretrizes para sintetizar sarin.

O OpenAI incorporou mais feedback humano, incluindo o enviado pelos próprios usuários do ChatGPT, a fim de melhorar e aprimorar o comportamento do GPT-4. A empresa colaborou com mais de 50 especialistas para feedback inicial em domínios, incluindo segurança e proteção de IA.

De acordo com a OpenAI, mesmo com as melhorias feitas, GPT-4 tem algumas limitações semelhantes às de suas versões anteriores e é “menos capaz que os humanos em muitos cenários do mundo real“. O GPT-4 ainda luta com preconceitos sociais, alucinações e alertas adversários. Respostas imprecisas são conhecidas como “alucinações”, que têm sido um desafio para muitos programas de IA.

Aplicações

Mas o GPT-4 pode ser usado para alimentar mais do que chatbots, por exemplo:

  • Duolingo construiu uma versão dele em seu aplicativo de aprendizado de idiomas que pode explicar onde os alunos erraram, em vez de simplesmente dizer a eles a coisa certa a dizer;
  • Stripe está usando a ferramenta para monitorar sua sala de bate-papo em busca de golpistas;
  • Be My Eyes está usando um novo recurso, entrada de imagem, para construir uma ferramenta que pode descrever o mundo para uma pessoa cega e responder a perguntas de acompanhamento sobre isso.

O GPT-4 está incorporado à versão paga (US$ 20,00 por mês) ChatGPT Plus. Também está e disponível comercialmente para desenvolvedores de aplicações (Apps) via APIs (interfaces de programas de aplicação) pelo custo de US$ 0.0200 por 1000 tokens.

Veja mais no blog da OpenAI (inglês) em https://openai.com/product/gpt-4 e https://openai.com/research/gpt-4.

Sobre a tecnologia

O GPT-4 (Generative Pré-trained Transformer – versão 4), uma ferramenta de Processamento de Linguagem natural (NLP) assim como os anteriores, incluindo a versão 3.5 utilizada no ChatGPT, foi construído sobre uma classe de tecnologias chamada Modelos de Linguagem Grandes (LLMs).

Um LLM é uma arquitetura de modelo de rede neural baseada em um componente chamado transformador. As tecnologias de transformadores foram originalmente desenvolvidas pelo Google em 2017 e têm sido objeto de intensa pesquisa e desenvolvimento desde então. Os LLMs trabalham revisando enormes volumes de texto, identificando as maneiras como as palavras se relacionam umas com as outras e construindo um modelo que lhes permite reproduzir textos semelhantes.

É importante ressaltar que, quando fazem uma pergunta, eles não estão “procurando” uma resposta. Em vez disso, eles estão produzindo uma sequência de palavras ao prever qual palavra seguiria melhor a anterior, levando em consideração o contexto mais amplo das palavras anteriores a ela. Em essência, eles estão fornecendo uma resposta de “senso comum” a uma pergunta. Isso também é conhecido como IA Generativa.

Embora os LLMs mais poderosos tenham mostrado sua capacidade de produzir respostas amplamente precisas em uma gama surpreendentemente ampla de tarefas, a precisão factual dessas respostas não pode ser garantida.

Uma Rede Neural Artificial usada em Aprendizagem Profunda (Deep Learning) é composta por um grande número de “neurônios”, que são fórmulas matemáticas simples que passam os resultados de seus cálculos para um ou mais neurônios do sistema. As conexões entre esses neurônios recebem “pesos” que definem a força do sinal entre os neurônios. Esses pesos também são chamados de parâmetros.

Um dos modelos por trás do ChatGPT (gpt-3.5-turbo) tem 175 bilhões de parâmetros. O número de parâmetros do GPT-4 não foi informado.

A dimensão destes modelos tem consequências importantes para o seu desempenho, mas também o custo e a complexidade da sua utilização. Por um lado, modelos maiores tendem a produzir textos mais semelhantes aos humanos e são capazes de lidar com tópicos para os quais podem não ter sido especificamente preparados. Por outro lado, construir o modelo e usar o modelo é extremamente intensivo em termos computacionais.

Não é por acaso que os modelos maiores e de melhor desempenho vieram de empresas gigantes de tecnologia ou startups financiadas por essas empresas: o desenvolvimento desses modelos provavelmente custa bilhões de dólares em computação em nuvem.

O GPT-4 utiliza-se também de uma Aprendizagem por Reforço de Feedback Humano (RLHF), uma técnica usada para alinhar LLMs com intenções humanas, baseada no treinamento de um modelo de recompensa para imitar o feedback e as intenções humanas. Este treinamento usa pares de geração de prompts de um conjunto de dados predefinidos, que leva um prompt e sua conclusão correspondente para gerar uma única “recompensa” ou uma pontuação de quão boa foi a conclusão. Esse modelo de recompensa é então alimentado em um pipeline com um LLM pré-treinado ou ajustado para melhorar constantemente os resultados do LLM, com base nas intenções humanas.

Resumindo

O GPT-4 é uma nova versão do modelo de inteligência artificial criado pela OpenAI, que sucede o ChatGPT. O GPT-4 é multimodal, o que significa que pode gerar conteúdo a partir de prompts de imagem e texto, e possui um banco de memória mais amplo e uma contagem máxima de tokens de 32.768 (aproximadamente 50 páginas de texto). Ele é capaz de resolver problemas difíceis com maior precisão, graças ao seu conhecimento geral mais amplo e habilidades de resolução de problemas. Em comparação com o ChatGPT, o GPT-4 também possui um senso de ética mais firmemente incorporado ao sistema, e filtros incorporados para evitar respostas maliciosas ou prejudiciais. O GPT-4 pode ser utilizado para alimentar diferentes ferramentas, como chatbots, aplicativos de aprendizado de idiomas, monitoramento de salas de bate-papo e tecnologia assistiva para pessoas cegas. Ele está incorporado à versão paga do ChatGPT Plus e disponível comercialmente para desenvolvedores via APIs.

Se gostou deste conteúdo, por favor, compartilhe este post. 

Sobre mim: aqui. Contato: aqui.

Abraços, @neigrando

Referências

Este post têm como base os artigos do blog da OpenAI:

Bem como os seguintes posts de reportagem:

  • What is GPT-4 and how does it differ from ChatGPT? (The Guardian)
  • What is GPT-4 – multimodal AI – & how is it different from Microsoft’s ChatGPT? (Economic Times)
  • GPT-4 vs. ChatGPT-3.5: What’s the Difference? (PC magazine)

Artigos relacionados

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s