OpenAI treinou um modelo GPT-4 para gerar respostas e aprender com o feedback humano em testes entre dois modelos de IA.
A OpenAI desenvolveu uma variante do GPT-4 chamada CriticGPT, com o objetivo de identificar falhas em respostas produzidas pelo ChatGPT. Segundo a empresa, ao utilizar o CriticGPT para revisar os textos gerados pelo ChatGPT, os usuários conseguem resolver os problemas sem assistência extra em 60% das situações. O sistema de modelos GPT-4 que alimenta o ChatGPT é aprimorado por meio do ‘aprendizado de reforço a partir do feedback humano’ (RLHF), no qual a plataforma se aperfeiçoa com base nas avaliações dos usuários, também conhecidos como treinadores de inteligência artificial.
Essa nova ferramenta, o CriticGPT, representa um avanço significativo na capacidade de correção automática de respostas geradas pelo ChatGPT. Ao utilizar o CriticGPT, os usuários podem aprimorar a qualidade dos textos sem depender de intervenção externa em grande parte das situações. O CriticGPT é um exemplo de como a inteligência artificial pode ser empregada de forma eficaz para melhorar a precisão e confiabilidade das interações geradas pelo ChatGPT. inteligência artificial em buscas
CriticGPT: A Nova Ferramenta de Correção no Aprendizado de Máquina
À medida que o ChatGPT evolui, suas respostas geradas passam por um processo de reforço contínuo. No entanto, a complexidade dos erros que surgem pode desafiar a percepção dos treinadores de IA. É aí que o CriticGPT entra em ação, como uma ferramenta valiosa de correção.
O CriticGPT, desenvolvido para aprimorar o processo de aprendizado de máquina, tem se mostrado uma adição crucial ao cenário de IA. Com a promessa de incorporar modelos semelhantes ao CriticGPT ao processo de reforço com feedback humano, a empresa visa enriquecer ainda mais a qualidade das respostas geradas.
Embora as sugestões do CriticGPT não sejam infalíveis, elas desempenham um papel fundamental na detecção de problemas sutis que poderiam passar despercebidos. A interação entre o feedback humano e os insights da IA promete elevar a precisão e a confiabilidade das respostas geradas.
Um exemplo concreto do impacto do CriticGPT foi observado nos testes realizados entre os dois modelos. Os resultados revelaram que, em 63% dos casos, as correções feitas pelo CriticGPT superaram as do ChatGPT. Essa melhoria significativa na qualidade das respostas destaca a importância da nova ferramenta no processo de aprimoramento contínuo.
Além de oferecer correções mais precisas, o CriticGPT também se destaca por reduzir ocorrências de alucinações, um aspecto crucial para garantir a veracidade das informações geradas. No entanto, é importante ressaltar que a ferramenta possui limitações e pode encontrar obstáculos em tarefas extremamente complexas.
Com o avanço do CriticGPT e o constante feedback dos usuários, espera-se que a ferramenta se torne ainda mais especializada e eficaz. A colaboração entre o conhecimento humano e a inteligência artificial promete revolucionar a forma como lidamos com testes e avaliações de modelos de IA, impulsionando a inovação e a excelência no campo da tecnologia.
Fonte: © CNN Brasil
Comentários sobre este artigo