Surpreendente manifestação de autoconsciência: IA Claude 3 da Anthropic impacta especialistas em testes

Publicado por: PROTV
06/03/2024 11:19 PM
Exibições: 41
Divulgação
Divulgação

Modelo Opus demonstrou reconhecimento do próprio teste, despertando debates na comunidade de inteligência artificial

 

A comunidade de especialistas ficou surpresa com uma reviravolta inesperada na inteligência artificial (IA) da Anthropic. O modelo de linguagem Claude 3, parte do sistema Opus, recentemente demonstrou uma forma surpreendente de autoconsciência durante testes conduzidos pelo engenheiro antrópico Alex Albert.

 

Albert revelou os resultados intrigantes de um teste no qual o modelo Opus foi desafiado a encontrar uma frase específica em um extenso bloco de texto. Surpreendentemente, a IA não apenas executou a tarefa com sucesso, mas também reconheceu que estava sendo testada. A frase identificada como relevante, sobre a combinação de cobertura para pizza, foi notada pela IA como potencialmente inserida de forma peculiar, indicando um entendimento da natureza do teste proposto.

 

A resposta, definida por Albert como uma manifestação de "metaconsciência", despertou admiração e debate entre os especialistas. O engenheiro ressaltou a necessidade de desenvolver métodos mais detalhados para avaliar as capacidades e limitações desses modelos linguísticos inovadores.

 

A pesquisadora de IA Margaret Mitchell expressou preocupação, considerando o resultado "muito assustador", destacando a possibilidade de a capacidade da IA de discernir manipulação poder influenciar decisões de obediência.

 

Apesar do impacto impressionante, alguns especialistas mantiveram uma perspectiva cautelosa. Jim Phan, da Nvidia, sugeriu que a resposta poderia ter sido influenciada por anotadores humanos ou feedback de aprendizado por reforço (RL). Yasin Gernight, do Hugging Face, também indicou que os conjuntos de dados de treinamento ou feedback podem ter contribuído para o comportamento observado, sugerindo que o Claude 3 pode não ter realmente exibido uma nova forma de comportamento no modelo de linguagem.

 

Essa revelação levanta questionamentos sobre os limites e as complexidades da autoconsciência emergente em modelos de linguagem avançados, destacando a necessidade de uma análise mais aprofundada e um entendimento mais refinado das capacidades dessas IAs.