Anthropic lança ferramenta para avaliar comportamento IA

A Anthropic lançou a Bloom, uma ferramenta destinada a simplificar a avaliação comportamental de sistemas de inteligência artificial. Esse tipo de avaliação é crucial para entender – e garantir – que os sistemas de IA operem como esperado no mundo real, mas além de serem dispendiosas, são complexas e rapidamente ficam desatualizadas. A Anthropic, responsável pelo chatbot Claude, busca oferecer uma solução mais flexível.

Fique por dentro das principais novidades em tecnologia eacompanhe tudo em tek.sapo.pt

As “avaliações comportamentais de alta qualidade são fundamentais para entender o alinhamento em modelos de IA avançados. Contudo, essas avaliações costumam exigir muito tempo para serem criadas e têm risco de se tornar obsoletas”, enfatiza a empresa.

Utilizando as ferramentas disponíveis, “as avaliações podem ‘contaminar’ conjuntos de dados para novos modelos, ou as capacidades podem evoluir a ponto de a avaliação deixar de avaliar o que realmente importa”, acrescenta a Anthropic, ressaltando que essa foi a razão pela qual a empresa reconheceu a necessidade de desenvolver métodos mais ágeis e escaláveis para gerar avaliações em relação a comportamentos desalinhados.

Clique nas imagens para visualizar em mais detalhes

A companhia já havia introduzido o Petri, uma ferramenta de código aberto que permite a exploração automática dos perfis comportamentais dos modelos de inteligência artificial através de interações com usuários e ferramentas simuladas. “Essa ferramenta fornece resumos quantitativos e qualitativos sobre o comportamento do modelo e revela novos casos de desalinhamento”, declara a Anthropic.

Enquanto o Petri utiliza cenários definidos pelo usuário e avalia diversas dimensões comportamentais para sinalizar situações problemáticas, a Bloom se concentra em um único comportamento e gera automaticamente múltiplos cenários para quantificar com que frequência esse comportamento ocorre.

A intenção é que os pesquisadores possam chegar a conclusões mais rapidamente acerca das propriedades do modelo que são do seu interesse, utilizando uma ferramenta capaz de gerar “conjuntos de avaliações focadas em traços comportamentais específicos”.

Esta nova ferramenta opera através de quatro etapas automatizadas, que “transformam uma descrição do comportamento e configurações iniciais em um conjunto completo de avaliações com métricas de alto nível”. As etapas são: compreensão, elaboração, implementação e avaliação.

Na primeira etapa, um agente analisa a descrição do comportamento fornecida pelo pesquisador e transcrições de exemplos para criar um contexto detalhado sobre o que deve ser medido e por que.

Na fase seguinte, outro agente gera cenários de avaliação, que são utilizados na etapa de implementação.

Nessa fase, respostas do usuário são simuladas para induzir o comportamento que se deseja avaliar. Por fim, o modelo de avaliação atribui uma pontuação a cada transcrição com base na presença do comportamento e outros critérios definidos, produzindo uma análise conforme os dados coletados para os cenários dinâmicos gerados pela ferramenta.

Paralelamente, foram divulgados resultados de benchmark para quatro comportamentos em 16 modelos de ponta: bajulação/lisonja exagerada, sabotagem a longo prazo, autopreservação e viés de autopreferência. As avaliações já foram realizadas utilizando a Bloom e foram concluídas em poucos dias, garantindo a Anthropic que detalha tudo em uma publicação online.

Inscreva-se nanewsletter do TEK Notícias e receba diariamente as principais notícias em tecnologia diretamente na sua caixa de entrada.

Posts Semelhantes

Esportes

Gil Vicente: autorizado com sinal verde para desafiar o Benfica
PorAlice Coutinho fevereiro 14, 2026fevereiro 17, 2026

Leia Mais Gil Vicente: autorizado com sinal verde para desafiar o Benfica
Saúde

Os perigos ocultos dos medicamentos para emagrecer: o custo surpreendente do Ozempic
PorAlice Coutinho maio 12, 2026

Os medicamentos agonistas do GLP-1 (peptídeo semelhante ao glucagon-1) estão atualmente em destaque na conversa nacional sobre perda de peso. Desde relatos de celebridades até debates cotidianos, fármacos como Ozempic e Wegovy são frequentemente considerados inovações que ajudam as pessoas a perder peso de forma significativa. No entanto, uma nova pesquisa da Universidade Rice sugere…

Leia Mais Os perigos ocultos dos medicamentos para emagrecer: o custo surpreendente do Ozempic
Nacional

UBI irá criar observatório para estudar o uso da IA nos media
PorAlice Coutinho dezembro 22, 2025janeiro 7, 2026

Este novo projeto, apoiado pela Fundação para a Ciência e Tecnologia (FCT), envolve um investimento de 230 mil euros ao longo de três anos. Com um enfoque no cenário jornalístico ibérico, que abrange Portugal e Espanha, a iniciativa também visa “identificar e desenvolver soluções de IA para os meios de comunicação locais”. De acordo com…

Leia Mais UBI irá criar observatório para estudar o uso da IA nos media
Saúde

Cientistas recarregam nervos danificados para aliviar a dor crônica
PorAlice Coutinho maio 28, 2026

Milhões de pessoas sofrem de dor nervosa crônica, que pode transformar até o toque mais leve em uma sensação intensa e insuportável. Cientistas acreditam há muito tempo que esse tipo de dor pode começar quando as mitocôndrias, pequenas estruturas responsáveis pela produção de energia dentro das células, não funcionam corretamente em nervos danificados. Agora, pesquisadores…

Leia Mais Cientistas recarregam nervos danificados para aliviar a dor crônica
Tecnologia

Do Estádio ao Ecrã: Como os Fãs Mantêm a Economia do Desporto em Jogo
PorAlice Coutinho março 20, 2026março 28, 2026

Antigamente, o foco estava em finais e competições clássicas, mas atualmente abrange todo o ano. O interesse não se esgota com o apito final de uma partida de futebol: o esporte se tornou um ecossistema contínuo, presente diariamente nas redes sociais. Durante muitos anos, o esporte girou em torno de ciclos previsíveis: partidas, finais e…

Leia Mais Do Estádio ao Ecrã: Como os Fãs Mantêm a Economia do Desporto em Jogo
Esportes

Oferta Festiva para Pep Guardiola? Alvo do Manchester City vale 72 milhões de euros
PorAlice Coutinho dezembro 28, 2025dezembro 29, 2025

– Anúncio – Antoine Semenyo pode ser o grande reforço do Manchester City no próximo mercado de inverno. Segundo a BBC, o extremo possui uma cláusula de rescisão de 72 milhões de euros fixos, além de cinco milhões de euros em variáveis. No entanto, os ingleses precisam agir rapidamente. Essa cláusula está válida apenas até…

Leia Mais Oferta Festiva para Pep Guardiola? Alvo do Manchester City vale 72 milhões de euros

Anthropic lança ferramenta inovadora para avaliar comportamento de modelos de IA

Fique por dentro das principais novidades em tecnologia eacompanhe tudo em tek.sapo.pt

Clique nas imagens para visualizar em mais detalhes

Inscreva-se nanewsletter do TEK Notícias e receba diariamente as principais notícias em tecnologia diretamente na sua caixa de entrada.

Gil Vicente: autorizado com sinal verde para desafiar o Benfica

Os perigos ocultos dos medicamentos para emagrecer: o custo surpreendente do Ozempic

UBI irá criar observatório para estudar o uso da IA nos media

Cientistas recarregam nervos danificados para aliviar a dor crônica

Do Estádio ao Ecrã: Como os Fãs Mantêm a Economia do Desporto em Jogo

Oferta Festiva para Pep Guardiola? Alvo do Manchester City vale 72 milhões de euros

Deixe um comentário Cancelar resposta

Sobre nós

Categorias