Meta cria modelo de IA que prevê a resposta do cérebro humano a estímulos visuais e sonoros

Meta cria modelo de IA que prevê a resposta do cérebro humano a estímulos visuais e sonoros

O TRIBE v2, criado pela equipe de pesquisa FAIR da Meta, é um modelo fundamental que foi treinado com mais de 500 horas de registros de ressonância magnética funcional de 700 indivíduos, com o objetivo de desenvolver um gêmeo digital da atividade neuronal.

A equipe da Meta, conhecida como FAIR, apresentou o TRIBE v2 (Trimodal Brain Encoder), um modelo de inteligência artificial que consegue prever como o cérebro humano reage quase a qualquer estímulo visual ou sonoro. Esta nova versão representa um grande avanço em relação à versão original do TRIBE, que foi premiada no desafio Algonauts 2025 com uma arquitetura que se baseou em dados de apenas quatro indivíduos.

Mantenha-se informado sobre as novidades em tecnologia e acompanhe tudo no tek.sapo.pt

A nova versão aumenta significativamente sua escala, utilizando mais de 500 horas de registros de ressonância magnética funcional de mais de 700 voluntários expostos a uma ampla variedade de conteúdos, como vídeos, podcasts, imagens e textos. O modelo integra três codificadores especializados que processam simultaneamente as três principais modalidades sensoriais. Para textos, utiliza o LLaMA 3.2 da própria Meta, o Wav2Vec-BERT para áudio e o V-JEPA 2 para vídeos.

Um transformador temporal gerencia a sequência dos diferentes tipos de estímulos, tarefas e indivíduos. Em seguida, um bloco de previsão específico para cada sujeito converte todos os dados coletados em atividade cerebral simulada, em várias regiões do cérebro que foram captadas pela ressonância magnética. A capacidade que mais atrai a comunidade científica é a generalização sem treinamento adicional, denominada tecnicamente de zero-shot.

Assim, o modelo consegue prever a atividade cerebral de indivíduos que nunca viu antes, utilizando idiomas diferentes daqueles usados no seu treinamento e para tarefas completamente novas, sem precisar de dados adicionais. Em algumas situações, suas previsões sobre a resposta média de um grupo são mais precisas do que os registros de participantes reais, sugerindo que o modelo conseguiu identificar padrões neurais robustos o suficiente para superar a variabilidade entre os indivíduos.

Resultados do modelo TRIBE v2 da META em comparação com outros modelos existentes.

As implicações práticas são especialmente relevantes para o campo da neurociência computacional, onde o alto custo e a complexidade de realizar ressonâncias magnéticas funcionais limitam significativamente o progresso da pesquisa. Com a ajuda de um “gêmeo digital” da atividade neuronal, os pesquisadores podem testar hipóteses por meio de simulações antes de avançar para estudos com humanos.

Dessa forma, será possível acelerar a compreensão de distúrbios neurológicos, como afasia ou dificuldades de processamento sensorial, além de contribuir para o desenvolvimento de interfaces cérebro-computador.

A Meta disponibilizou o modelo, o código-fonte e uma demonstração interativa em acesso aberto para a comunidade científica, que pode ser acessada através da página dedicada em aidemos.atmeta.com/tribev2.

Inscreva-se na newsletter do TEK Notícias e receba as principais notícias de tecnologia diariamente em sua caixa de entrada.

Posts Semelhantes

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *