Solução apoiada pela FAPESP está sendo adaptada na Procuradoria Geral da Fazenda Nacional, Secretaria da Fazenda do Estado do Rio Grande do Sul, Universidade Federal de Mato Grosso do Sul e Capes (imagem: Vecstock/Freepik)
Publicado em 29/09/2025
Agência FAPESP – Um artigo produzido por pesquisadores do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP), campus de São Carlos, conquistou o prêmio de melhor trabalho apresentado durante o Latin American Symposium on Digital Government (LASDiGov), evento internacional da área de computação.
O grupo de cientistas desenvolveu uma solução inovadora usando inteligência artificial (IA) para o setor público, capaz de preservar a privacidade de dados sensíveis presentes em processos judiciais, por exemplo, e operar com eficiência mesmo em computadores comuns, informa a Assessoria de Comunicação do ICMC-USP.
O trabalho, intitulado “LLM4Gov: A privacy-preserving approach to teacher-student fine-tuning of distilled LLMs for the public sector”, apresenta um "Grande Modelo de Língua" (LLM, na sigla em inglês) treinado para garantir a segurança e anonimidade de dados confidenciais presentes em documentos judiciais, que, dessa maneira, não precisam sair do ambiente controlado pelo próprio órgão público que os detém.
O desenvolvimento da ferramenta LLM4Gov se deu no âmbito do projeto “Desenvolvimento de grandes modelos de língua para aplicações no domínio jurídico”, que é financiado pela FAPESP. O projeto tem o objetivo de desenvolver soluções de IA especificamente voltadas para órgãos públicos brasileiros e organizações que lidam com informações sensíveis.
A solução premiada utiliza uma técnica conhecida como teacher-student. Nela, um modelo de linguagem maior e mais complexo, chamado de professor, treina um segundo modelo, o aluno, que por sua vez é menor, com menos parâmetros, porém mais eficiente e que necessita de menos recursos para funcionar.
Combinado ao método de destilação, que possibilita remover informação menos relevante de um modelo para economizar recursos, o LLM aluno treinado reduz drasticamente seu tamanho e consumo de recursos computacionais. O resultado é um modelo de IA poderoso, porém compacto e de código aberto, que pode ser executado localmente em máquinas com capacidade limitada, eliminando a necessidade de enviar informações para servidores externos ou infraestruturas proprietárias, que podem ser custosas e, em sua maioria, localizadas no exterior, garantindo a seguridade e soberania dos dados brasileiros.
A iniciativa já estabeleceu parcerias importantes, trabalhando em soluções com a Procuradoria Geral da Fazenda Nacional e a Secretaria da Fazenda do Estado do Rio Grande do Sul (Sefaz-RS). Mais recentemente, iniciou um trabalho em conjunto com a Universidade Federal de Mato Grosso do Sul (UFMS) e a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes), no âmbito do Observatório da Agenda Nacional de Formação de Pessoal de Nível Superior.
O artigo premiado pode ser acessado na plataforma da Sociedade Brasileira de Computação. A premiação ocorreu em julho.