Fapesp

A FAPESP e os Objetivos de Desenvolvimento Sustentável


Enfrentamento da pandemia exige infraestrutura para compartilhamento de dados abertos


Enfrentamento da pandemia exige infraestrutura para compartilhamento de dados abertos

Em seminário on-line promovido pela FAPESP, pesquisadores da França, dos Estados Unidos e do Brasil debateram como a criação de repositórios estruturados pode ajudar a encontrar mais rapidamente respostas à COVID-19 (imagem: Gerd Altmann/Pixabay)

Publicado em 23/04/2021

Maria Fernanda Ziegler | Agência FAPESP – O gerenciamento de dados obtidos em pesquisas científicas sempre foi de extrema importância para subsidiar descobertas nas mais diversas áreas de conhecimento. Durante a pandemia de COVID-19 ficou evidente que o compartilhamento de dados abertos estruturados entre pesquisadores de diferentes países e comunidades pode, até mesmo, salvar vidas.

“Nesse momento de urgência global que vivemos é preciso juntar todas as informações já produzidas para, a partir delas, gerar evidências que permitam a diferentes comunidades e países estarem mais bem preparados para enfrentar esse grande desafio”, disse Luiz Eugênio Mello, diretor científico da FAPESP, na abertura do seminário on-line “Open Data under the COVID-19 pandemic”, o 4º FAPESP COVID-19 Research Webinars, realizado em 5 de agosto.

De acordo com Mello, é a partir de dados de qualidade – oriundos de pesquisas anteriores, de levantamentos epidemiológicos ou de atendimentos clínicos – que a comunidade científica pode identificar dificuldades que precisam ser superadas e propor soluções para o enfrentamento da pandemia.

“A FAPESP foi pioneira ao lançar no dia 1o de julho o primeiro repositório de dados abertos do Brasil, com dados demográficos e de exames clínicos e laboratoriais de pacientes que fizeram testes para COVID-19 no país”, disse Claudia Bauzer Medeiros, professora do Instituto de Computação da Universidade Estadual de Campinas (Unicamp) e participante do projeto.

O COVID-19 Data Sharing/BR abriga dados abertos e anonimizados de, inicialmente, mais de 177 mil pacientes, 9.634 dados de desfecho e um total de quase 5 milhões de resultados de exames clínicos e laboratoriais realizados em todo o país pelo Grupo Fleury e na cidade de São Paulo pelos hospitais Israelita Albert Einstein e Sírio-Libanês desde novembro de 2019.

A despeito da grande importância e dos benefícios do compartilhamento de dados da COVID-19, a empreitada surge em meio a grandes desafios. No seminário on-line, especialistas do Brasil, dos Estados Unidos e da França abordaram a relevância e as dificuldades de iniciativas como a COVID-19 Data Sharing/BR, assim como a necessidade de um grande esforço global para lidar com a pandemia.

“Iniciativas e estruturas que permitam o compartilhamento de dados intensificam a capacidade de pesquisa e contribuem para o maior entendimento sobre o impacto da doença. No entanto, existem desafios importantes nessa seara, como a heterogeneidade e privacidade dos dados. Há também questões de legislação, que ficaram ainda mais evidentes durante a pandemia. Diferentes países usam justificativas legais distintas para o uso dos dados, o que cria sérias dificuldades para conectar todas essas informações”, disse Maurício Barreto, pesquisador da Fundação Oswaldo Cruz (Fiocruz), onde coordena o Centro de Integração de Dados para Saúde (Cidacs).

O Cidacs realiza estudos e pesquisas com base em projetos interdisciplinares originados na vinculação de grandes volumes de dados e na estruturação de plataformas como a Coorte de 100 Milhões de Brasileiros, a Plataforma Zika, Tecnologias e Inovações para o SUS, Equidade e Sustentabilidade Urbana e Bioinformática e Epidemiologia Genética (Epigen).

Várias crises

A pandemia evidenciou ainda que, para compreender os impactos totais da crise global, é preciso ir além dos dados de saúde. “Não é difícil perceber que se trata não apenas de uma crise de saúde, mas também uma crise social, econômica e até política. Tudo aquilo que está relacionado ao mundo social mudou de modo abrupto e a capacidade de entender o impacto da doença na população perpassa por questões muito mais amplas”, disse Amy Pienta, pesquisadora do Inter-University Consortium for Political and Social Research (ICPSR), nos Estados Unidos, uma das maiores e mais antigas base de dados relacionada às ciências sociais.

Pienta ressalta que a pandemia envolve questões de moradia, desigualdades, fechamento de pequenos negócios, saúde mental, desemprego, impacto do ensino a distância no desenvolvimento infantil e muitos outros. “Como se trata muito mais do que uma crise de saúde, cientistas sociais estão coletando e fornecendo dados sobre o impacto da pandemia para subsidiar um maior entendimento sobre as diversas crises e também identificar onde estão os problemas. Isso envolve uma variedade grande de dados que precisam ser correlacionados”, disse.

Para Anne Cambon-Thomsen, pesquisadora da University Toulouse III Paul Sabatier (França), além da conexão entre informações de diferentes áreas do conhecimento, há ainda a necessidade de cooperação internacional para o compartilhamento e reúso de dados.

“Um dos grandes aprendizados da pandemia está na necessidade de balancear a agilidade e precisão. Há uma carência de acordos internacionais pré-aprovados para o compartilhamento de dados. Precisamos então coordenar esforços entre jurisdições diferentes para fomentar globalmente a ciência aberta por meio de novas políticas e investimentos em repositórios de dados. Lembrando que é preciso envolver formuladores de políticas públicas nesse debate”, afirmou Cambon-Thomsen.

De acordo com Cambon-Thomsen, para que esse esforço tenha resultados é importante, sobretudo, incentivar a publicação dos dados e a construção de repositórios comprometidos com a permanência no longo prazo. “Existe ainda a necessidade de equilíbrio ético e de privacidade, levando em conta o interesse público quando se abordam crises como a que vivemos”, avaliou.

Cambon-Thomsen integra a Research Data Alliance (RDA), iniciativa apoiada pela Comissão Europeia, pela National Science Foundation (NSF), dos Estados Unidos, e pelo Departamento de Inovação do Governo Australiano, que desde 2013 vem desenvolvendo protocolos com o objetivo de construir infraestrutura social e técnica para o compartilhamento e reutilização de dados abertos.

Em trabalho recente, a RDA desenvolveu diretrizes e recomendações detalhadas sobre o depósito de diferentes fontes de dados em plataformas abertas em situações de emergências de saúde pública como a pandemia por COVID-19.

“Destacamos quatro áreas prioritárias, cada uma com diferentes tipos de dados: clínicas, ômicas, epidemiologia, ciências sociais. Além dessas áreas, há quatro temas transversais [participação da comunidade, dados sobre comunidades indígenas, considerações legais e éticas, software de pesquisa] que surgem como forma de focar o debate e fornecer um conjunto inicial de diretrizes em um prazo muito curto e de urgência”, contou.

De acordo com Dawei Lin, do National Institutes of Health (NIH), dos Estados Unidos, a pandemia trouxe um cenário muito específico, que não havia sido previsto por especialistas de dados. “As pessoas que estão gerando os dados estão extremamente ocupadas, salvando vidas ou buscando descobertas fundamentais para o combate à pandemia. Portanto, elas não têm muito tempo de gerenciar essas informações. Por isso a necessidade de valorizar infraestruturas, protocolos e maneiras inovadoras de tornar o gerenciamento de dados possível mesmo nessas condições”, disse.

Lin alertou para a necessidade de dados confiáveis. “Os repositórios devem ganhar a confiança das comunidades que pretendem servir e demonstrar que são confiáveis e capazes de gerenciar adequadamente os dados que possuem”, afirmou.

Entre os princípios fundamentais, apresentados por Lin, para dados confiáveis estão: transparência, responsabilidade, foco no usuário, perenidade e tecnologia.

“A disponibilidade de dados é prioritária em uma pandemia. Assim como a variedade e a interdisciplinaridade dessas informações. No entanto, sabemos que repositórios de dados não são uma novidade. A pandemia apenas evidenciou a sua importância e enfatizou seus principais desafios. O que mantém um repositório importante e funcionando ao longo de tantos anos é justamente ele se tornar relevante para a comunidade”, disse Pienta.

A íntegra do 4º FAPESP COVID-19 Research Webinars pode se assistido no endereço: https://covid19.fapesp.br/open-data-under-the-covid-19-pandemic-august-5-2020/265.

Fonte: https://agencia.fapesp.br/33869