Fapesp

A FAPESP e os Objetivos de Desenvolvimento Sustentável


COVID-19 evidencia a necessidade de avanços na gestão de dados científicos, avaliam especialistas


COVID-19 evidencia a necessidade de avanços na gestão de dados científicos, avaliam especialistas

Não há um sistema ou padrão adotado universalmente que permita a coleta, documentação e o compartilhamento dos resultados de estudos realizados sobre a doença, apontaram participantes do Second Latin American and Caribbean Scientific Data Management Workshop (imagem: divulgação)

Publicado em 12/04/2021

Elton Alisson | Agência FAPESP – A pandemia de COVID-19 evidenciou a necessidade de acelerar a implementação de sistemas de compartilhamento de dados científicos que possam ser facilmente acessados e utilizados por cientistas em qualquer lugar do mundo para avançar no conhecimento dessa e de futuras emergências de saúde pública.

Embora os estudos realizados globalmente sobre a doença e o vírus causador, o SARS-CoV-2, tenham gerado uma diversidade de resultados e dados, não existe um sistema ou padrão adotado universalmente para coleta, documentação e compartilhamento dessas informações, apontou Ingrid Dillo, membro do conselho da Research Data Alliance (RDA), em palestra no primeiro dia do Second Latin American and Caribbean Scientific Data Management Workshop, que aconteceu de forma on-line no dia 10 de fevereiro.

“A disseminação da COVID-19 levou a uma rápida e massiva resposta de pesquisa, com uma diversidade de resultados que representa um desafio para a interoperabilidade”, disse Ingrid Dillo.

“Temos enfrentado nessa pandemia, de um lado, o desafio de possibilitar o compartilhamento de dados científicos o mais rapidamente possível e, de outro, a exigência de garantir a qualidade desses dados. Nesse sentido, a velocidade de coleta e o compartilhamento precisam ser equilibrados com precisão”, avaliou Dillo.

De acordo com a especialista, também faltam acordos de compartilhamento de dados e há diferenças na infraestrutura dos sistemas de informação dos países.

A fim de auxiliar a comunidade científica global a superar esses desafios, a RDA criou um grupo de trabalho, reunindo mais de 600 especialistas de diferentes áreas de todos os continentes. O grupo se reuniu virtualmente por várias semanas, entre abril e junho de 2020, e elaborou uma série de diretrizes para ajudar pesquisadores e administradores de dados a seguir as melhores práticas para maximizar a eficiência de seu trabalho e desenvolver um modelo para emergências futuras. Além disso, criou recomendações para ajudar os formuladores de políticas científicas e agências de financiamento a incentivar o compartilhamento de dados de qualidade a fim de dar respostas apropriadas às emergências sanitárias.

“As diretrizes visam desenvolver um sistema para o compartilhamento de dados em emergências de saúde pública”, afirmou Dillo.

O trabalho abrangeu quatro áreas – clínica, epidemiologia, ciências ômicas (genômica, proteômica, metabolômica etc.) e ciências sociais – e quatro temas transversais: participação comunitária, dados de populações indígenas, considerações éticas e legais e software de pesquisa.

Uma das principais recomendações feitas pelo grupo de especialistas é a de que governos, financiadores de pesquisa e instituições de pesquisa ou de fomento em todo o mundo promovam a ciência aberta por meio de políticas e investimentos para agilizar o fluxo de dados entre entidades locais e em jurisdições internacionais.

Outra recomendação é incentivar a publicação e a liberação antecipada de resultados de dados e o software usado para produzi-los durante emergências sanitárias.

“Todas as recomendações feitas pelo grupo de trabalho são muito importantes no contexto da pandemia de COVID-19, mas têm uma relevância muito mais ampla”, avaliou Dillo.

“Esperamos que o conjunto de recomendações e diretrizes tenha impacto não só agora, durante a pandemia, mas ao longo do tempo, porque elas são bastante genéricas”, afirmou.

A RDA está avaliando se as diretrizes e recomendações elaboradas pelo grupo de trabalho também podem ser incorporadas aos princípios de gestão de dados de pesquisa sobre outras doenças infecciosas.

“Há muitos desafios na gestão e uso de dados na área da saúde. “O primeiro é que os dados de saúde são individuais, espalhados e gerenciados em sistemas diferentes, e é difícil agregá-los”, avaliou Maurício Lima Barreto, médico epidemiologista, professor da Universidade Federal da Bahia (UFBA) e pesquisador da Fiocruz Bahia.

As dificuldades enfrentadas na integração desses dados não estão relacionadas apenas a questões científicas e de processamento, mas envolvem também questões éticas e legais – tema que ganhou maior relevo no Brasil, agora, com a Lei Geral de Proteção de Dados (LGPD), sublinhou Barreto.

O pesquisador coordena na Fiocruz Bahia o Centro de Integração de Dados e Conhecimento para Saúde, que tem o objetivo de interligar dezenas de sistemas públicos para integrar dados de saúde de 100 milhões de brasileiros.

Avanços em outras áreas

Além da saúde, astronomia, ciências sociais e física de altas energias, que têm maior tradição na gestão e compartilhamento de dados de pesquisa, outras áreas, como a de ciências agrícolas, da Terra e ambientais, têm avançado nessa seara, apontaram participantes do evento.

Também por iniciativa da RDA foi criado, em 2013, um grupo de trabalho voltado a atuar em todas as questões relacionadas aos dados agrícolas e sobre alimentos. O grupo é integrado por mais de 260 membros, de todos os continentes, que representam as partes interessadas na gestão de dados para pesquisa e inovação agrícola e em alimentos, incluindo a produção, agregação e consumo de dados.

“A iniciativa se tornou um fórum para compartilhar experiências e dar visibilidade à pesquisa e ao trabalho de gestão de dados agrícolas e de alimentos, além de um espaço para a combinação de ideias relacionadas ao gerenciamento e interoperabilidade de dados nessa área”, disse Hilary Hanahoe, secretária executiva da RDA.

Um dos resultados do trabalho do grupo foi a elaboração de 39 sugestões para facilitar o uso da semântica para dados sobre agricultura e nutrição, que foram adotados pela Organização das Nações Unidas para a Alimentação e a Agricultura (FAO, na sigla em inglês).

“O grupo de trabalho atua ao lado de grandes iniciativas internacionais, públicas e privadas, de gestão e compartilhamento de dados agrícolas e sobre alimentos”, afirmou Hanahoe.

Na área ambiental, um grupo de pesquisadores da Escola Politécnica da Universidade de São Paulo (Poli-USP), em parceria com colegas da França, Estados Unidos, Japão, Austrália e do Reino Unido, pretende desenvolver novas ferramentas para o compartilhamento e reúso de dados sobre os impactos socioeconômicos de áreas protegidas naturais – ou unidades de conservação – nas comunidades locais.

As ferramentas e métricas resultantes do projeto, apoiado pela FAPESP no âmbito de um acordo com o Belmont Forum, permitirão prever melhor e mitigar os efeitos das ações que rompam com as práticas históricas de uso da terra, que ameaçam as comunidades locais. Os resultados serão úteis para pesquisadores que manipulam dados sobre a terra, o espaço e o ambiente em todo o mundo, explicou Pedro Luiz Pizzigatti Correa, professor da Poli-USP e coordenador do projeto.

“Combinaremos imagens de satélite com técnicas de aprendizagem profundo de máquina para previsão de pobreza nas regiões analisadas”, disse Pizzigatti.

Na área de ciências da Terra, um grupo internacional de cientistas especializados em sensoriamento remoto tem se dedicado ao gerenciamento e à distribuição de dados sobre neve, mantos de gelo, geleiras, solo congelado e as interações climáticas que constituem a criosfera do planeta por meio do National Snow and Ice Data Center (NSIDC), da agência espacial norte-americana, a Nasa.

Os profissionais e cientistas de gerenciamento de dados participantes do projeto trabalham com provedores e usuários de dados para criar ou publicar produtos, ferramentas e recursos, de modo a garantir que os dados científicos passados, presentes e futuros permaneçam acessíveis a todos, de forma aberta, para estudar a Terra e seu clima.

Os dados relacionados à criosfera que passam pela curadoria dos pesquisadores incluem desde o menor arquivo de texto até terabytes de dados de sensoriamento remoto gerados pelo Sistema de Observação da Terra da Nasa.

“A Nasa lançou em 2018, no âmbito dessa missão, um satélite chamado ICESat-2 voltado a observar principalmente o gelo marinho e terrestre no Ártico e na Antártica”, disse Steve Tanner, coordenador do NSIDC.

O satélite possui um instrumento, chamado Atlas (sigla em inglês de Advanced Topographic Laser Altimeter System), que emite constantemente pulsos de raio laser de luz verde que rebatem na superfície da Terra e retornam para o satélite como um radar a laser. Ao medir quanto tempo leva para os fótons voltarem para o satélite, é possível aferir com precisão a altura não só de geleiras, mas também de árvores e a profundidade de rios, por exemplo.

“Há muitos dados gerados por esse satélite que podem ser úteis para países costeiros ou com muitas vias navegáveis, como é o caso do Brasil, e para obter dados sobre áreas de agricultura e floresta”, avaliou Tanner.

O pesquisador incentivou os participantes do workshop a acessar as páginas do NSIDC, que conta com um grupo de especialistas voltado a ajudar a responder dúvidas e auxiliar a baixar os dados de interesse.

O NSIDC é um dos centros de dados certificados pelo World Data System (WDS), um órgão interdisciplinar do Conselho Internacional de Ciências (ISC, na sigla em inglês) com a missão de garantir o acesso universal e equitativo a dados científicos.

“Encorajamos o compartilhamento aberto e totalmente gratuito dos dados científicos armazenados em todos os repositórios das organizações de pesquisa. Entendemos que há situações em que isso não é possível por motivos éticos ou legais, mas em todos os outros casos é preciso que os dados científicos sejam disponibilizados com o mínimo de atraso possível”, disse Alex de Sherbinin, presidente do comitê científico do WDS.

Outros preceitos da entidade são que os dados científicos compartilhados sejam autênticos e tenham alta qualidade e integridade. “Isso é particularmente importante na era da pós-verdade, em que a confiança nos dados deve ser realmente estabelecida”, avaliou Sherbinin.

Papel pioneiro

Organizado pela FAPESP, no âmbito do Programa FAPESP de Pesquisa em eScience e Data Science, em parceria com o WDS, a RDA e a Academia Brasileira de Ciências (ABC), o objetivo do workshop foi discutir as melhores práticas de gerenciamento de dados em repositórios e sobre novas tendências e perspectivas para sistemas de dados científicos. A segunda parte do evento ocorrerá no dia 24 de fevereiro.

A primeira edição aconteceu em 2018 e resultou na criação pela ABC de um grupo de trabalho para a elaboração de normas e diretrizes sobre o tratamento de dados abertos para o avanço da ciência e tecnologia no Brasil.

“Em agosto de 2020, o grupo lançou um documento sobre os desafios na gestão de dados científicos no Brasil e está elaborando, agora, um novo texto com foco em ciência aberta”, disse Luiz Davidovich, presidente da ABC, que destacou a liderança nessa área da moderadora do evento, a pesquisadora Claudia Bauzer Medeiros.

Professora do Instituto de Computação da Universidade Estadual de Campinas (IC-Unicamp), Medeiros é membro da ABC, do comitê científico do WDS e da coordenação do Programa FAPESP de Pesquisa em eScience e Data Science.

“A FAPESP foi a primeira agência de financiamento à pesquisa na América do Sul a exigir planos de gerenciamento de dados em todas as submissões de projetos. Isso está aumentando a conscientização da comunidade acadêmica sobre a relevância do compartilhamento de dados como um marco de boas práticas científicas”, sublinhou Luiz Eugênio Mello, diretor científico da Fundação.

A íntegra do evento pode ser acessada em: www.youtube.com/watch?v=AB3BCPr43Ok. As inscrições para o segundo dia do workshop podem ser feitas pelo site https://fapesp.br/eventos/wds.
 

Fonte: https://agencia.fapesp.br/35191