Plataforma conta com dados de 75 mil pacientes, 1,6 milhão de exames e 6,5 mil dados de desfecho; iniciativa tem a participação da USP, Grupo Fleury e hospitais Sírio-Libanês e Israelita Albert Einstein (imagem: Wikimedia Commons)
Publicado em 05/05/2021
Elton Alisson | Agência FAPESP – Pesquisadores de universidades e instituições de pesquisa de todo o país passam, a partir de hoje (17/06), a ter acesso ao COVID-19 Data Sharing/BR, o primeiro repositório do país com dados demográficos e exames clínicos e laboratoriais anonimizados de pacientes que fizeram testes para COVID-19 em unidades laboratoriais e hospitais do Estado de São Paulo.
O objetivo da plataforma é compartilhar informações clínicas de pacientes anonimizados para subsidiar pesquisas científicas sobre a doença nas diversas áreas do conhecimento.
A base de dados compartilhados é resultado de uma iniciativa da FAPESP, em parceria com a Universidade de São Paulo (USP), e já conta com a adesão de hospitais e unidades laboratoriais de atendimento a pacientes.
A parceria reúne, nesta primeira etapa, o Grupo Fleury e os hospitais Sírio-Libanês e Israelita Albert Einstein, que disponibilizaram informações, infraestrutura, tecnologias e recursos humanos próprios para viabilizar o compartilhamento de dados. A FAPESP está contatando outras instituições de atendimento a pacientes para compartilhar informações no repositório COVID-19 Data Sharing/BR.
“A ideia central da plataforma é subsidiar a pesquisa científica sobre a COVID-19 ao compartilhar dados que não seriam disponibilizados de outra forma, de modo a mobilizar a comunidade de cientistas da computação, matemáticos e analistas de informações, para que possam contribuir com novas ideias para o enfrentamento da atual epidemia da doença”, disse Luiz Eugênio Mello, diretor científico da FAPESP, durante coletiva de imprensa on-line para o lançamento do repositório, realizada pela FAPESP.
O repositório abrigará, inicialmente, dados abertos e anonimizados de 75 mil pacientes, 6.500 dados de desfecho e um total de mais de 1,6 milhão de exames clínicos e laboratoriais realizados em todo o país pelo Grupo Fleury e na cidade de São Paulo pelos hospitais Sírio-Libanês e Israelita Albert Einstein desde novembro de 2019.
Ainda que o primeiro caso da doença no Brasil tenha sido registrado em fevereiro, pelo Hospital Albert Einstein, o período de cobertura dos dados permitirá que as pesquisas analisem o histórico de saúde dos pacientes, bem como busquem evidências de sintomas da COVID-19 em pacientes atendidos anteriormente. Novos dados serão inseridos pelo Grupo Fleury, Hospital Sírio-Libanês e Einstein regularmente.
O repositório disponibilizará três categorias de informação: dados demográficos (gênero, ano de nascimento e região de residência do paciente) e dados de exames clínicos e/ou laboratoriais, além de informações, quando disponíveis, sobre a movimentação do paciente, como internações, por exemplo, e desfecho dos casos, como recuperação ou óbitos. Em uma segunda etapa, o COVID-19 Data Sharing/BR abrigará também dados de imagens, como radiografias e tomografias.
“Em termos de valores, a obtenção desses dados por outros meios representaria um custo da ordem de centenas de milhões de reais. A gratuidade no acesso a essas informações será possível em razão da disponibilidade e generosidade dessas três instituições participantes da iniciativa”, disse Mello.
O lançamento do repositório tem um cronograma de três etapas. Uma versão pequena do conjunto de dados será inicialmente disponibilizada hoje (17/06) para um período-piloto de consultas. Dessa forma, a comunidade de pesquisa poderá baixar os dados e começar a analisá-los e visualizá-los usando técnicas de ciência de dados.
Até o dia 24 de junho, os grupos de pesquisa interessados poderão enviar dúvidas e comentários para os responsáveis pelo repositório COVID-19 Data Sharing/BR pelo e-mail covid19datasharing@fapesp.br. Esse feedback da comunidade durante o período-piloto será usado para melhorar as informações e a documentação do repositório. O conjunto inicial completo dos dados abertos e anonimizados será disponibilizado ao público a partir do dia 1º de julho.
“Neste primeiro momento iremos disponibilizar um conjunto de dados-piloto, para análise exploratória, para à medida que os analistas de dados comecem a usá-los sejam melhorados”, disse João Eduardo Ferreira, professor do Instituto de Matemática e Estatística (IME) da USP, participante do projeto.
Avanço na compreensão da doença
O diretor-executivo médico do Grupo Fleury, Edgar Rizzatti, destacou que o repositório permitirá o acesso a dados para a realização de pesquisas não só pela comunidade científica, mas também para o desenvolvimento de soluções tecnológicas por empreendedores e startups.
“Desde o início da pandemia temos sido procurados por startups, pesquisadores de universidades e instituições de pesquisa, em iniciativas isoladas ou em colaboração, interessados na disponibilização de dados anonimizados de pacientes com COVID-19 para o desenvolvimento de projetos de pesquisa ou para o desenvolvimento de estratégias em ciências de dados ou de algoritmos de inteligência artificial. Por isso, acredito que essa iniciativa pioneira permitirá um melhor entendimento da COVID-19”, afirmou.
A opinião de Rizzatti é compartilhada por Luiz Fernando Lima Reis, diretor de ensino e pesquisa do Sírio-Libanês. “A base de dados possibilitará à comunidade científica ter acesso a dados que refletem a situação atual da epidemia de COVID-19 no Brasil e as características que a doença adquiriu no país, que só poderá ser combatida por meio de soluções baseadas em dados”, disse.
O pesquisador ressaltou o cuidado tomado pelo comitê gestor do repositório em garantir a anonimização de todos os dados dos pacientes, de forma a preservar suas identidades, e atender todas as exigências da Lei Geral de Proteção de Dados.
O diretor-superintendente de pesquisa da Sociedade Beneficente Israelita Brasileira Albert Einstein, Luiz Vicente Rizzo, ressaltou que o momento atual representa uma oportunidade para mostrar a pujança da pesquisa que também tem sido feita em instituições não governamentais voltadas ao combate da COVID-19.
“Temos hoje no Einstein 68 projetos de pesquisa em andamento relacionados à COVID-19, iniciados nos últimos seis meses, e mais 113 em vias de ser inicializado. Isso mostra que nós, como instituições não governamentais, temos um papel importante e podemos contribuir muito para a pesquisa no Estado de São Paulo e no país”, disse.
Origem do repositório
A ideia de criação do repositório COVID-19 Data Sharing/BR surgiu há pouco mais de um mês e foi concretizada rapidamente graças a outro projeto lançado pela FAPESP no final do ano passado, a Rede de Repositórios de Dados Científicos do Estado de São Paulo.
A rede, que levou quase três anos para ser desenvolvida, disponibiliza em uma plataforma aberta dados associados a pesquisas científicas desenvolvidas em todas as áreas de conhecimento por instituições de ensino superior e pesquisa públicas no Estado de São Paulo. A mesma plataforma abrigará também o repositório COVID-19 Data Sharing/BR.
O desenvolvimento da rede, que inclui um buscador de metadados, contou com o envolvimento das seis universidades públicas do Estado de São Paulo – USP, Universidade Estadual de Campinas (Unicamp), Universidade Estadual Paulista (Unesp), Universidade Federal de São Carlos (UFSCar), Universidade Federal do ABC (UFABC) e Universidade Federal de São Paulo (Unifesp) –, o Instituto Tecnológico de Aeronáutica (ITA) e a Embrapa Informática Agropecuária (CNPTIA/Embrapa).
“O compartilhamento de dados é essencial para enfrentar uma situação como a que estamos vivendo agora e que deverá ser perene”, disse Sylvio Canuto, pró-reitor de pesquisa da USP.
Na avaliação de Cláudia Bauzer Medeiros, professora do Instituto de Computação da Unicamp e participante do projeto, o repositório de dados será útil não só para pesquisas sobre COVID-19, mas também no futuro, para eventualmente orientar políticas públicas para evitar que situações como a atual voltem a acontecer ou minimizar os efeitos de futuras pandemias.
“O repositório reúne dados produzidos por brasileiros, que irão contribuir para a ciência mundial”, afirmou.