Ciência de dados na tuberculose resistente a drogas no Brasil

Rejane Sobrino Pinheiro

Nome do projeto

Ciência de dados na tuberculose resistente a drogas no Brasil

O que é

O projeto baseou-se na hipótese de que características individuais e sociais, associadas a fatores relacionados aos serviços de saúde interagem de forma não linear e complexa, contribuindo fortemente para o abandono ao tratamento e/ou o desenvolvimento de Tuberculose Droga-Resistente (TB-DR). Uma das principais consequências é o aumento da resistência ao tratamento O principal objetivo foi aprimorar os instrumentos de vigilância da TB-DR por meio de técnicas de vinculação, mineração de dados e aprendizado por máquinas para: (1) identificar os fatores associados aos desfechos desfavoráveis da TB-DR; (2) estudar a trajetória do paciente na rede de serviços de saúde, considerando unidades de atenção primária e hospitalar e (3) analisar o acesso ao diagnóstico da TB-DR pela introdução do teste rápido molecular na rede de serviços de saúde. Além de desenvolver ferramentas computacionais para apoio à vigilância da TB e TBDR, a partir dos sistemas de informação existentes, o projeto propôs um modelo sistêmico para aprimorar os instrumentos de gestão, vigilância e assistência da TB e TBDR.

Como foi o experimento

O Sistema de Informação de Tratamentos Especiais de Tuberculose (SITE-TB) é a principal fonte de dados da vigilância da tuberculose droga resistente (TBDR), e seus dados, vinculados a outras bases de por meio de linkage, permitem o seguimento do paciente na rede de serviços ao longo do tempo. A partir dessa base de dados, realizou-se a vinculação por meio de linkage com outras bases: Sistema de Informação de Agravos de Notificação -TB (SINAN-TB) - vigilância e história prévia da tuberculose, 2008 a 2016), Gerenciador de Ambiente Laboratorial (GAL – dados de baciloscopias de diagnóstico e seguimento, cultura e teste rápido molecular) e Sistema de Informação sobre Mortalidade (SIM - base de 2013 a 2016). Essas bases foram vinculadas empregando técnicas determinísticas e probabilísticas, e analisadas empregando algoritmos de mineração de dados e aprendizado de máquina para elaborar um modelo de risco da TB-DR, incluindo: modelos de regressão, regras de associação, árvore de decisão, grafos, floresta aleatória e XGBoost. Foi construída cascata do cuidado para a TB e análises de concordância entre as notificações (SINAN-TB) e os dados laboratoriais (GAL).

Principais resultados

Um total de 980 indivíduos foram incluídos no estudo de avaliação dos fatores associados aos desfechos da TB-DR no nível nacional. A baixa escolaridade e uso de drogas ilícitas são fatores importantes para o abandono do tratamento, e a existência de doença em ambos os pulmões influencia na falência da terapêutica. Os fatores que mais contribuíram com óbito foram a idade (maior que 60 anos) e presença de HIV. 

Considerando-se apenas os pacientes MDR, os modelos preditivos de desfechos desfavoráveis com menor erro foram os não-lineares (Floresta Randômica e XGBoost – menos de 30% do erro visto em regressões tradicionais). As melhores taxas de acerto dos modelos lineares foram válidas apenas para o critério cura, a mais prevalente na base de dados. A classificação de pacientes com elevado risco de desfechos desfavoráveis implementados com XGBoost geraram erros menores do que 10%, enquanto o modelo linear foi de 77%. 

Usando regras de associação, foi desenvolvido algoritmo para mineração de regras “válidas” (menos prováveis de serem obtidas pelo acaso) para identificar perfis especiais de pacientes relacionados aos diferentes desfechos desfavoráveis da TB-DR.Os padrões de trajetória dos pacientes que apresentaram TB-DR foram analisados com os dados do município do Rio de Janeiro. Neste caso, identificou-se que os pacientes são relativamente jovens (metade possui menos de 40 anos) e que a escolaridade não é tão baixa. Os dados de acompanhamento de TB-DR no SITE-TB mostram que cerca de 28% são resistência primária. Apenas 26%  

As notificações de tuberculose na base de dados do SINAN (2012-2018) foi modelada em grafos, e verificou-se que a maioria dos pacientes com mais de uma notificação teve apenas um tratamento anterior, e 15% tiveram pelo menos dois tratamentos prévios. O menor tempo desde o tratamento anterior até a resistência foi de 1,5 ano. A modelagem em grafos permitiu a visualização das diferentes trajetórias dos pacientes entre as unidades de saúde até a ocorrência da resistência. Bairros com altas cargas de tuberculose mostraram trajetórias curtas e com grande presença de unidades básicas de saúde na detecção e no acompanhamento do tratamento, sugerindo que a maioria dos pacientes consegue acesso às unidades básicas na detecção da resistência aos medicamentos. 

A partir do linkage do SINAN com os dados do laboratório (GAL), observou-se que as unidades com médicos especializados em Medicina da Família e Comunidade examinaram mais sintomáticos respiratórios, realizaram mais diagnósticos com confirmação bacteriológica e mostraram um menor atraso para iniciar o tratamento. 

Como ferramenta de apoio à vigilância da TB e TB-DR, desenvolveu-se uma versão em R de script originalmente desenvolvido em SQL para qualificação de variáveis do SINAN. O teste da ferramenta no município do Rio de Janeiro mostrou algumas diferenças significativas no teste de HIV, agravo AIDS e diabetes e o encerramento por abandono mais que dobrou após a correção de encerramentos ignorados e de transferências.

Foi elaborado, também, um modelo sistêmico, multicamada, da gestão e controle da TB e TB-DR, visando orientar análises, ações e políticas, e ressaltar as lacunas de conhecimento para novas pesquisas. Este modelo descreve ligações de várias ordens, favorecendo a visão do todo, as interrelações entre entidades e subsistemas, presença de complexidade pela existência de relações circulares com laços de feed-back. O modelo ressalta o excesso de relações sobre o indivíduo e sobre a interface operacional e “administrativa” da saúde, poucas relações com o território e relações intensas da gestão com poucos subsistemas, mostrando sua baixa capilaridade.  Está em andamento o aprofundamento do subsistema relativo à equipe de saúde visando ações para implementação de educação continuada.

Por que é inovador

A inovação da proposta está no uso de técnicas com vinculação de base de dados, mineração e aprendizagem de máquina para estabelecer um modelo preditivo de risco e analisar a trajetória dos pacientes para acessar a rede de serviços de saúde para o diagnóstico e tratamento da TB. A inovação também está pela construção de um modelo sistêmico, multidirecional, para a gestão e educação continuada.

Implicações para o sistema de saúde brasileiro

A tuberculose continua sendo um importante problema de saúde pública no país. A identificação de inter-relações entre fatores e potenciais entraves pode desvendar novos conhecimentos que propiciem o melhor controle da TB e TB-DR. Técnicas tradicionais tendem a identificar perfis gerais de pacientes mas não são suficientes para mitigar o problema do controle da TB e TB-DR. Identificar subgrupos populacionais, lugares e unidades de saúde mais afetados permite ações específicas e o monitoramento com particular atenção, visando melhores resultados no controle da TB. A criação de alarmes com a identificação precoce de subgrupos de maior risco de resistência ou de desfechos desfavoráveis no tratamento da TB-DR pode beneficiar a assistência a pacientes mais vulneráveis, tanto quanto ajudar a vigilância e gestão para o controle da TB-DR.

Próximos passos

O projeto pretende discutir os resultados com os serviços de saúde, visando a readequação e sistematização dos dados nos diferentes sistemas. Seria interessante desenvolver uma central de informações incorporando análises do projeto e, ao lado disso, trabalhar na qualificação das bases de dados, com recuperação de dados/atualização, limpeza, e padronização. Ainda nessa linha, protocolos para automatização do linkage com uso de técnicas de aprendizado de máquina podem ajudar a classificar os links da área de dúvida, aumentando a acurácia e permitindo a agilização do processo. Pretendemos ainda desenvolver alarmes para a classificação de risco de pacientes e não conformidades na detecção, diagnóstico e tratamento. Finalmente, seria importante ainda aprofundar o modelo sistêmico sobre o cuidado do paciente tuberculoso na Atenção Primária em Saúde, visando investir em estratégias que favoreçam a educação continuada.

Estudos publicados

Nenhum estudo publicado.

Matéria sobre o projeto

Nenhuma matéria relacionada.

Projetos relacionados

Nenhum projeto relacionado.