Antónia Turkman, Tiago Marques, Lisete Sousa, Luzia Gonçalves
Centro de Estatística e Aplicações, Universidade de Lisboa
O que é que a falácia do procurador tem a ver com a pandemia da COVID 19? Se ler isto até ao fim, percebe onde queremos chegar. Este texto veio à baila em resposta a uma questão que nos puseram sobre a decisão de fazer apenas um teste em vez de fazer dois testes às pessoas tratadas em casa que foram infetadas com vírus SARS CoV 2 (que pode causar a COVID 19). Isso não implicará um aumento de pessoas ainda infetadas consideradas como recuperadas? E quantas pessoas que tenham um teste ao vírus SARS CoV 2 negativo ainda estarão doentes/infectadas? Como podemos medir isso? Então comecemos pelo princípio.
É sabido que os testes de diagnóstico não são 100% fiáveis, sendo que a sua fiabilidade depende de muitos factores. Existem muitas formas de avaliar o desempenho de um classificador binário, incluindo a sensibilidade e a especificidade. Não será possível discutir aqui todas, mas é desejável que um teste de diagnóstico tenha uma alta sensibilidade, isto é, tenha elevada probabilidade de detectar um caso positivo (presença da doença/infecção) e alta especificidade, isto é, elevada probabilidade de detectar um caso negativo (doença/infecção não presente). Teoricamente, estas medidas são obtidas por experiências aplicando o teste a um grupo de indivíduos que se sabe que têm a doença e a um grupo de indivíduos que se sabe que não têm a doença. Diz-se que o teste resulta num falso negativo se dá negativo num indivíduo que tem a doença e falso positivo se dá positivo num indivíduo são. Pelas suas características os testes PCR aplicados no diagnóstico da COVID 19 parecem ter elevada especificidade e se dão positivo é de crer que o indivíduo esteja doente. No entanto não temos conhecimento do que se sabe sobre a sensibilidade destes testes. Pode depender da carga viral do indivíduo, do modo como foi feita a recolha, etc. Não somos especialistas nesta matéria, de modo que não nos podemos pronunciar sobre o assunto, nem interessa para o caso. Mas podemos sempre imaginar cenários e tirar conclusões com base nos mesmos. Imaginemos que a sensibilidade é de 80%, ou seja, que é de esperar que em 20% dos doentes o teste dê negativo. Isto, no entanto, não significa que seja de esperar que em 100 indivíduos para os quais o teste dê negativo, 20 deles estejam ainda doentes. E é este o ponto importante quando se tenta interpretar o conceito de falso negativo.
Vejamos a razão:
Há outras duas medidas úteis que caracterizam testes de diagnóstico de natureza binária. O valor preditivo positivo, que é a probabilidade de um indivíduo estar doente quando o teste deu positivo e o valor preditivo negativo que é a probabilidade de um indivíduo não estar doente quando o teste deu negativo. Em geral, estas duas probabilidades são de mais difícil obtenção. O seu cálculo implica ou o conhecimento da prevalência da doença na população (proporção de doentes na população) ou um outro tipo de estudo mais complexo em que é preciso que exista, por exemplo, um teste alternativo (padrão de ouro) 100% fiável.
Toda esta teoria se aplica a situações em que os indivíduos são escolhidos aleatoriamente de uma população. Na prática, muitas vezes os testes são aplicados a indivíduos já com a suspeita clínica da doença. Quando estamos a falar em “recuperados” (identificados como tal, mas podendo ser ou não) a situação é diversa. A sensibilidade dos testes será diferente, possivelmente mais baixa; o que se entende por prevalência é com certeza também diferente, já que se está a falar de uma população específica e não na população em geral.
Isto tudo vem para explicar que a decisão de considerar eventualmente um indivíduo para o qual o teste deu negativo como doente, não pode ser baseada na probabilidade de o teste dar negativo dentro do grupo dos doentes, mas sim na probabilidade inversa de o indivíduo estar doente caso o teste dê negativo. E estas duas probabilidades podem ser bem diferentes. Aliás, esta confusão entre as duas probabilidades é conhecida como a falácia do procurador, que para defender a culpabilidade do réu usa a probabilidade da evidência dado que o réu é culpado, em vez da probabilidade de o réu ser culpado dada a evidência (esta em geral muito inferior à anterior).
Mas façamos uns cálculos. Imaginemos que a sensibilidade é 60% (para falar no caso dos “recuperados”) e a especificidade 99%, ou seja a taxa de falsos negativos é 40% e a taxa de falsos positivos é 1%. Admitamos 3 cenários: com prevalências de 10%, 35% e 60%, respectivamente. Note-se que esta prevalência, para o caso de interesse, deverá ser a proporção de infetados dentro do grupo dos que estarão recuperados, do ponto de vista clínico, ou em vias de recuperação.
No cenário que pusemos de um teste com sensibilidade 60% e especificidade 99%, no caso da prevalência ser 10%, a probabilidade de um indivíduo estar doente quando o teste deu negativo (aplica-se o teorema da probabilidade inversa, conhecido como teorema de Bayes) é de 4% (o que daria 4 em 100 “recuperados” estariam ainda doentes, contrariamente a 40 em 100 na interpretação errónea usando a percentagem de falsos negativos). No segundo caso essa probabilidade é de 18% (18 em 100). No terceiro caso a probabilidade sobe para 38% (38 em 100).
Se considerarmos a situação em que são aplicados dois testes a cada indivíduo e ambos são negativos, de acordo com os mesmos cenários tem-se, aproximadamente, e considerando independência no que respeita à aplicação dos testes e condicionalmente a ambas as subpopulações (casos/não casos):
Primeiro cenário: 2%; segundo cenário: 8%; terceiro cenário: 20%.
Claro que é óbvio que quantos mais testes negativos um indivíduo tiver maior é a probabilidade de ele não estar doente.
No entanto, mesmo que a proporção de infectados nessa fase de recuperação não seja alta, naturalmente que se pode sempre correr o risco de libertar para a população pessoas que ainda estão infectadas. E o custo de o fazer não pode ser ignorado, deve ser discutido e ser ponderado. Cabe às autoridades de saúde fazê-lo com base na informação que têm e acreditamos que seja o caso.
Conclusão: do ponto de vista estatístico, é muito difícil afirmar quantas pessoas supostamente recuperadas irão sair à rua ainda portadoras do vírus, quer façam um teste ou dois, dado o conhecimento praticamente nulo das medidas necessárias para uma avaliação correcta em termos probabilísticos.
Os autores declaram optar por não usar o acordo ortográfico.