quinta-feira, 12 de agosto de 2021

A imunidade de grupo

Fala-se muito hoje de imunidade de grupo, e de que dependerá.
Podemos simplificar o problema imaginando que a população se divide entre vacinados e não vacinados, pensar em que os contactos se fazem aos pares, pessoa A em contacto com a pessoa B, e que só pode haver contágio se A e B pertencerem ao grupo dos não vacinados (quadrado vermelho).

Os três tipos de contactos

É um facto que probabilidade de dois não vacinados se encontrarem diminui rapidamente com a percentagem de população vacinada,

Probabilidade de dois não vacinados se encontrarem

e que o falado limite de 70% para se atingir a imunidade de grupo tem a ver com o facto de a partir daí esta probabilidade ser inferior a 10%.
Mas chega?
Sabe-se bem que não, que há factores dinâmicos importantíssimos, tais como
i) quantos portadores de vírus assintomáticos andam a circular?
ii) quantos contactos cada um de nós tem, em média, por dia, por exemplo?
iii) qual a probabilidade de um contacto se transformar em contágio?
A primeira questão tem uma resposta na taxa de positividade dos testes, que hoje se estima ser inferior a 2%, ou seja, para encontrarmos um portador teremos de ter mais de 50 contactos. Daí a importância de testar, para se conhecer este factor.
A segunda questão prende-se com a nossa movimentação, e aqui sabe-se que, como na maioria dos fenómenos sociais, haverá muitas pessoas com poucos contactos e poucas pessoas com muitos contactos (os super-disseminadores). Depende das medidas de confinamento e dos cuidados individuais. 
A terceira questão diz respeito à agressividade do vírus, e hoje sabe-se que a variante que entre nós predomina é altamente agressiva.
No total, estes três factores multiplicam-se, e daí começar a pensar-se que a imunidade de grupo pode ser um mito nos tempos mais próximos...

quarta-feira, 4 de agosto de 2021

Visualização dos dados CoVid

Hoje já dispomos de cerca de 17 meses de dados CoVid-19 e já aprendemos muito sobre em que medida nos podem ajudar a organizar a nossa vida.
Os dados são mais que os números que a comunicação social nos apresenta (quantos casos, quantos óbitos, quantas camas hospitalares ocupadas, etc.), permitem avaliar o resultado das medidas que vão sendo tomadas, e, mais que isso, permitem prever a evolução do nosso estado sanitário. 
Representações cronológicas dos dados de forma gráfica, como por exemplo esta,

Séries temporais e médias móveis de 7 dias

são bem mais poderosas que os números em si, permitem ver tendências de forma intuitiva e, neste caso, demonstram ainda de forma clara como os números diários de casos e de óbitos estão sujeitos a grandes variações entre dias consecutivos, e as médias móveis de sete dias são uma medida bem mais consistente da evolução da pandemia.
A média móvel de sete dias calcula-se usando em cada dia a média dos valores do dia e dos seis dias anteriores, e fica bastante insensível a certas regularidades semanais, pois sempre que se acrescenta um valor novo é retirado o valor do dia homólogo da semana anterior.
A pandemia evolui num sistema altamente complexo, de pessoas, de contágios, de atitudes, de medidas, cuja dinâmica se mede em dias, os dias que vão entre um eventual contágio e a sua contabilização pelas entidades responsáveis.
Este sistema tem "inércia", não responde de imediato a medidas de contenção, e, por isso mesmo, é difícil de conduzir, precisa de atenção constante e acção rápida.
Pessoalmente, tenho explorado uma representação destes dados como trajectórias num plano (casos, óbitos)

trajectórias (casos, óbitos)

que ficam com este aspecto surpreendente (não coloquei datas, para não sobrecarregar a figura).
Em primeiro lugar, destaca-se a irregularidade dos valores diários (a azul), em contraste com a solidez da trajectória dos valores médios, onde é possível distinguir as quatro vagas que já conhecemos, todas caracterizadas por uma trajectória no sentido directo, resultado do atraso do número de óbitos relativamente ao número de casos.
A primeira vaga, que agora nos parece quase inofensiva, está numa posição mais próxima da vertical, correspondendo a um número elevado de óbitos relativamente ao número de casos, possivelmente resultado do desconhecimento inicial do fenómeno.
A segunda vaga, que não se concluiu, está bastante menos inclinada, mas vemos agora que foi interrompida, e todos nos lembramos da ideia de salvar o Natal, por uma terceira vaga, mais brutal, a tal da variante inglesa, a que não soubemos responder com a necessária rapidez, originando centenas de óbitos diários, num cenário que se julgava quase impossível.
Hoje estamos na quarta vaga, com um número de óbitos relativamente reduzido, efeito certamente do sucesso das vacinas e da campanha de vacinação.
Na figura seguinte, representa-se no mesmo gráfico o número de camas hospitalares ocupadas em cada dia e uma estimativa das pessoas "protegidas" obtida somando ao número de pessoas inoculadas (uma ou duas doses) o número de pessoas infectadas há menos de seis meses.

Camas hospitalares ocupadas e pessoas "protegidas"

Parece claro o efeito positivo da vacinação, mas os dados não falam por si, é necessário olhar mais a fundo para os fenómenos, para o contágio, para os comportamentos.
Fica para outro dia.

segunda-feira, 2 de agosto de 2021

Os dados CoVid-19

A pandemia CoVid-19 está a gerar uma enorme quantidade de dados, que estão a ser utilizados por cientistas, em todo o mundo, para ajudar a perceber um fenómeno novo, como evolui, que efeitos tem sobre a população, quais são as perspectivas de a vacinação nos devolver a liberdade de circulação, etc.
Os dados, correctos e actualizados na hora, desempenham um papel fundamental nesta batalha, mas deve registar-se que nem todos os países vêem esta questão da mesma forma, e que Portugal é um mau exemplo, ao disponibilizar os dados em relatórios no formato PDF (!) que têm de ser lidos manualmente.
Felizmente, a comunidade de cientistas de dados Data Science for Social Good Portugal faz a sua leitura diária e disponibiliza todos os dados oficiais no formato CSV no seu repositório CoVid-19.
O formato CSV (comma separated values: valores separados por vírgulas) é um formato em texto, que pode ser aberto em múltiplas ferramentas, e em que a primeira linha do ficheiro é constituída pelos cabeçalhos de todas as colunas e todas as linhas seguintes são os valores respectivos.
Outro repositório importante é o repositório CoVid-19 do Center for Systems Science and Engineering (CSSE) at Johns Hopkins University, por certo um dos mais completos do mundo.
Basicamente, todos os países disponibilizam os seus dados, e várias organizações procedem à sua colecção, como, por exemplo, o Worldometer. No Worldometer, pode encontrar-se a lista de fontes utilizada.
Uma questão importante é que dados devem, e podem, ser fornecidos, e a resposta a esta questão tem variado ao longo do tempo, de acordo com a própria evolução da doença, do seu impacto nos sistemas de saúde, da descoberta das vacinas, etc.
Assim, se inicialmente se olhava para o número de casos confirmados, quer o seu valor diário, quer o valor acumulado, rapidamente se percebeu que dados como o número de óbitos, número de hospitalizações (no nosso caso, camas ocupadas), percentagem da população inoculada, janela de observação, dimensão da unidade territorial sob observação, utilização de valores relativos, desempenhavam um papel importante na análise dos dados disponíveis.

Casos e óbitos dia a dia, desde o primeiro dia, e médias móveis de 7 dias

A simples observação desta figura, com as séries temporais de casos e óbitos e médias móveis de 7 dias (que filtram os efeitos dos dias da semana), permite perceber imediatamente que as médias móveis estão sujeitas a menos oscilações, e que estamos a sair da chamada quarta vaga.
Olhando melhor, e relacionando as curvas da casos e de óbitos, nota-se que para o mesmo número de casos há actualmente menos óbitos, e somos convidados a pensar nisso.
É aqui que os dados deixam de ser números e passam a ser manifestações de fenómenos concretos, mais complexos, cujas respostas se podem eventualmente obter explorando os dados existentes. Certamente que as respostas hospitalares melhoraram, que as novas variantes do vírus se manifestaram, que as vacinas começaram a surtir efeito, etc. Mas quando e como?

domingo, 1 de agosto de 2021

Bem vindo Agosto

Subitamente, estamos em Agosto, outra vez com a pandemia às portas, outra vez cheios de dúvidas, agora sobre a vacina, as vacinas, e o tempo vai passando...
Hora de pensar em pôr de pé um projecto que não é mais que um cantinho onde todos possam pensar na ciência da moda, a Ciência de Dados, Aplicada, chamei-lhe eu, porque não há outra...
No mundo de hoje, as competências digitais já não são simples competências para programar, ou para lidar com as tecnologias. São competências para pensar e planear para um mundo digital, para analisar problemas e formular soluções que possam ser executadas automaticamente por uma máquina de processamento de informação.
Ao desafio de lidar com as tecnologias, soma-se agora a necessidade de compreender como funciona o mundo global, a economia do conhecimento, as redes, a propagação de ideias, o contágio, a influência, e as decisões que afectam as nossas vidas.
Usando exemplos do dia a dia, vamos tentar penetrar neste mundo complexo, onde cada vez menos pessoas parecem ter mais poder sobre as nossas próprias vidas.