Investigando o COVID-19 através de Analytics - Blog Accurate Blog Accurate

Computador e pessoa realizando a análise de COVID-19 com a ferramenta Analytics.

Investigando o COVID-19 através de Analytics

Entenda como funciona essa análise pelo Analytics

O intuito do nosso texto é passar informações concretas e mostrar como estamos investigando o COVID-19 através da ferramenta Analytics.

Desde o início da pandemia do vírus COVID-19 somos bombardeados na mídia por inúmeras análises, tabelas e artigos sobre o número de doentes e mortes. Veja abaixo um exemplo típico:

Contudo esta tabela não ajuda muito, pois estamos comparando regiões do país com números muito diferentes de habitantes. A população da região Sudeste é quase 5 vezes superior a da região Norte.

Para podermos comparar o estágio da doença no país, devemos analisar o número de mortes por milhão de habitantes. Este fato parece óbvio, mas, muitos jornalistas ainda não tomam este cuidado.

Importante notar que que existem muitos problemas para a obtenção de dados confiáveis, tanto no Brasil como em muitos outros países – com critérios homogêneos.

  1. Muitos casos são assintomáticos, assim, mesmo que pudessemos testar todos os doentes, mesmo assim não saberíamos o número real de casos.
  2. Como os laboratórios estão sobrecarregados, existe um atraso na obtenção dos resultados. Muitas vezes os casos devem ser reportados retroativamente, o que causa sempre um alvoroço. Acho importante a revisão dos dados a partir de novas informações .
  3. Os casos fatais nem sempre são contabilizados da mesma forma. Na Inglaterra apenas os que faleceram em hospitais aparecem nas estatísticas. No Brasil, quem faleceu em casa aparece nas estatísticas do COVID-19 , mesmo que tenha sofrido um enfarto súbito.

O exemplo da COVID-19  exemplifica os cuidados que temos que adotar ao analisar um conjunto de dados de uma sociedade ou empresa. O cientista de dados é o profissional encarregado deste trabalho. Segundo o Wikipédia: “Ciência de dados é uma área interdisciplinar voltada para o estudo e a análise de dados econômicos, financeiros e sociais, estruturados e não-estruturados, que visa a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão”

Desta forma a área de Analytics / Machine Learning  da Accurate formatou os dados da pandemia com outras fontes de informação para fornecer uma melhor análise do que está acontecendo no país.

Devido ao grande número de casos assintomáticos, não detectados, acredito que o número de mortes seja a melhor métrica para acompanhar a evolução da doença. 

Na Figura 1 vemos os dados de mortes acumulados desde o início da pandemia. As curvas tem início quando o número de casos em cada país atinge o número de 100 casos confirmados

Figura 1: Países: Número total de mortes por milhão de habitantes

Interessante notar que a Bélgica possui o maior número de mortes por milhão de habitantes – o dobro do Brasil  , fato que não é mencionado na mídia mundial.

Os dados cumulativos não nos permitem acompanhar com precisão o estágio atual da doença. Assim, um gráfico com o número de mortes nas últimas 24hs seria o mais recomendável. Devido a alta variabilidade dos dados diários é fundamental analisar a média dos óbitos nos últimos dias – até a  Rede Globo descobriu a agora famosa “média móvel” . Assim, para produzir o gráfico abaixo foi necessário a cada dia calcular a média do número de óbitos dos 7 dias anteriores ( isto é,  a soma total de óbitos nos 7 dias anteriores dividido por 7 ). Desta forma obtemos um gráfico mais “limpo” sem as pequenas variações diárias – também chamado ruído na linguagem estatística.

Figura 2: Países:  Média móvel de mortes por dia  por milhão de habitantes

Percebemos pela Figura 2 que a Bélgica já conseguiu controlar a epidemia,mas, infelizmente o Brasil assumiu a liderança desta triste competição. Eliminamos alguns países muito pequenos deste comparativo – seriam os “outliers” do estudo – estatisticamente seus números não são significativos.

Moro na cidade de  São Paulo, vamos ver qual a sua situação em comparação com outras capitais – veja a Figura 3.  São Paulo esteve sempre na mídia nacional por ser a maior cidade do país. Mas, a COVID-19 atingiu proporcionalmente São Paulo menos que outras capitais do Norte e Nordeste do país.  Atualmente, os números de mortes diárias por milhão de habitantes estão mais  semelhantes nas capitais do Brasil. Como a média diária de mortos continua estável no Brasil, podemos concluir que atualmente a epidemia está atingindo principalmente as cidades de médio  porte.

Figura 3: Capitais Brasileira :  Média móvel de mortes por dia  por milhão de habitantes

Na Figura 4 podemos comparar a evolução das mortes na cidade de São Paulo em comparação com o restante do estado. Podemos comprovar que a pandemia está em declínio na cidade de São Paulo, enquanto o estado está atualmente, proporcionalmente, mais atingido.

Figura 4: Cidade de São Paulo x Estado de São Paulo :  Média móvel de mortes por dia  por milhão de habitantes

Por fim, tentei analisar a situação do COVID-19 nos bairros da cidade de São Paulo. Infelizmente, a prefeitura da cidade não publica os dados em formato aberto para permitir uma análise detalhada da situação.  Consegui os dados abaixo através de solicitação especial ao Sistema Eletrônico de Informação ao Cidadão e-SIC – na data de 13/4/2020. Estávamos ainda no começo da pandemia, com poucos bairros atingidos pela doença.  Uma versão interativa deste mapa pode ser acessado clicando-se  no link: https://rubensmau.github.io/saopaulo_deaths_neighborhood.html

Figura 5: Subprefeituras  da cidade de São Paulo – taxa de óbitos por 100k habitantes

Fizemos um estudo de Analytics sobre a Covid-19 neste artigo – espero que tenham gostado.  Além de Analytics.

A Accurate possui uma  equipe especializada em Business Intelligence e Machine Learning, que poderá analisar seus dados e propor soluções inteligentes para seu negócio. 

Autor

Accurate
Accurate
Inovação faz parte do nosso DNA, nascemos com a missão da “busca constante de domínio de novas tecnologias de informação para fornecermos as soluções mais adequadas às necessidades do negócio dos nossos clientes”.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *