Investigando o COVID-19 através de Analytics - Blog Accurate Blog Accurate

Computador e pessoa realizando a análise de COVID-19 com a ferramenta Analytics.

Investigando o COVID-19 através de Analytics

Entenda como funciona essa análise pelo Analytics

Analisar dados e informações acerca da área que a sua empresa atua por meio do Analytics é uma forma muito eficiente para o planejamento de ações da empresa.

Pensando nisso, esse material foi preparado, para mostrar como uma análise minuciosa pode ajudar o seu empreendimento.

Continue nesse texto e veja a investigação realizada dos dados e informações sobre a COVID-19 através do Analytics.

Os dados sobre a pandemia da COVID-19

Desde o início da pandemia do vírus COVID-19 somos bombardeados na mídia por inúmeras análises, tabelas e artigos sobre o número de doentes e mortes. 

Veja abaixo um exemplo típico:

Contudo, esta tabela não ajuda muito, pois estamos comparando regiões do país com números muito diferentes de habitantes. 

A população da região Sudeste, por exemplo, é quase 5 vezes superior à da região Norte, uma diferença muito grande.

Para realizar uma comparação eficiente do estágio da doença no país, deve-se realizar a análise do número de mortes por milhão de habitantes. 

Este caminho de análise pode parecer óbvio para muitos, no entanto, muitos veículos jornalísticos ainda não tomam este cuidado.

Importante salientar que existem muitos problemas para a obtenção de dados confiáveis com critérios homogêneos, tanto no Brasil como fora dele, isso porque:

  • Muitos casos são assintomáticos, assim, e mesmo que fosse possível testar todos os doentes, ainda não saberíamos o número real de casos;
  • Como os laboratórios estão sobrecarregados, existe um atraso na obtenção dos resultados. 

Muitas vezes os casos devem ser reportados retroativamente, o que causa sempre um alvoroço. Acho importante a revisão dos dados a partir de novas informações.

  • Os casos fatais nem sempre são contabilizados da mesma forma. Na Inglaterra apenas os que faleceram em hospitais aparecem nas estatísticas. 

No Brasil, quem faleceu em casa aparece nas estatísticas do COVID-19, mesmo que tenha sofrido um enfarto súbito.

O exemplo da COVID-19  exemplifica os cuidados que temos que adotar ao analisar um conjunto de dados de uma sociedade ou empresa. 

O cientista de dados é o profissional encarregado e preparado para a realização deste trabalho.

Segundo o Wikipédia:

 “Ciência de dados é uma área interdisciplinar voltada para o estudo e a análise de dados econômicos, financeiros e sociais, estruturados e não-estruturados, que visa a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão”

Análise de Dados através do Analytics

Mediante a tudo isso que foi apresentado anteriormente a área de Analytics / Machine Learning  da Accurate formatou os dados da pandemia com outras fontes de informação.

Dessa forma é possível fornecer uma melhor análise da real situação da doença no país.

Devido ao grande número de casos assintomáticos, não detectados, o número de mortes acaba se tornando a melhor métrica para acompanhar a evolução da doença. 

Na Figura 1, apresentada abaixo, é possível ver os dados de mortes acumulados desde o início da pandemia. 

As curvas se iniciam quando o país registra o número de 100 casos confirmados da doença.

Figura 1: Países – Número total de mortes por milhão de habitantes

Interessante notar que a Bélgica possui o maior número de mortes por milhão de habitantes – o dobro do Brasil, fato que não é mencionado na mídia mundial.

Os dados cumulativos não nos permitem acompanhar com precisão o estágio atual da doença. 

Montando um Gráfico de Média de Mortes Diárias

Assim, um gráfico com o número de mortes nas últimas 24hs seria o mais recomendável para isso. 

Devido à alta variabilidade dos dados diários é fundamental analisar a média dos óbitos nos últimos dias –  é a conhecida “média móvel” que a Rede Globo adotou.

Para produzir o gráfico abaixo foi necessário então calcular a média do número de óbitos dos últimos 7 dias – isto é, a soma total de óbitos nos 7 dias anteriores dividido por 7. 

Desta forma obtemos um gráfico mais “limpo” sem as pequenas variações diárias – também chamado de ruído na linguagem estatística.

Figura 2: Países – Média móvel de mortes por dia  por milhão de habitantes

Pela figura 2 é possível perceber que a Bélgica conseguiu controlar a epidemia, mas em comparação o Brasil assumiu a liderança desta triste competição. 

Foi eliminado do gráfico alguns países muito pequenos deste comparativo – seriam os “outliers” do estudo – pois, estatisticamente, seus números não são significativos.

Análise das Capitais brasileiras

Vamos analisar os dados a partir da visão de alguém que mora na cidade de  São Paulo, vendo a sua situação em comparação com outras capitais – veja a Figura 3.  

São Paulo é a maior cidade do país, e por conta disso sempre esteve no foco da mídia nacional.

No entanto, a COVID-19 atingiu proporcionalmente São Paulo menos que outras capitais do Norte e Nordeste do país.

Atualmente, os números de mortes diárias por milhão de habitantes nas capitais do Brasil, são mais semelhantes entre si.

Como a média diária de mortos continua estável no Brasil, podemos concluir que atualmente a epidemia está atingindo principalmente as cidades de médio porte.

Figura 3: Capitais Brasileiras – Média móvel de mortes por dia  por milhão de habitantes

Análise do estado de São Paulo

Na Figura 4 podemos comparar a evolução das mortes na cidade de São Paulo em comparação com o restante do estado. 

É possível comprovar que a pandemia está em declínio na cidade de São Paulo, enquanto o estado como um todo está atualmente, proporcionalmente, mais atingido.

Figura 4: Cidade de São Paulo x Estado de São Paulo – Média móvel de mortes por dia  por milhão de habitantes

Por fim, analisamos a situação do COVID-19 ao longo dos bairros da cidade de São Paulo. 

Infelizmente, a prefeitura da cidade não publica os dados em formato aberto para permitir uma análise detalhada da situação.  

Os dados abaixo foram conseguidos através de solicitação especial ao Sistema Eletrônico de Informação ao Cidadão e-SIC – na data de 13/4/2020. 

Na data da obtenção dos dados ainda estávamos no começo da pandemia, com poucos bairros atingidos pela doença.  

Uma versão interativa deste mapa pode ser acessada aqui.

Figura 5: Subprefeituras  da cidade de São Paulo – taxa de óbitos por 100k habitantes

Estudo de Analytics, Business Intelligence e Machine Learning é na Accurate

Nesse material foi mostrado um estudo de Analytics sobre a Covid-19 realizada por um dos profissionais de Analytics da Accurate.

Além de Analytics, a Accurate possui equipe especializada em Business Intelligence e Machine Learning.

Tudo isso para poder fornecer análise de dados completas sobre a sua empresa e assim propor soluções inteligentes para seu negócio. 

Conheça agora! Não deixe de compartilhar e acompanhar o Blog da Accurate e as Redes Sociais: Facebook, Instagram, Twitter, Linkedin e YouTube.

Autor

Accurate
Accurate
Inovação faz parte do nosso DNA, nascemos com a missão da “busca constante de domínio de novas tecnologias de informação para fornecermos as soluções mais adequadas às necessidades do negócio dos nossos clientes”.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *