Contudo, esta tabela não ajuda muito, pois estamos comparando regiões do país com números muito diferentes de habitantes.
A população da região Sudeste, por exemplo, é quase 5 vezes superior à da região Norte, uma diferença muito grande.
Para realizar uma comparação eficiente do estágio da doença no país, deve-se realizar a análise do número de mortes por milhão de habitantes.
Este caminho de análise pode parecer óbvio para muitos, no entanto, muitos veículos jornalísticos ainda não tomam este cuidado.
Importante salientar que existem muitos problemas para a obtenção de dados confiáveis com critérios homogêneos, tanto no Brasil como fora dele, isso porque:
- Muitos casos são assintomáticos, assim, e mesmo que fosse possível testar todos os doentes, ainda não saberíamos o número real de casos;
- Como os laboratórios estão sobrecarregados, existe um atraso na obtenção dos resultados.
Muitas vezes os casos devem ser reportados retroativamente, o que causa sempre um alvoroço. Acho importante a revisão dos dados a partir de novas informações.
- Os casos fatais nem sempre são contabilizados da mesma forma. Na Inglaterra apenas os que faleceram em hospitais aparecem nas estatísticas.
No Brasil, quem faleceu em casa aparece nas estatísticas do COVID-19, mesmo que tenha sofrido um enfarto súbito.
O exemplo da COVID-19 exemplifica os cuidados que temos que adotar ao analisar um conjunto de dados de uma sociedade ou empresa.
O cientista de dados é o profissional encarregado e preparado para a realização deste trabalho.
Segundo o Wikipédia:
“Ciência de dados é uma área interdisciplinar voltada para o estudo e a análise de dados econômicos, financeiros e sociais, estruturados e não-estruturados, que visa a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão”
Análise de Dados através do Analytics
Mediante a tudo isso que foi apresentado anteriormente a área de Analytics / Machine Learning da Accurate formatou os dados da pandemia com outras fontes de informação.
Dessa forma é possível fornecer uma melhor análise da real situação da doença no país.
Devido ao grande número de casos assintomáticos, não detectados, o número de mortes acaba se tornando a melhor métrica para acompanhar a evolução da doença.
Na Figura 1, apresentada abaixo, é possível ver os dados de mortes acumulados desde o início da pandemia.
As curvas se iniciam quando o país registra o número de 100 casos confirmados da doença.
Figura 1: Países – Número total de mortes por milhão de habitantes