MBA em Ciência de Dados - Estatística para Ciência de Dados

Avaliação Final - Terceira e Quarta questões

Aluno: Rafael Capaci Pereira

Professora e Professor: Cibele Russo e Francisco Rodrigues

Cemeai - ICMC/USP São Carlos

Informações

Na base de dados comorbidades.csv, são apresentados dados reais de uma amostra obtida do seade-R (Fonte dos dados originais: https://github.com/seade-R/dados-covid-sp). Essa base de dados contém as seguintes informações sobre pacientes que foram internados com diagnóstico de COVID-19 entre fevereiro de 2020 e maio de 2021:

As observações com dados faltantes foram excluídas da base original para esta análise específica, considerando que essa exclusão não afeta a representatividade da amostra.

Questão 3

Enunciado

Descreva por meio de gráficos a associação entre idade e óbito, e repita para sexo e óbito.

Considere então as comorbidades: asma, cardiopatia, diabetes, doença renal e obesidade e investigue a associação de cada uma delas com a variável óbito.

Note que algumas variáveis estão codificadas em 0 e 1 mas são qualitativas. Fique atento à forma de analisar a associação entre duas variáveis qualitativas.

Comente os resultados obtidos, observando que não é possível concluir estatisticamente se existe ou não associação entre as variáveis apenas com análise exploratória.

Desenvolvimento da resposta

Óbitos por idade

Ao realizar essa observação, as idades foram agrupadas de 5 em 5 anos, para não poluir demais os gráficos.