Gejala utama infeksi Covid19
Gejala apa yang paling dominan menentukan bahwa seseorang terjangkit covid19? apakah demam?mual?pusing?. untuk menjawab pertanyaan ini, saya coba menganalisa
data yang dikumpulkan dari sekitar 1.700 respondent dari sebuah aplikasi Covid Tracker.
Data dalam file excel "symptoms.xlsx". Dengan metode klustering biasa tentu akan susah melihatnya meskipun bisa digambarkan dengan diagram VEN. Dengan coding R dihasilkan grafik yang lebih mudah dilihat dan dianalisa.
Gejala apa yang paling dominan menentukan bahwa seseorang terjangkit covid19? apakah demam?mual?pusing?. untuk menjawab pertanyaan ini, saya coba menganalisa
data yang dikumpulkan dari sekitar 1.700 respondent dari sebuah aplikasi Covid Tracker.
Diagram Venn |
Data dalam file excel "symptoms.xlsx". Dengan metode klustering biasa tentu akan susah melihatnya meskipun bisa digambarkan dengan diagram VEN. Dengan coding R dihasilkan grafik yang lebih mudah dilihat dan dianalisa.
Ranking gejala Covid19 |
library(tidyverse)
library(here)
library(janitor)
library(socviz)
library(ggrepel)
## --------------------------------------------------------------------
## Custom font and theme, omit if you don't have the myriad library
## (https://github.com/kjhealy/myriad) and associated Adobe fonts.
## --------------------------------------------------------------------
library(showtext)
showtext_auto()
library(myriad)
#import_myriad_semi()
#theme_set(theme_myriad_semi())
symptoms <- c("Anosmia", "Cough", "Fatigue", "Diarrhea", "Breath", "Fever")
names(symptoms) <- symptoms
dat <- readxl::read_xlsx("D:/R-BLOGGER/covid_symptoms-master/data/symptoms.xlsx")
dat %>% print(n = nrow(dat))
##head(dat)
## A tibble: 6 x 2
## combination count
## <chr> <dbl>
##1 Anosmia 140
##2 Cough 57
##3 Fatigue 198
##4 Diarrhea 12
##5 Breath 5
##6 Fever 11
subsets <- dat$combination
##subsets
## [1] "Anosmia" "Cough"
## [3] "Fatigue" "Diarrhea"
## [5] "Breath" "Fever"
## [7] "Cough&Fatigue" "Fatigue&Fever"
## [9] "Breath&Fatigue" "Diarrhea&Fatigue"
##[11] "Anosmia&Fatigue" "Breath&Cough"
##............................
##[31] "Anosmia&Breath&Cough&Diarrhea&Fatigue&Fever" ##"Anosmia&Cough&Diarrhea&Fatigue&Fever"
symptom_mat <- map_dfc(subsets, str_detect, symptoms) %>%
data.frame() %>%
t() %>%
as_tibble()
##symptom_mat
##A tibble: 32 x 6
## V1 V2 V3 V4 V5 V6
## <lgl> <lgl> <lgl> <lgl> <lgl> <lgl>
## 1 TRUE FALSE FALSE FALSE FALSE FALSE
## 2 FALSE TRUE FALSE FALSE FALSE FALSE
## 3 FALSE FALSE TRUE FALSE FALSE FALSE
## 4 FALSE FALSE FALSE TRUE FALSE FALSE
## 5 FALSE FALSE FALSE FALSE TRUE FALSE
colnames(symptom_mat) <- symptoms
symptom_mat$count <- dat$count
symptom_mat %>% print(n = nrow(symptom_mat))
indvs <- symptom_mat %>%
uncount(count)
##head(indvs)
## A tibble: 1,764 x 6
## Anosmia Cough Fatigue Diarrhea Breath Fever
## <lgl> <lgl> <lgl> <lgl> <lgl> <lgl>
## 1 TRUE FALSE FALSE FALSE FALSE FALSE
## 2 TRUE FALSE FALSE FALSE FALSE FALSE
##3 TRUE FALSE FALSE FALSE FALSE FALSE
##4 TRUE FALSE FALSE FALSE FALSE FALSE
##5 TRUE FALSE FALSE FALSE FALSE FALSE
## 6 TRUE FALSE FALSE FALSE FALSE FALSE
## 7 TRUE FALSE FALSE FALSE FALSE FALSE
## 8 TRUE FALSE FALSE FALSE FALSE FALSE
## 9 TRUE FALSE FALSE FALSE FALSE FALSE
##10 TRUE FALSE FALSE FALSE FALSE FALSE
library(ComplexUpset)
upset(indvs, symptoms,
name="Frekuensi Gejala Utama COVID19. Data total 1,764 individuals.",
min_size = 0,
width_ratio = 0.100) +
labs(title = "Kombinasi COVID-19 Symptoms",
caption = "File data: covid.joinzoe.com/us, recrafted by Bambangpe" )
library(here)
library(janitor)
library(socviz)
library(ggrepel)
## --------------------------------------------------------------------
## Custom font and theme, omit if you don't have the myriad library
## (https://github.com/kjhealy/myriad) and associated Adobe fonts.
## --------------------------------------------------------------------
library(showtext)
showtext_auto()
library(myriad)
#import_myriad_semi()
#theme_set(theme_myriad_semi())
symptoms <- c("Anosmia", "Cough", "Fatigue", "Diarrhea", "Breath", "Fever")
names(symptoms) <- symptoms
dat <- readxl::read_xlsx("D:/R-BLOGGER/covid_symptoms-master/data/symptoms.xlsx")
dat %>% print(n = nrow(dat))
##head(dat)
## A tibble: 6 x 2
## combination count
## <chr> <dbl>
##1 Anosmia 140
##2 Cough 57
##3 Fatigue 198
##4 Diarrhea 12
##5 Breath 5
##6 Fever 11
subsets <- dat$combination
##subsets
## [1] "Anosmia" "Cough"
## [3] "Fatigue" "Diarrhea"
## [5] "Breath" "Fever"
## [7] "Cough&Fatigue" "Fatigue&Fever"
## [9] "Breath&Fatigue" "Diarrhea&Fatigue"
##[11] "Anosmia&Fatigue" "Breath&Cough"
##............................
##[31] "Anosmia&Breath&Cough&Diarrhea&Fatigue&Fever" ##"Anosmia&Cough&Diarrhea&Fatigue&Fever"
symptom_mat <- map_dfc(subsets, str_detect, symptoms) %>%
data.frame() %>%
t() %>%
as_tibble()
##symptom_mat
##A tibble: 32 x 6
## V1 V2 V3 V4 V5 V6
## <lgl> <lgl> <lgl> <lgl> <lgl> <lgl>
## 1 TRUE FALSE FALSE FALSE FALSE FALSE
## 2 FALSE TRUE FALSE FALSE FALSE FALSE
## 3 FALSE FALSE TRUE FALSE FALSE FALSE
## 4 FALSE FALSE FALSE TRUE FALSE FALSE
## 5 FALSE FALSE FALSE FALSE TRUE FALSE
colnames(symptom_mat) <- symptoms
symptom_mat$count <- dat$count
symptom_mat %>% print(n = nrow(symptom_mat))
indvs <- symptom_mat %>%
uncount(count)
##head(indvs)
## A tibble: 1,764 x 6
## Anosmia Cough Fatigue Diarrhea Breath Fever
## <lgl> <lgl> <lgl> <lgl> <lgl> <lgl>
## 1 TRUE FALSE FALSE FALSE FALSE FALSE
## 2 TRUE FALSE FALSE FALSE FALSE FALSE
##3 TRUE FALSE FALSE FALSE FALSE FALSE
##4 TRUE FALSE FALSE FALSE FALSE FALSE
##5 TRUE FALSE FALSE FALSE FALSE FALSE
## 6 TRUE FALSE FALSE FALSE FALSE FALSE
## 7 TRUE FALSE FALSE FALSE FALSE FALSE
## 8 TRUE FALSE FALSE FALSE FALSE FALSE
## 9 TRUE FALSE FALSE FALSE FALSE FALSE
##10 TRUE FALSE FALSE FALSE FALSE FALSE
library(ComplexUpset)
upset(indvs, symptoms,
name="Frekuensi Gejala Utama COVID19. Data total 1,764 individuals.",
min_size = 0,
width_ratio = 0.100) +
labs(title = "Kombinasi COVID-19 Symptoms",
caption = "File data: covid.joinzoe.com/us, recrafted by Bambangpe" )
Kesimpulan:
Mengamati grafik batang di atas, dengan mudah disimpulkan bahwa gejala utama terjangkit covid19 dpt dirangking sbb:
1. Kehilangan indera penciuman (atau "Anosmia") + fatigue(lemah) tampaknya menjadi gejala umum Covid19 total ada 281
2. Gejala fatigue(lemah)+Anosmia+Cough(batuk2) menempati urutan kedua dengan total 259
3. Gejala tubuh lemah juga sudah mengindikasi terkena covid19 dengan total 198
4. Dst
link:
https://rpubs.com/bambangpe/601238
https://bambangpe.shinyapps.io/covid19-prediction/