이번에는 EDA를 한다음 의미있는 결과가 있으면 파생변수를 추가한후 랜덤포레스트 분석을 시행해보겠습니다. > library(dplyr, caret, randomForest,pROC) > set.seed(1234) > x_train y_train full full$최대구매액 full$총구매액 full$환불금액 full$환불금액 full$주구매상품 full$주구매지점 full$gender full full %>% + filter(총구매액 > quantile(full$총구매액, 0.8)) %>% + group_by(gender) %>% + summarise(count=n()) # A tibble: 2 x 2 gender count 1 0 545 2 1 155 > full %>% + filter(최대구매액 > ..