728x90
matrix 함수를 통해 데이터프레임의 어느 위치에 결측값이 있는지 확인할 수 있다.
목표 변수인 Survived 열과 상관 계수가 높은 피처는 Pclass와 Fare이다. 객실 등급과 객실 요금을 뜻하는 두 피처의 상관 계수는 -0.55로 매우 강한 음의 상관 관계가 있다. 따라서 객실 등급에 따라 객실 요금이 달라지는 것을 알 수 있다.
숫자형 데이터를 가진 열을 추출하고, data_num에 저장한다.
fillna 메소드를 사용하여 'Age'열의 결측값을 평균값으로, 'Fare'열의 결측값은 가장 빈도수가 많은 값으로 대체한다.
정밀도(Precision)가 높다는 것은 실제 False를 True로 잘못 예측하는 오류가 작다는 뜻이다.
재현율(Recall)이 높다는 것은 실제 True를 False로 잘못 예측하는 오류가 낫다는 뜻이다.
F1 지표는 정확도와 재현율의 조화 평균을 계산한 것으로 높을수록 예측력이 좋다.
728x90
'AI > Machine Learning&Deep Learning' 카테고리의 다른 글
Deep Learning_인공 신경망의 구조&활성화 함수 (0) | 2021.03.29 |
---|---|
Machine Learning_피처 엔지니어링 (0) | 2021.03.29 |
Machine Learning_확률적 경사 하강법 (0) | 2021.03.28 |
Machine Learning_선형 회귀 (0) | 2021.03.27 |
Machine Learning_K-최근접 이웃 회귀 (0) | 2021.03.27 |