dalgorithm
달공의 개발기
dalgorithm
전체 방문자
오늘
어제
  • 분류 전체보기 (170)
    • Back-end (0)
    • Java (11)
    • 자료구조 (7)
    • Network (31)
    • Database (9)
    • Baekjoon Online (24)
    • 클라우드 (6)
    • Android (15)
      • Kotlin (14)
    • AI (27)
      • Machine Learning&Deep Learn.. (27)
    • Web (23)
      • Webhacking (17)
      • WebProgramming (6)
    • 기술면접 (1)
      • JAVA&자료구조 (0)
      • Spring (0)
      • 컴퓨터구조&운영체제 (0)
      • 네트워크 (0)
      • 데이터베이스 (0)
    • CTF 스터디 (15)
    • 대외활동 (1)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 인공지능
  • 침입탐지
  • CTF
  • 자료구조
  • 코드리뷰
  • 클라우드
  • python #백준
  • Guacamole
  • 네트워크
  • 포너블
  • db
  • java
  • 딥러닝
  • gcp
  • kotlin
  • cs
  • 데이터베이스
  • 웹해킹
  • 머신러닝
  • 자바

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
dalgorithm

달공의 개발기

Machine Learning_타이타닉 생존자 예측
AI/Machine Learning&Deep Learning

Machine Learning_타이타닉 생존자 예측

2021. 3. 29. 22:01
728x90

matrix 함수를 통해 데이터프레임의 어느 위치에 결측값이 있는지 확인할 수 있다.

 

목표 변수인 Survived 열과 상관 계수가 높은 피처는 Pclass와 Fare이다. 객실 등급과 객실 요금을 뜻하는 두 피처의 상관 계수는 -0.55로 매우 강한 음의 상관 관계가 있다. 따라서 객실 등급에 따라 객실 요금이 달라지는 것을 알 수 있다.

 

숫자형 데이터를 가진 열을 추출하고, data_num에 저장한다.

fillna 메소드를 사용하여 'Age'열의 결측값을 평균값으로, 'Fare'열의 결측값은 가장 빈도수가 많은 값으로 대체한다.

 

정밀도(Precision)가 높다는 것은 실제 False를 True로 잘못 예측하는 오류가 작다는 뜻이다.

재현율(Recall)이 높다는 것은 실제 True를 False로 잘못 예측하는 오류가 낫다는 뜻이다.

F1 지표는 정확도와 재현율의 조화 평균을 계산한 것으로 높을수록 예측력이 좋다.

 


출처: www.aladin.co.kr/shop/wproduct.aspx?ItemId=258095934

728x90

'AI > Machine Learning&Deep Learning' 카테고리의 다른 글

Deep Learning_인공 신경망의 구조&활성화 함수  (0) 2021.03.29
Machine Learning_피처 엔지니어링  (0) 2021.03.29
Machine Learning_확률적 경사 하강법  (0) 2021.03.28
Machine Learning_선형 회귀  (0) 2021.03.27
Machine Learning_K-최근접 이웃 회귀  (0) 2021.03.27
    'AI/Machine Learning&Deep Learning' 카테고리의 다른 글
    • Deep Learning_인공 신경망의 구조&활성화 함수
    • Machine Learning_피처 엔지니어링
    • Machine Learning_확률적 경사 하강법
    • Machine Learning_선형 회귀
    dalgorithm
    dalgorithm

    티스토리툴바