1. 데이터 다운로드와 구조 설명

데이터는 총 2개입니다. 머신러닝을 알고리즘을 평가하기 위해 데이터는 흔히 2개로 분류합니다. 학습데이터와 테스트데이터로 나누는 것인데요.

원본 데이터(Original data set)가 2개의 데이터로 나눈 것입니다. 보통 7:3정도로 나누고 5:5로 나누는 경우도 있습니다.

데이터는 아래 파일로 다운로드 가능하시고, 링크(http://paullab.co.kr/타이타닉_데이터.zip)로도 다운로드 가능합니다.

train.csv

test.csv

2. 데이터 구조

데이터 구조는 아래와 같습니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/3d6e9612-c9a9-4341-83d9-532f1e495334/_2020-10-21__12.12.55.png