-
[Kaggle] 경진대회 - 타이타닉 생존률 예측 (Top 21%)Codes & Programming 2021. 6. 11. 14:03
Github에서 Code 보기 >
https://github.com/DamiSoh/Posting_Materials/blob/main/Titanic_submission.ipynb
Horay ~ Tada !
오늘 처음으로 캐글에 서브미션을 해보았다. 타이타닉 Train 데이터로 Test 데이터의 생존여부 (0 혹은 1)를 예측하는 것이었다.
EDA >
Age 의 Null 값 -> "Mr", "Mrs" 등 " Name" Feature에서 뽑아와 평균치로 넣어주었고,
Cabin의 Null값 -> 평균치로 넣어주었다.
또한 카테코리컬 변수는 One Hot Encoding으로 변경하였다.
Model>
예측모델은 로지스틱 회귀모델(Logistic Regression)으로 예측하였다.
Age Null값 채우기는 하기 캐글 코드를 참고하였다 :)
EDA - https://www.kaggle.com/ash316/eda-to-prediction-dietanic
나쁘지 않은 스코어라고 생각했다. 다음번에 수정해서 더 올려봐야겠다
'Codes & Programming' 카테고리의 다른 글
[Python Basic] zip()과 Dict(), enumerate() 로 리스트를 딕셔너리로 바꾸기 (0) 2021.07.22 [git/conda] 명령어 모음 (0) 2021.07.08 [Pandas/Matplotlib] 소소하지만 알면 좋은 팁 (판다스 포맷, 플랏 한글폰트 깨짐, 화질 설정 등) (0) 2021.07.01 [Kaggle] Bike Sharing Demand - 자전거 수요 예측 경진대회(RandomForestRegression) (0) 2021.06.13 [Library] Matplotlib 베이직 - Plot, Scatter, Hist, Subplots (1) 2021.05.28