-
[Kaggle] Bike Sharing Demand - 자전거 수요 예측 경진대회(RandomForestRegression)Codes & Programming 2021. 6. 13. 19:47
오늘은 이미 종료된 대회인 케글 Bike Sharing Demand 경진대회를 참가했다.
RandomFrorestRegression 을 통해서 예측하였고, 스코어는 위와같이 나왔다 :)
스코어는 RMSLE를 이용한다.
RMSLE는 Overestimate한 값보다 Underestimate 했을 때 패널티가 더 크고,. 또한 같은 논리선상에서 Outlier에 덜 예민하다고 한다.(참고: https://towardsdatascience.com/mercari-price-recommendation-for-online-retail-sellers-979c4d07f45c)
6년 전 경진대회 마감시 1등 스코어는 0.33756이다. 이미 마감된 컴피티션이라 순위는 나오지 않고 대략 123등(3,242팀)정도 되는 스코어인 듯 하다.
캐글코리아에서 블로그에서 퍼온, 하기 주피터 노트랩을 많이 참고하였다. 특히, 토탈 대여 Count(타겟)값을,
각각 회원별 Count / 비회원별 Count를 나누어 최종 값을 submission 한 점이 대단히 기억에 남는다.
또 코드를 읽어올 때에 parse_date로 당초 읽어오면, 나중에 연, 날짜, 시간 별로 나누어 컬럼 생성하고 시각화 하기 편하다.
컬럼생성 >
train = pd.read_csv('../input/bike-sharing-demand/train.csv', parse_dates = ['datetime']) train.head(5) train['datatime_year'] = train['datetime'].dt.year train['datetime-month'] = train['datetime'].dt.month train['datetime-day'] = train['datetime'].dt.day train['datetime-hour'] = train['datetime'].dt.hour train['datetime-minutes'] = train['datetime'].dt.minute train['datetime-second'] = train['datetime'].dt.second train['datetime-dayofweek'] = train['datetime'].dt.dayofweek
visualizaion>
f, ax = plt.subplots(2,3, figsize = (18,10)) sns.barplot(data=train, x='datatime_year', y="count", ax=ax[0][0]) sns.barplot(data=train, x ='datetime-month', y = 'count', ax= ax[0][1]) sns.barplot(data= train, x ='datetime-day', y = 'count', ax = ax[0][2]) sns.barplot(data=train, x='datetime-hour', y='count', ax = ax[1][0]) sns.barplot(data=train, x= 'datetime-minutes', y='count', ax=ax[1][1]) sns.barplot(data=train, x='datetime-second', y = 'count', ax=ax[1][2])
참고: https://kaggle-kr.tistory.com/28?category=868316
'Codes & Programming' 카테고리의 다른 글
[Python Basic] zip()과 Dict(), enumerate() 로 리스트를 딕셔너리로 바꾸기 (0) 2021.07.22 [git/conda] 명령어 모음 (0) 2021.07.08 [Pandas/Matplotlib] 소소하지만 알면 좋은 팁 (판다스 포맷, 플랏 한글폰트 깨짐, 화질 설정 등) (0) 2021.07.01 [Kaggle] 경진대회 - 타이타닉 생존률 예측 (Top 21%) (0) 2021.06.11 [Library] Matplotlib 베이직 - Plot, Scatter, Hist, Subplots (1) 2021.05.28