-
[Project2] 앙상블 모델을 활용한 고속도로 일일화물교통량 예측Project 2021. 7. 5. 14:28
코드스테이츠 AI부트캠프 4기, 2개월차 프로젝트로 '앙상블 모델을 이용한 고속도로 일일화물량 교통량 예측 머신러닝'을 기획하였다. 한국 도로교통공단에서 제공하고있는 영업소별 차량 데이터를 이용하여, 화물차량의 일별 교통량 예측모델을 구축하였다.
하기는 간략한 프로젝트 내역에 대한 설명이며, 기획안과 코드는 유첨한 링크에서 확인이 가능하다.
데이터셋:
한국 도로교통 공단제공 - 고속도로 영업소별 교통량 (분기별, 2019 3분기~2020 4분기)
한국 도로교통 공단제공 - 영업소별 사무소 지역 주소
기상청 제공 - 일자별 평균 기온, 풍속, 강수량
KOSIS 제공 - 지역별 광업,제조업 사업체 수, 지역별 광업,제조업 출하액 매출, 지역별 등록 운수, 창고업자 사업체 수와 매출액
사용 모델:
Random Forest Regressor
XGBoosting Regressor
Transformed Target Regressor
모듈&라이브러리
- EDA/Visualization
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
-Encoding & Modeing
from category_encoders import OrdinalEncoder, TargetEncoder
from sklearn.ensemble import RandomForestRegressor
from sklearn.compose import TransformedTargetRegressor
from sklearn.pipeline import make_pipeline, Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import RandomizedSearchCV
from scipy.stats import randint, uniform
from xgboost import XGBRegressor
-Visualization on estimated values & observation
from pdpbox.pdp import pdp_isolate, pdp_plot
import shap
1. 기획안:
https://www.notion.so/5a224918ab064344940a0e98b84133b0
2. 코드보기:
https://github.com/DamiSoh/Personal_Project/blob/main/AI_04_%EC%86%8C%EB%8B%B4_section2.ipynb
'Project' 카테고리의 다른 글
[Project1] 가설검정을 통한 글로벌 비디오 게임 데이터셋 매출분석 (캐글 데이터셋 활용) (0) 2021.06.02