Statistics and Linear Algebra
-
[Deep Learning] Lecture Note 2 - 210810Statistics and Linear Algebra 2021. 8. 10. 15:12
다중분류(Mutiple Classification) 딥러닝 모델에서 오차 함수 "categorical_crossentropy" 혹은 "sparse_categorical_crossentropy" 를 사용 1. categorical_crossentropy (다중 분류 손실 함수) 실측 결과와 출력값이 one-hot encoding형태로 구성된다. [ [1,0,0], [0,1,0], [0,0,1]] 2. sparse_categorical_crossentropy (다중 분류 손실함수) 실측 결과와 출력값이 Label Encoder같이 정수형 0 ~ N으로 구성될 때 쓰인다. 이진 분류에서 사용되는 오차함수 model.compile(loss='binary_crossentropy', optimizer=opt, me..
-
[Deep Learning] Lecture Note 1 - 210809Statistics and Linear Algebra 2021. 8. 9. 13:10
발췌 : 코드스테이츠 Section4- Sprint1 Lecture Notes 퍼셉트론이란 ? 다수의 신호를 입력받아 하나의 신호를 출력 하는 것 퍼셉트론 아래 그림에서 '원'으로 표현된 것을 뉴런 or 노드(node)라고 함. 입력신호(x0, x1, ...)가 뉴런에 입력되면 각각 고유한 가중치(화살표=weights, w0, w1, ...)가 곱해지고 다음 노드에서는 입력된 모든 신호를 더해줌. 이는 시냅스(synapses)의 연결강도(시냅스의 두께, 개수)와 같은 역할을 함 각 뉴런에서의 연산값이 정해진 임계값(TLU; Threshold Logic Unit)을 넘을 경우에만 다음 노드들이 있는 층(layer)으로 신호를 전달 신경망이란? ANN(Artificial Neural Networks) 인공 ..
-
[Data Scaling] 정규화(Normalization)와 표준화(Standarization)Statistics and Linear Algebra 2021. 6. 12. 16:58
정규화(Normalization)와 표준화(Standarization) 데이터 처리시 변수들의 단위값이 다른 경우, 이를 스케일링 해줘야할 필요가있다. 머신러닝시 예측값 도출에 영향을 미치기 때문이다. 정규화(Nomalization): 변수를 0~1(Min ~ Max)값으로 변환시켜 준다. 사이킷런(Sklearn)에서 사용하는 함수는 "MinMaxScaler"다. 1) fit으로 데이터를 맞추어주고, 2) transform으로 데이터를 변환해준다. fit자체로는 변환된 데이터를 볼 수 없을 것이다. 만일 둘을 한번에 하려는 경우에는 fit_transform()으로 해주면 된다. from sklearn.preprocessing import MinMaxScaler scaler=MinMaxScaler() sc..
-
[서적추천] 통계가 낯선 당신을 위한 달달구리 - 누워서 읽는 통계학Statistics and Linear Algebra 2021. 6. 11. 01:11
누워서 읽는 통계학 - 와쿠이 요시유키, 와쿠이 사다미 지음 (정가: 19,800원) https://www.hanbit.co.kr/store/books/look.php?p_code=B9477508508 누워서 읽는 통계학 다양한 형태의 도식화, 수학적 접근의 최소화, 통계 이론에 활용 사례를 더해 가장 쉬운 통계학 책이라 할 수 있습니다. www.hanbit.co.kr 이 책을 틈틈이 읽어 일주일만에 다 읽었다. 제목이 뻥튀기 급이긴 하다. "(완독 3회를 해야만) 누워서 읽는 통계학"으로 보면 되겠다. 거두절미하고 목차를 보면 왜 추천을 하는지 바로 알 수 있다. 데이터 종류부터 시작하여, 확률과 추정, 검정, 상관분석, 회귀분석 그리고 베이지안 정리까지 한 권에 무겁지 않게 다 담았다. 그리고 또 핵..
-
[통계] T 검정 (스튜던트 T-test) One Sample / Two Sample T-testStatistics and Linear Algebra 2021. 5. 29. 19:56
깃허브에서 코드보기 Student T-test¶ T- 검정은 모집단의 분산이나 표준편차를 알지 못할 때, 표본으로부터 추정된 분산이나 표준편차를 이용하여 두 모집단의 평균의 차이를 알아보는 검정 방법이다. 집단의 수는 최대 2개까지 비교 가능하며 3개 이상인 경우 분산분석(ANOVA)를 사용한다. '평균'을 비교하는 분석임을 잊지말자. T-검정의 가정 1)종속변수가 양적 변수일 때 2)모집단의 분산이나 표준편차를 알지 못할 때 3)모집단의 분포가 정규분포일 때 One Sample T-test¶ 1개의 샘플(표본) 평균이 특정값(or 모집단)의 평균과 같은지/다른지를 판단 귀무가설: $\mu = \bar{X} $ 평균이 같다 대립가설: $\mu \neq \bar{X}$ X 같지 않다 (1) 귀무가설 설정 ..
-
[선형대수] 벡터의 내적, 전치행렬, 공분산, 상관계수Statistics and Linear Algebra 2021. 5. 29. 19:26
깃허브에서 코드보기 DamiSoh/Posting_Materials Contribute to DamiSoh/Posting_Materials development by creating an account on GitHub. github.com 벡터의 기본 개념 및 고교 수학 기록¶ 벡터의 내적(Dot Product)¶ Terms Alert ! 곱, 내적, 정사영, Projection 벡터의 내적은 결과값이 스칼라로 표현됩니다. 우리가 익숙한 식은 다음과 같습니다. $\vec{a}$와 $\vec{b}$ 에서 수선의 발을 내려 $\vec{a}$와 내적하는 부분을 곱해주는 것입니다. 그 길이는 |b|의 코사인 세타입니다. 또, 평면벡터일 때는 하기와 같이 계산합니다. 출처: 수악중독 선형대수에서 마주친 벡터가 너..