통계 3

중심극한정리 / Central Limit Theorem 에 대해 알아보자

중심극한정리 : Central Limit Theorem 정의 vs 정리 이미 많이들 아시다시피 정의(Definition)과 정리(Theorem)은 서로 다른 개념이다. 정의(Definition)는 어떤 개념이나 용어의 의미를 정확히 정의(Define)하는 것이고 정리(Theorem)는 어떤 가설이나 명제를 증명(prove)하는 것이다. 가령, "집합"을 정의하기 위해 "원소"라는 개념을 사용하게되고, "집합은 서로 구별 가능한 원소들의 모임이다" 라는 정의를 사용해 "집합"을 정의한다. 반면, "만약 A가 B라면, A는 C이다"를 증명하고싶을 때, 적절한 수학적 기법과 논리를 사용하여 증명해야 한다. 아마 해당 가설은 삼단논법을 통해 매우 유명한 예시로 다들 알고있을 것이다. 중심극한정리는 통계학에서 매..

MACHINE LEARNING 2023.04.22

통계 / Chi-Squared distribution VS Poisson distribution (멍청일기)

통계적 지식이 있는 분께선 제목만 보고 이 사람이 무슨 말을 하고싶은건지 이해가 안되실 듯 싶습니다.. 우연히 poisson distribution에 대해 공부하다가, Chi-squared distribution와 그래프가 매우 유사해보이는 것 처럼 보여 연관성이 있는지 찾아보다 어이 없는 생각이었다는 걸 알게되어 저의 멍청한 삽질을 글로 정리하려고합니다... * 저 둘은 연관성이 없습니다. Poisson distribution 제가 해석한 poisson distribution의 의미는 다음과 같습니다. 고정된 구간(시간 or 공간)에서 사건이 발생하는 횟수를 표현한 discrete probability distribution n(시행 횟수)가 매우 크고, probability of success (p)..

MACHINE LEARNING 2023.03.23

Bias-Variance tradeoff 관계 해석

Bias 와 Variance 간의 tradeoff 관계를 여러가지 관점에서 해석해보고자 한다. 용어 Bias (편향) Learning algorithm에서 잘못된 가정(assumption)을 했을 때 발생하는 오차(error) 높은 bias 는 쏠림,치우침(편향)이 심하다는 의미이며 underfitting 문제를 야기한다. Variance (분산) Training set에 내재된 작은 변동(flucuation) 때문에 발생하는 오차(error) 높은 variance는 흩어져있다(큰 노이즈까지 모델링에 포함)는 의미이며 overfitting 문제를 야기한다. Tradeoff (상충관계) 한 쪽에서 이득을 얻으면 다른 쪽은 손해를 얻는 관계 원본 : https://www.cs.cornell.edu/cours..

MACHINE LEARNING 2023.02.19