이 글이 데이터 분석을 할 때 필요한 지식이라 생각된다. 데이터 분석 후 결과해석을 할 때 잘못된 해석을 방지하기 위해 미리 통계학을 제대로 알자!! (혹시 저의 지식에 잘못된 부분이 있다면 댓글 부탁드립니다~) 평균 vs 중앙값 -> 많이 다르면 분포가 치우친다. 데이터 분석하기전에 미리 두가지 값을 구해서 비교해보자. 사분위수 : 프로그래밍 언어에 따라 다르다.(R, Python, ...). 연속형에서는 사분위수가 문제가 되지 않는다. 하지만 이산형의 경우 사분위수안에 포함된 데이터 수가 달라질 수 있기 때문에 좋은 지표가 되지는 못한다. 표본분산을 (n-1)로 나누는 이유 : n으로 나눌때보다 (n-1)로 나눌때 통계적으로 더 좋은 성질을 가진다. n으로 나누면 표본분산 ≠ 모집단 분산 (Bcs 표..