통계학 2

통계학 개론(Tips + 잘못된 통계학 지식 바로잡기)

이 글이 데이터 분석을 할 때 필요한 지식이라 생각된다. 데이터 분석 후 결과해석을 할 때 잘못된 해석을 방지하기 위해 미리 통계학을 제대로 알자!! (혹시 저의 지식에 잘못된 부분이 있다면 댓글 부탁드립니다~) 평균 vs 중앙값 -> 많이 다르면 분포가 치우친다. 데이터 분석하기전에 미리 두가지 값을 구해서 비교해보자. 사분위수 : 프로그래밍 언어에 따라 다르다.(R, Python, ...). 연속형에서는 사분위수가 문제가 되지 않는다. 하지만 이산형의 경우 사분위수안에 포함된 데이터 수가 달라질 수 있기 때문에 좋은 지표가 되지는 못한다. 표본분산을 (n-1)로 나누는 이유 : n으로 나눌때보다 (n-1)로 나눌때 통계적으로 더 좋은 성질을 가진다. n으로 나누면 표본분산 ≠ 모집단 분산 (Bcs 표..

Statistics 2020.12.06

통계학 개론

학교 연구실에서 학부연구원으로 공부를 하게 되었다. 지도교수님이 인성적으로도 훌륭하시고 지금까지 내가 만났던 선생님, 교수님들을 통틀어서 단연 최고의 수학 실력을 가지신 분이시다. 교수님께서 학부 연구생들에게 통계학 개론을 강의 해주신다고 하셔서 세미나에 참석했다. 그리고 그 효과는 굉장했다..! 지금부터 그 내용을 공유하겠다. 집중~~! Data 분석 전 Tip 1. Scale 파악 2. Box-plot, graph 등등을 해보면서 데이터를 시각화 해준다. 그리고 평균, 분산 등 모수들을 구해 데이터의 특징을 파악한다. 3. Normalize : 데이터들을 정규화 시켜준다. (필요한 경우) 1-1 용어 유한 모집단 -> 복원 추출 -> 무한 모집단 취급 무한 모집단 범주형 vs 수치형 : 범주형, 수치..

Statistics 2020.12.06