통계2 통계학계에서 발생한 재앙급 논란 (P-value 제대로 알고 쓰기) 학계에 이만한 스테디셀러이자 핫토픽인 통계개념이 없는데, 바로 통계 가설검정에 자주 쓰이는 P-value이다. 2011년도를 기점으로 이 P-value에 거의 '재앙급*'의 논란이 있었는데, 이는 아래의 두 사건이 발단이 되었다. (*실제로 여러 학자들이 'Statistical Crisis'라는 표현을 자주 썼다) 첫번째 사건. 학계에서는 Simmons, Nelson, Simonsohn 세 명의 심리학자들이 심리학계에 만연한 위양성(false-positive)문제를 통계적으로 검정한 화제의 2011년 논문 이후로, P-value에 대한 논란이 정점에 이르렀다. 위양성이란 틀린 결과값이 옳은 결과값이라고 잘못 추정된 경우를 의미한다. 의료계에서 자주 쓰이는 이 개념은 쉽게 말하면, 암세포가 음성인데 양성이.. 프로젝트/정박사의 인구학 2023. 10. 12. 파이썬 데이터분석 필수 라이브러리 TOP6 파이썬에는 데이터 분석 시 필요한 필수 라이브러리(패키지)가 몇 개 있다. 오늘은 파이썬 필수 라이브러리를 알아보고 각각의 특징과 기능을 소개하려고 한다. 1. Pandas 2. Numpy 3. Scipy 4. Matplotlib 5. Seaborn 6. Scikit-learn 1. Pandas Pandas는 데이터 분석의 가장 기초가 되는 라이브러리로, 데이터를 불러오는 것부터 데이터 저장, 데이터프레임 생성, 편집, 수정, 분석 등 다양한 기능을 제공한다. Python을 처음 수학할 때 가장 기초적으로 설치 및 학습하는 라이브러리가 바로 이 Pandas이다. Pandas의 주요 기능(function)으로는 DataFrame, merge, concat, read_table, read_csv, group.. 생활정보/파이썬 개발 2023. 7. 5. 이전 1 다음