Statistics Analysis(통계 분석)
통계분석
통계분석 절차
0. 연구조사
- 연구문제 선정 : 독창성, 검증가능성, 실용성, 경제성 등 고려
- 예비조사 : 연구문제에 대한 사전지식 획득, 가설 도출 등을 위해 실시하는 조사
- 연구모형 : 개념과 변수를 식별하는 과정, 독립변수/종속변수 형태로 기술
1. 가설설정
- 주어진 연구 문제에 대한 예측적 해답
- 실증적인 증명에 앞서 세우는 잠정적인 진술
- 추후 논리적으로 검정될 수 있는 명제
- 통계분석을 통해 채택 또는 기각
- 가설 유형
- 귀무가설(영가설) : 부정적 형태 진술(차이가 없다, 관계가 없다 등)
- 대립가설(연구가설) : 긍정적 형태 진술(차이가 있다, 효과가 있다 등)
- 연구가설을 제시하고, 귀무가설을 통해 가설 검정
2. 유의수준과 임계값 결정
- 임계값 : 사회과학분야(α = 0.05) / 의,생명분야(α = 0.01)
- 유의수준 : 가설 채택 또는 기각 기준
- 유의(신뢰)수준 α와 p값 관계
- α > p값 : 대립가설 채택(귀무가설 기각)
- α <= p값 : 대립가설 기각(귀무가설 채택)
3. 측정도구 선정
- 가설에 나오는 변수를 무엇으로 측정할 것인가를 결정하는 단계
- 가설에 나오는 변수(변인) 추출
- 변수의 척도를 고려한 측정도구 선정
4. 데이터 수집
- 선정된 측정도구를 이용하여 설문 문항 작성 단계
- 정형/비정형 데이터 수집
5. 데이터 코딩
- 데이터 입력 및 전처리
6. 통계분석 수행
- 전문 통계분석 프로그램을 이용한 분석 단계
- 통계분석 방법을 계획하지 않고 데이터를 수집할 경우 실패확률 높음
7. 결과분석
- 연구목적과 대립가설에 대한 분석 및 검증 단계
- 주요 변인에 대한 기술통계량 제시
- 대립가설에 대한 통계량 검정 및 해석
- 연구자 의견 기술(논문/보고서 작성)
통계학
기술통계학
- 기능 : 수집된 자료의 특성을 쉽게 파악하기 위해서 자료를 정리 및 요약
- 방법 : 표, 그래프, 대푯값 등
추론통계학
- 기능 : 모집단에서 추출한 표본의 정보를 이용하여 모집단의 다양한 특성을 과학적으로 추론
- 방법 : 회귀분석, T-검정, 분산분석 등
모집단과 표본
전수조사
- 모집단 내에 있는 모든 대상 조사 방법
- 모집단의 특성을 정확히 반영
- 시간과 비용이 많이 소요되는 단점
표본조사(sampling)
- 모집단으로부터 추출된 표본을 대상으로 분석 실시
- 모집단의 특성을 반영하지 못하는 표본은 무용지물
가설검정 오류
제1종 오류
- 귀무가설이 참인 경우에 귀무가설을 기각하는 오류
제2종 오류
- 귀무가설이 거짓인 경우에 귀무가설을 채택하는 오류
검정통계량
- 가설 검정을 위해 수집된 자료를 계산한 통계량
- 가설 검정에서 기각역을 결정하는 기준이 되는 통계량
- 유의수준 값과 비교하여 귀무가설 기각/채택
정규분포
- 도수분포곡선이 평균값을 중앙으로 하여 좌우대칭인 종 모양
- 평균과 표준편차에 의해서 정규분포 모양과 위치가 결정됨
- 정규분포의 특징
- 데이터의 분포가 평균을 중심으로 많은 데이터가 모여있음
- 대부분 정규분포를 이룬다고 가정하고 통계분석 진행 -> 모수 검정
- 중심극한의 정리에 의해 데이터의 수가 많아질수록 정규분포를 따름
모수 / 비모수
모수 검정
- 관측값이 확률분포(정규분포, 이항분포 등)를 따른 경우
비모수 검정
- 관측값이 어느 특정한 확률분포를 따른다고 전제할 수 없는 경우
척도(Scale)
통계분석 방법과 변수척도 관계
January 17, 2020 에 작성
Tags:
R