Statistics Analysis(통계 분석)


통계분석

통계분석 절차

0. 연구조사

  • 연구문제 선정 : 독창성, 검증가능성, 실용성, 경제성 등 고려
  • 예비조사 : 연구문제에 대한 사전지식 획득, 가설 도출 등을 위해 실시하는 조사
  • 연구모형 : 개념과 변수를 식별하는 과정, 독립변수/종속변수 형태로 기술

1. 가설설정

  • 주어진 연구 문제에 대한 예측적 해답
  • 실증적인 증명에 앞서 세우는 잠정적인 진술
  • 추후 논리적으로 검정될 수 있는 명제
  • 통계분석을 통해 채택 또는 기각
  • 가설 유형
    • 귀무가설(영가설) : 부정적 형태 진술(차이가 없다, 관계가 없다 등)
    • 대립가설(연구가설) : 긍정적 형태 진술(차이가 있다, 효과가 있다 등)
    • 연구가설을 제시하고, 귀무가설을 통해 가설 검정

2. 유의수준과 임계값 결정

  • 임계값 : 사회과학분야(α = 0.05) / 의,생명분야(α = 0.01)
  • 유의수준 : 가설 채택 또는 기각 기준
  • 유의(신뢰)수준 α와 p값 관계
    • α > p값 : 대립가설 채택(귀무가설 기각)
    • α <= p값 : 대립가설 기각(귀무가설 채택)

3. 측정도구 선정

  • 가설에 나오는 변수를 무엇으로 측정할 것인가를 결정하는 단계
  • 가설에 나오는 변수(변인) 추출
  • 변수의 척도를 고려한 측정도구 선정

4. 데이터 수집

  • 선정된 측정도구를 이용하여 설문 문항 작성 단계
  • 정형/비정형 데이터 수집

5. 데이터 코딩

  • 데이터 입력 및 전처리

6. 통계분석 수행

  • 전문 통계분석 프로그램을 이용한 분석 단계
  • 통계분석 방법을 계획하지 않고 데이터를 수집할 경우 실패확률 높음

7. 결과분석

  • 연구목적과 대립가설에 대한 분석 및 검증 단계
  • 주요 변인에 대한 기술통계량 제시
  • 대립가설에 대한 통계량 검정 및 해석
  • 연구자 의견 기술(논문/보고서 작성)

통계학

기술통계학

  • 기능 : 수집된 자료의 특성을 쉽게 파악하기 위해서 자료를 정리 및 요약
  • 방법 : 표, 그래프, 대푯값 등

    추론통계학

  • 기능 : 모집단에서 추출한 표본의 정보를 이용하여 모집단의 다양한 특성을 과학적으로 추론
  • 방법 : 회귀분석, T-검정, 분산분석 등

모집단과 표본

전수조사

  • 모집단 내에 있는 모든 대상 조사 방법
  • 모집단의 특성을 정확히 반영
  • 시간과 비용이 많이 소요되는 단점

    표본조사(sampling)

  • 모집단으로부터 추출된 표본을 대상으로 분석 실시
  • 모집단의 특성을 반영하지 못하는 표본은 무용지물

가설검정 오류

제1종 오류

  • 귀무가설이 참인 경우에 귀무가설을 기각하는 오류

    제2종 오류

  • 귀무가설이 거짓인 경우에 귀무가설을 채택하는 오류

검정통계량

  • 가설 검정을 위해 수집된 자료를 계산한 통계량
  • 가설 검정에서 기각역을 결정하는 기준이 되는 통계량
  • 유의수준 값과 비교하여 귀무가설 기각/채택

정규분포

  • 도수분포곡선이 평균값을 중앙으로 하여 좌우대칭인 종 모양
  • 평균과 표준편차에 의해서 정규분포 모양과 위치가 결정됨
  • 정규분포의 특징
    • 데이터의 분포가 평균을 중심으로 많은 데이터가 모여있음
    • 대부분 정규분포를 이룬다고 가정하고 통계분석 진행 -> 모수 검정
    • 중심극한의 정리에 의해 데이터의 수가 많아질수록 정규분포를 따름

모수 / 비모수

모수 검정

  • 관측값이 확률분포(정규분포, 이항분포 등)를 따른 경우

    비모수 검정

  • 관측값이 어느 특정한 확률분포를 따른다고 전제할 수 없는 경우
    image

척도(Scale)

image

통계분석 방법과 변수척도 관계

image

January 17, 2020 에 작성
Tags: R