<왕초보>임상논문 보는법(3) 통계방법
상태바
<왕초보>임상논문 보는법(3) 통계방법
  • 승인 2016.12.22 09:10
  • 댓글 0
이 기사를 공유합니다
이준우 이상헌

이준우 이상헌

mjmedi@http://


임상시험의 시작, 'Sample Size' 정하는 것 중요

귀무가설

통계의 시작은 ‘소청룡탕 보험한약이 전혀 효과가 없다’라는 가설에서 시작한다. 즉, 소청룡탕 보험한약을 처방하거나 전분가루를 처방하거나 효과가 없다. 혹 있더라도 소청룡탕이나 전분가루로 인한 효과가 아니고 모두 플라시보(placebo)일 뿐이라는 것이다. 이를 귀무가설이라고 한다. 이 귀무가설이 통계적으로 유의성 있게 거짓으로 나온다면 ‘소청룡탕이 효과가 없다’는 귀무가설이 거짓이 되고 반대로 ‘소청룡탕이 효과가 있다’는 대립가설을 선택하는 결론에 이르게 된다.
고전적 통계방법론에서는 통계적으로 유의성이 있다는 기준을 5%로 잡고 있다. 이는 우리가 임상시험을 반복적으로 100번 시행했을 때, 그 ‘소청룡탕이 효과가 없음’을 보여주는 결과값이 정규분포상에서 5번 미만의 확률로 발생된다면 이를 p<0.05라고 표현하며, 보수적 관점인 귀무가설이 틀렸고 대립가설이 옳다고 보는 것이다.

 

Sample size

임상시험을 진행하는데 있어서 환자의 수, 즉 sample size를 정하는 것은 아주아주 중요하다. 똑같은 효과가 있다고 한다면, sample size가 많아지면 많아질수록 신뢰도가 올라간다. 예컨대 알레르기 비염 환자를 잘 치료하는 의사가 있다고 치자. 비염환자 10명 중에서 9명을 치료한다면 나름 잘 치료한다고 할 수 있다. 하지만 비염 환자 100명 중에서 90명을 치료하고 나아가 1000명 중에서 900명을 치료해낸다면 신뢰도는 더욱 올라갈 것이다. 치료율은 90%로 일정하더라도 비염 환자의 수(sample size)가 많으면 많을수록 신뢰도가 올라가게 되고 이 의사가 명의라는 것을 충분히 입증하는 것이 된다.
하지만 실제 임상시험을 진행하는 데는 sample size가 많기만 한다고 좋은 것은 아니고 적절한 sample size를 구하는 것이 중요하다. 이것은 비교적 어려운 개념이기 때문에, 1종 오류와 2종 오류 그리고 sample size 계산법 등은 추후에 설명하고자 한다.

 

비모수 검정과 모수 검정

우리가 비교하려는 sample이 정규분포를 이루고 있으면 두 집단의 정규분포를 비교하면 된다. 그래서 두 정규분포가 비슷하면 귀무가설이 참이 되지만, ‘두 정규분포가 유의하게(p<0.05) 서로 다른 정규분포를 이룬다면’(그림1) 귀무가설이 거짓이 되고 소청룡탕이 전분가루에 비해서 효과가 있다는 결론에 도달하게 되는 것이다. 두 정규분포를 비교하는 통계방법을 모수검정이라고 한다.
그러나 sample size가 작으면 정규분포를 이룬다고 확신할 수가 없고, 그 때는 비모수 검정을 하게 된다. 일반적으로 sample size가 30명 이하이고, 우리가 측정하고자 하는 평가항목 예컨대 알레르기 질환의 호전도(종속 또는 반응변수라고 한다)의 분포가 선행연구에서 정규분포를 보이지 않는다면 비모수 검정을 한다.
간단하게 정리해본다면 sample size가 작으면 비모수 검정을, 크면 모수 검정을 시행하며 그 기준은 정규성 검정을 통해서 하지만 치료군과 대조군 합해서 대략 30명이상이면 모수 검정을 적용한다고 기억해두면 되겠다. 한의학 관련 임상연구는 적은 피험자 숫자로 진행하는 연구들이 많아서 비모수 검정을 이용하는 사례가 많다.


4가지 통계방법

Sample size에 따라서 크게 모수 검정과 비모수 검정으로 나뉘고, 그 이외에도 연구방법이 서로 다르면 그에 따른 통계방법이 달라진다. 한꺼번에 모든 통계방법을 소개하는 것은 힘들기 때문에 이 글에서는 우선 4가지 통계방법만 소개하고자 한다.
소청룡탕 투여군과 전분가루 투여군의 호전도를 비교하는 것을 대조군비교 연구라고 한다면, 소청룡탕을 투여하기 전과 후의 콧물점수를 비교하는 것을 같은 군의 전후비교 연구라고 한다. 서로 다른 두 군의 효과를 비교하는 것과 같은 군의 전후 상태를 비교하는 것은 통계방법이 서로 다르며, 모수 검정일 경우 대조군비교 연구에는 student's t-test 그리고 전후비교 연구에는 paired t-test라는 방법을 사용한다. 비모수검정일 경우 통계방법이 바뀌게 되는데, 대조군비교 연구에는 Mann-Whitney U test 그리고 전후비교 연구에는 Wilcoxon signed rank test를 사용하게 된다.(표1)


표1. 통계방법

 

대조군비교 연구

전후비교 연구

모수 검정

Student's t-test

Paired t-test

비모 수검정

Mann-Whitney U test

Wilcoxon signed rank test

 

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사