본문 바로가기
생각정리

[통계학] 변수(variable)의 정의

by 달빛 정원 2022. 3. 23.
반응형

통계 방법론을 사용할 때, 변수가 어떠한 특성을 나타내는지를 이해하고, 어떤 것을 검증 혹은 증명하고자 한다는 것을 명확히 해야 이에 맞는 통계 방법론을 선택할 수 있습니다. 즉 변수(variable)의 종류와 특성을 이해하는 것이 매우 중요합니다.

 

목차

    변수의 정의 및 종류

    변수의 특성과 측정

    마무리


    변수의 정의 및 종류

    변수(혹은 변인이라고도 함)라는 것은 말 그대로 변하는 숫자입니다. 예를 들어 사람의 사람별로 나이, 체중이 달라지게 되며 이러한 나이 혹은 체중이 변수가 될 수 있는 것입니다. 다만 같은 나이에 체중분포, 같은 체중대에 나이 분포 등의 여러 연구설계가 가능하고 이때 '같은' 뒤에 붙어있는 변수들은 고정되어 통제 변수가 됩니다. 즉 변수는 연구설계 및 특성에 따라 다음과 같이 분류가 가능합니다.

     

    • 독립변수(independent variable): 종속변수에 영향을 미치는 변수로 원인변수라고도 불립니다. 다른 변수의 변화와 관계없이 독립적으로 변화하는 변수입니다. 
    • 종속변수(dependent variable): 독립변수들이 변화함에 따라 변화하는 변수로서 결과변수라고 불립니다.
    • 매개변수(intervening variable): 두 변수간 사이에서 연계하는 변수입니다. 실험연구에서 연구 대상이 되는 독립변수와 종속변수 사이에 작용하여 종속변수에 영향을 미치는 변수입니다.
    • 조절변수(moderator variable): 종속변수에 대한 독립변수의 효과를 중간에서 조절하는 변수입니다. 예를 들어 농구공을 바스켓 안에 넣는 횟수화 훈련시간의 관계에 대해 연구하고자 할때 독립변수는 훈련량, 종속변수는 공을 넣는 횟수가 될 것입니다. 이때 훈련시간에 따른 공을 넣는 횟수를 예측할 때 훈련방법에 따라서 공을 넣는 횟수가 달라질 수 있다면 '훈련방법'이라는 변수는 조절변수가 될 수 있습니다.
    • 통제변수(control variable): 연구를 수행하면서 통제하는 변수를 의미합니다. 앞서 이야기한 '같은 나이', '같은 체중'이 여기에 해당됩니다.

    변수의 특성 (characteristic)과 측정 (measurement)

    변수를 수집할 때 특성에 따라 측정되는 척도(scale)가 달라집니다. 자료를 정량화 할 수 있는지에 따라 질적변수와 양적변수로 구분됩니다. 질적변수는 정량화가 안되기 때문에 범주화시켜서 반영해야 합니다. 예를들어 성별(남, 여), 직업, 종교 등은 양적으로 수량화 하기 힘들겠죠.

    또한 연속변수의 경우 자료를 셀 수 있는지, 연속적인지에 따라 이산변수와 연속변수로 구분합니다. 이산변수는 정수로 측정되는 변수입니다. 예를 들어 가구당 자녀수 몇명, 00학교의 학생 수 몇명 이런식입니다. 가구당 자녀수가 3.5명 이렇게 되지는 않기 때문에 연속적이지 않다는 의미입니다. 반면 연속변수는 예를 들어 중학교 1학년 학생들의 키, 체중, 시력 등으로 볼 수 있습니다. 

    범주형 변수는 반면 명목변수와 순위변수로 구분할 수 있습니다. 명목변수는 남과 여를 구분할 때 남자는 1, 여자는 2 이런식으로 단순히 구분하는 것이며 숫자의 양적인 의미는 없습니다. 순위변수는 명목변수와는 다르게 순위가 의미 있습니다. 학력인 경우 초, 중, 고, 대졸 이런식으로 서열화 시킬 수 있습니다. 

    연속변수는 간격변수와 비율변수로 구분할 수 있습니다. 해당 변수들은 등급 간 간격을 동일하게 하며 특성에 따라 순서를 정할 수 있습니다. 예를 들어 시력, 온도와 같이 높낮이가 있고 몇개로 등급화 시켜서 구분할 수 있습니다. 다만 비율 변수는 명목변수나 서열변수로도 변환이 가능합니다. 또한 연속변수도 이산변수화 시키거나 범주형 변수처럼 그룹화하여 분석도 가능합니다. 즉 연속형 자료의 경우 연구자의 의도에 따라 다양하게 변화시켜 연구를 설계할 수 있다는 것입니다.

     


     

    마무리

    앞서 살펴본 변수의 종류, 측정 척도에 따라 구분되는 변수들의 특성을 잘 파악하는 것이 통계 방법론을 사용하기에 앞서 규명되어야 하는 중요한 일입니다. 변수를 어떻게 측정하고 개량하여 raw data로 만드느냐에 따라 연구결과와 의미가 달라지게 되므로 주의할 필요가 있습니다.

    반응형

    댓글