통계를 어떻게 사용하는 것인가 - tong-gyeleul eotteohge sayonghaneun geos-inga

서두.

나의 전공은 심리학이다.

우리나라에서 심리학은 '문과'에 속한다.

문과를 선택하는 학생들의 이유는 다양하지만....

많은 학생들이 이과를 가기에는 과학을 못하거나, 수학을 못하는 경우에 문과를 선택하는 경우가 많다.

문과를 선택한 학생들은 대학에 가고나면 더 이상 수학을 하지 않을 것이라고 생각한다.

하지만.... 불행이도 사회과학을 선택한 대부분이 학생은 '통계'라는 과목을 배우게 된다.

그토록 싫어하던 수식과 계산공식들을 다시 만나게 되는 것이다.

많은 학생들이 다시는 수학을 마주하지 않을 것이라는 편안한 마음을 먹고있지만,

통계라는 과목과 대면하는 순간 한 없이 작은 존재가 되어 버린다.

그리고 통계 과목의 점수를 포기하는 학생 또한 다수이다.

사회과학은 문과인데, 문과에서 수학을 배워야 하는 이유는 도대체 무엇인가?!

왜 수학은 고등학교를 넘어 대학교에서까지 문과학생들을 괴롭히는가?!

오늘은 사회과학을 배우는 학생들이 '통계'를 배워야만 하는 슬픈 이유에 대해서 이야기 해보고자 한다.

통계란 무엇일까?

통계의 정의는 ‘어떤 현상을 종합적으로 한눈에 알아보기 쉽게 일정한 체계에 따라 숫자로 나타냄. 또는 그런 것.’이다. 조금 다르게 말하면 통계란 수치로 측정된 데이터를 과학적으로 분석하는 것을 말한다. 즉, 통계란 사회과학에서 측정된 자료를 과학적으로 분석하여 연구하기 위한 하나의 방법이라고 할 수 있다.

누군가 여기서 갑자기 웬 문과에서 과학타령이냐고 할지도 모른다. 대부분의 사람들이 인문, 사회계열은 과학과 거리가 멀다고 생각한다. 하지만, 앞서 이야기 하였듯이 사회학, 행정학, 정치학, 경제학, 사회복지, 심리학은 ‘사회과학’에 속하는 학문이다. 분명 ‘과학’이라는 글자가 들어간다. 때문에 사회과학은 자연과학과 마찬가지로 과학적 엄밀성을 기하고자하고 있으며, 이를 위해 과학적 연구와 분석을 위해 통계라는 기법을 사용하는 것이다.

쉽게 말을 정리하자면, 통계란 사회과학분야에서 얻어진 자료를 과학적으로 분석하고, 연구하는 방법이라고 할 수 있다.

통계가 왜 과학적 방법인가?

통계가 과학적 연구의 방법이라고 하면 분명 누군가 그럼 왜 통계는 과학적인 것이냐고 물을지도 모르겠다. 통계가 과학적인 방법인 것은 통계라는 것 자체가 과학적인 연구를 위해 ‘고안’되고, ‘만들어’진 것이기 때문이다. 이건 한 가지 예를 드는 것이 더 편할 것 같다.

우리는 길이를 재는 단위로 Cm를 사용하고 있다. 현재 Cm는 국제 도량형으로 지정되어 있고, 대부분의 국가가 길이를 재는 단위로 Cm를 사용하고 있다. Cm라는 단위는 신이 ‘이렇게 하여라~’ 하며 내려준 단위가 아니다. 길이의 단위가 통일되어 있어야 사람들이 교역하기에 편리하기 때문에 사람들 사이의 합의를 통해 ‘정한’ 것이다. 통계라는 것도 이와 같다. 과학적 연구를 합의된 자료의 분석 방법을 정한 것이 통계이다. 다만 Cm와 통계가 다른 부분이 있다면, 통계는 수학적인 논리 속에서 자료를 분석하고, 결과를 도출하는 방법이 정해져 있기 때문에 길이를 재는 것에 비해서는 ‘복잡’하다.

통계는 얼마나 알아야 하는가?

이제 대충은 통계를 왜 공부하여야 하는지 알게 되었다. 그런데... 통계 책을 펼치면 사람 토 쏠리게 하는 수학기호가 몇 페이지씩 끝도 없이 써져 있는 것을 볼 수 있다. 이것을 보는 순간 통계 공부에 대한 의욕이 뚝~ 떨어져 버린다. 이놈의 통계.. 내가 수학과도 아닌데 이 수식을 다 알아야 하는가? 지극히 개인적인 내 의견으로는 절대 그렇게 무식하게 수식을 다 알 필요는 없다.(어디가지나 저의 개인적 의견입니다.) 우리는 컴퓨터를 사용하지만, 컴퓨터를 만들 줄은 모른다. 또한 컴퓨터를 사용하지만 컴퓨터가 어떤 원리로 작동하는지 모른다. 하지만, 컴퓨터를 필요한 용도로 사용할 수 있다. 통계도 이와 같다. 사회과학에서 통계를 사용하는 이유는 자료를 분석하고, 그 의미를 파악하기 위해서이다. 우리는 이 목표에 부합하는 만큼만 통계에 대해서 알면 된다.

그렇다면 사회과학에서 알아야 하는 통계의 수준은 어디까지인가? ➀논문에 사용된 자료를 읽고 이해가 가능할 정도, ➁자신에게 필요한 통계기법이 무엇인지 파악하고, 그 기법을 찾아서 적용할 수 있는 정도, ➂절대적으로 모든 공식을 다 외우거나 수기계산을 할 수 있어야 할 정도로 알 필요는 없음, ➃단. 어떤 논리로 통계 기법이 작동하는지는 알아야 함, ⑤어쨌든 통계의 기본개념을 충실히 알 것.

위에 기술한 정도만 알면 충분하다고 생각된다. 석사를 마치고, 두 편의 논문을 쓴 필자의 통계지식이 정확히 저 수준이다. 그러니 다들 통계 공부할 때 너무 압박 받지 말자. 통계는 수학이 아니라. 수학을 이용한 연구 도구일 뿐이다. 계산이나 힘든 일은 요즘 잘 만들어져 있는 통계 프로그램들이 해준다. 우리가 알아야 하는 것은 어느 때 어떤 것을 사용하는지와 어떻게 결과를 해석하는 가 이다.

 

통 계

통계란 무엇인가?

사회현상의 양(量)을 반영하는 숫자이며, 특히 사회집단의 상황을 숫자로 표현한 것이다. 현대통계학에 있어서 통계적 방법의 급속한 진보와 보급에 따라 자연현상이나 추상적인 수치의 집단도 포함해 일체의 집단적 현상을 숫자로 나타낸 것을 통계라고 한다. 통계학이란 무엇인가 대해서도여러 가지 견해가 있을 수 있으나 일반적으로는 위험상황(이를 넓은 의미에서는 불확실성상황이라고도 한다) 하에서 이루어지는 의사결정상의 수량적 근거(numerical evidence)를 제시하는 방법론과 이론에 관해 연구하는 학문이라 정의 할 수 있다.

통계의 본질

주로 좁은뜻에서의 통계, 즉 사회적 집단의 상황을 말하는 숫자로서의 통계에 관해서이다. 자연현상이나 단순히 추상적 수치의 집단에 관련되는 숫자에 대해서는 그것들이 통계로서 지니는 의의나 특질은 처음부터 문제가 되지 않는다.

통계의 본질은, 그것이 우선 사회에 실재하는 고유의 사실과 결부되고, 동시에 사회적 존재로서의 집단에 관한 숫자자료인 사실이다. 예를 들면어떤 사람의 임금 20만원, 어떤 세대의 월수입 30만원 등 그것이 고유의 사실과 연관되고 또 사회현상으로 보이는 것 일지라도, 단일개체에 대한 숫자 자료일 때는 통계라고 하지 않는다. 이런 것들이 내포된 집단, 즉 노동자나 세대의 구체적인 어떤 일정집단에 대한 숫자자료, 같은 종류의 사례(개체)를 모은 집단에 대한 숫자가 통계이다.

통계는 조사에 있어서의 통계집단의 구성(단위, 표지, 특정한 시점 또는시간과 장소, 범위의 규정)에 바탕을 두고 파악된다. 따라서 통계집단의4 요소인 단위·표지·때·장소를 어떻게 규정하고 특히 단위나 표지에 관련해 구체적 개념이나 정의를 어떻게 정하는가는 통계의 본질과 연계되어 매우 중요하다.

통계는 일반적으로 현실의 일정한 사회관계 아래 조사자와 피조사자 사이에서 질문·회답이 이루어지는 통계조사라는 특수한 절차를 거쳐 작성되는데, 거기에는 상호협력이나 이해에 따르는 대항관계가 작용한다. 특히 통계는 필요성이나 작성능력이라는 점에서 보면 대부분 정부나 지방자치단체 등에 의한 관청통계로 작성되고 있는 특수성을 지녔다. 그리고 이들은 현실적 통계가 지닌 의의나 특질에 일정한 연관성을 갖고 있다.

이러한 사실은 통계의 이용면에서 보아, 통계의 이용에 앞서 통계가 무엇을 어떤 정의나 개념규정에 기초해 숫자로서 파악하고 있는가,그 통계조사는 어떤 조사목적으로 구체적으로 무엇을 조사하고, 무엇을 통계로서 표시하는가를 음미, 검토하는 일이 중요하다는 것을 의미한다.

통계의 기능

 ⑴ 많은 수량적 자료를 처리가능하고 쉽게 이해할 수 있는 형태로 축소시킨다.

 ⑵ 표본을 통해 연구대상 집단의 특성을 유추한다.

 ⑶ 의사결정의 보조수단이 된다.

 ⑷ 관찰 가능한 자료를 통해 논리적으로 어떠한 결론을 추출·검증한다.

통계의 체계

일반적으로 통계는 통계를 얻는 일을 직접적 목적으로 삼아 통계조사를실시하여 그 결과로 작성되는 것(제1의 통계)과, 여러 행정상의 기록이나 보고 등으로 작성되는 것(제2의 통계)이 있다.

제1의 통계

국세조사를 비롯하여 센서스 등 몇 개의 대규모적 전수(全數)조사와 각 부처 등에서 각각 행정목적에 따라 이루어지는 여러 표본조사에 의하여 작성되는 통계

제2의 통계

(업무통계)

출생 · 사망 · 결혼 · 이혼신고에 바탕을 두는 인구동태 통계를 비롯하여 행정상 기록 · 보고를 근거로 편성되는 통계

업무통계는 직접 통계조사를 해서 작성되는 것이 아니지만 다각적으로 여러차례에 걸쳐 이루어진다. 즉 재무부·한국은행 등에 의해 편성되는 재정·금융통계 등 사회나 경제에 관한 중요한 통계가 많으며, 통계체계 가운데서도 중요한 위치를 차지한다.

통계조사 목적에서 본 통계의 분류

센서스

통계조사의 가장 기본적인 형태. 대상이 되는 집단의 크기를 확정하고,집단의 모든 단위를 빠짐없이 조사하는 것으로서 그 개략적인 구조를분명히 한다. 전국민을 대상으로 하는 국세조사가 그 전형적인 예이다.한국에서는 국세조사 외에 사업소의 전반적인 사항을 파악하는 사업소통계조사, 제조업에 속하는 사업소를 파악하는 공업통계조사, 농수산업에 대하여 전체 농수산가(家)를 파악하는 농수산업센서스, 상업에 대해서 전체 점포를 파악하는 상업통계조사 등이 있다. 또한 센서스는 다수 이루어지는 표본조사를 위한 모집단 범위를 확정짓는 데 이용되며, 이러한 면에서 기초적인 통계이다.

구조통계

대규모 표본조사로서 시행되며 대상이 되는 집단의 내부구조를 명확히 하는 것이다. 취업구조나 임금구조에 관한 통계조사가 그 전형적 예이며, 그 밖에 각부처가 행정상 집단전체에 대해 파악하는 업무통계 가운데서 구조통계로서의 의의를 가지는 것이 있다.

동태통계

집단에 대해 매월 또는 매년의 변화를 파악하고 센서스나 구조통계를 보완하는 통계로 나라의 고용·임금·노동시간의 추이나 변화를 파악하기 위해 노동부에서 시행하는 매월 근로통계조사 등이 그 전형적 예이다. 한편 통계는 국세조사와 같이 조사에 임해 집단을 한 시점에서 파악하는 것을 정태(靜態)통계라 하고, 1년동안의 출생수나 월간공업생산액· 상품판매액 등과 같이 어떤 일정기간의 상황을 파악하는 것을 동태통계라고 부른다.

통계를 내용면에서 보면 다음과 같다. ①가장 기초적·독자적인 분야로 발전해 온 인구통계 ②사회·경제발전에 따라 그 영역이 확대되어 온 산업·무역·물가·경영·노동·가계 등의 경제통계 계통 ③사회의 문화적·제도적 발전에 따라 창출되어 온 교육·위생·문화·재해·범죄·사회보장·환경조건 등에 관한 통계 계통 등으로 나뉜다.

그리고 가공통계로서 통계조사의 결과로부터 만들어지는 물가지수·생산지수 등이 있고, 더 새로운 분야로는 많은 경제자료를 통합해 국민경제 전체의 구조나 동향을 거시적으로 파악하는 국민경제계산체계(국민소득계정·산업연관표·자금순환표·국제수지표·국민대차대조표의 5개국민 경제계정을 총칭) 등이 차츰 정비되어 현재의 통계체계를 이루고있다. 여기에 통계조사에 사용되는 분류로서 표준산업분류·표준직업분류 등 몇 개의 표준분류도 정해지고, 개정이 거듭되어 통계조사에 쓰는 공통분류로 정비되었다.

  통계를 작성 또는 이용하는 데는, 작성주체·작성시기·작성방법·대상(단위표지)·대상의 존재환경 등에 관한 깊은 인식을 필요로 한다. 작성 목적이 무엇이고, 대상에 대한 기준(시점, 범위 등), 결과에 대한 분석 방법 등에 대한 방침이 명확하게 정립되어야 한다. 대부분의 통계는 현실의 일정한 사회관계를 바탕으로, 조사주체와 피조사주체 사이에서 질문·응답이 행해지는 통계조사(統計調査)라는 특수한 과정을 거쳐 이루어지는데, 거기에는 상호협조와 이해에 따르는 대항관계가 작용한다. 또한 통계는 그 필요성과 작성능력이라는 점으로 보아, 그 대부분이 정부나 지방자치단체 등에 의한 관청 통계로 작성된다는 특성을 지닌다.

출처  슬기샘터(박원강)