커뮤니케이션 통계 방법
커뮤니케이션이해총서 급변하는 커뮤니케이션 환경 속에서 커뮤니케이션 지식에 대한 욕구 가 높아지고 있습니다. 하나의 커뮤니케이션 주제를 10개 항목으로 묶어서 달걀 꾸러미처럼 엮었습니다. 다양한 커뮤니케이션 지식을 쉽게 알고자 하는 대중이나 새로운 커뮤니케이션 지식을 단시간에 알고자 하는 연구자, 실무자, 학생에게 도움이 되는 책입니다.
편집자 일러두기 ∙ 본문의 통계와 표 그리고 그림은 커뮤니케이션 통계방법론(류 성진 옮김, 2011)과 위키피디아(Wikipedia)에서 일부를 차용했 으며, 그 외 부분은 저자가 직접 제작한 것입니다. ∙ 이 책은 저자가 번역한 커뮤니케이션 통계방법론의 본문 내용 을 기초로 다시 쓴 것입니다. ∙ 외래어 표기는 현행 한글어문규정의 외래어표기법을 따랐습니다. ∙ 이 책에 실린 삽화는 이근명 화백이 그렸습니다.
커뮤니케이션이해총서
커뮤니케이션 통계 방법 류성진
대한민국, 서울, 커뮤니케이션북스, 2013
커뮤니케이션 통계 방법
지은이 류성진 펴낸이 박영률
초판 1쇄 펴낸날 2013년 2월 25일 커뮤니케이션북스(주) 출판등록 2007년 8월 17일 제313-2007-000166호 121-869 서울시 마포구 연남동 571-17 청원빌딩 3층 전화 (02) 7474 001, 팩스 (02) 736 5047 commbooks@commbooks.com www.commbooks.com CommunicationBooks, Inc. 3F Cheongwon Bldg., 571-17 Yeonnam-dong Mapo-gu, Seoul 121-869, Korea phone 82 2 7474 001, fax 82 2 736 5047 이 책은 커뮤니케이션북스(주)가 저작권자와 계약하여 발행했습니다. 본사의 서면 허락 없이는 어떠한 형태나 수단으로도 이 책의 내용을 이용할 수 없음을 알려드립니다. ⓒ 류성진, 2013 ISBN 978-89-6680-881-6 책값은 뒤표지에 있습니다.
각종 통계 분석 방법의 이해와 적용
커뮤니케이션 통계방법 왜 배우나 ‘통계’란 단어를 접하는 순간 가슴이 먹먹해지고 일종의 공포와 두려움의 쓰나미가 몰려오는 느낌을 적어도 사회 과학 학도라면 누구나 한 번쯤은 경험해 봤을 법하다. 왜 그럴까. 고등학교 학창시절 문과와 이과의 선택 기로에서 상당수 학생들은 별 다른 주저없이 문과를 선택한다. 왜? 이유는 간단하다. 낯설기만 한 기호와 복잡하고 어렵게만 보이는 공식들로 즐비한 ‘수학’이 싫어서. 부끄럽지만 나 역시 ‘수학’이 싫어서 문과를 선택했었다. 물론, 여러분 중 에는 그렇지 않은 학생들도 있겠지만…. 대학교에 들어왔 다. 이제 겨우 ‘수학’의 공포에서 벗어났는가 싶었는데 (필 수 또는 선택) 전공 강좌 이름에 ‘수학’이란 단어만 없을 뿐 이지, ‘수학’의 이웃사촌격인 ‘통계’ 또는 ‘통계 방법’이란 이름이 들어간 강좌를 또 수강하라고 한다. 좀 과격하게 보일지 모르지만, 이 학생들의 마음을 대신 표현한다면 ‘미치고 환장할 노릇!’일 것이다. 그런데 대학교에서는 왜 ‘통계 방법’이란 이름의 강좌를 개설해서 학생들에게 잔인
v
한 ‘인고(?)’의 시간을 겪게 하는 것일까? 그 이유 또한 간 단하다. 배워 두면 인생을 사는 데 실제로 도움이 될 수 있 기 때문이다. 사실 많은 사회과학도가 ‘통계 방법’이란 학문을 꺼리는 이유 중 가장 치명적인 것을 꼽으라면 ‘통계 방법=수학’이 란 고정관념 때문일 것 같다. 사실 전혀 틀린 말도 생각도 아니다. 실제로 ‘통계 방법’에서는 숫자를 다루고 계산도 한다. 그렇지만, 실제로 수학 계산의 상당부분은 (아니 거 의 대부분이라고 하는 것이 합당할 듯하다) 우수한 컴퓨 터 프로그램의 몫이다. 다시 말해, ‘통계 방법’은 수학이나 수학적 계산보다 논리적으로 사고하는 방법을 훈련하는 학문영역으로 간주하는 것이 좀 더 정확한 해석이다. 여 러분은 이 책을 통해 ‘통계 방법’이 왜 ‘수학’이 아닌 ‘논리 적 사고 방법’인지를 알아가게 될 것이다. 조금 전 나는 ‘통계 방법’을 배워 두면 인생을 사는 데 실 제적인 도움이 된다고 했다. 과연 그럴까? 과연 그렇다! 이와 관련해 거창하게 보이는 그럴듯한 이유보다 내가 경 험한 에피소드 하나를 소개할까 한다. 내가 오하이오주립 대학교에서 ‘커뮤니케이션 연구 방법’ 강의조교를 맡고 있 을 때였다. 강의가 끝날 쯤에 한 학생이 내게 와서 불쑥 고 맙다는 인사를 하는 게 아닌가? 그 이유가 궁금해 물었더
vi
니 “이번 강의에서 과제로 작성한 리포트를 직장 상사에 게 보여 줬더니, 매장 직원 관리 시스템 재구축에 큰 도움 이 될 것 같다고 하면서 자신을 승진시켜 줬다”고 했다. 그 학생의 리포트 내용은 매장 각 부서에서 일하는 직원의 만 족도에 관한 것이었는데, 연구결과 각 부서별로 직원의 만 족도에 큰 차이가 있고, 만족도에 차이를 가져온 원인 역 시 부서별로 차이가 있다는 점을 밝혀낸 것이었다. 이 리 포트 한편으로 인해 실제로 매장 직원 관리운영 체계가 전 면적으로 바뀌었고, 매장 매출 실적 역시 상승했다고 그 학생은 자랑스럽게 내게 이야기했다. 이처럼 ‘커뮤니케이 션 연구 방법’은 우리의 일상생활에서 발생하는 다양한 사 안이나 문제를 효율적으로 해결할 수 있는 매우 과학적인 학문 영역 중 하나이며, 이것이 곧 여러분이 ‘커뮤니케이 션 연구 방법’을 학습하는 이유다. 한편, 국내에 출간된 기존 통계 방법론 책들을 유심히 살펴보면, 초·중급부터 고급 통계 방법에 이르기까지 다 양한 통계 방법을 상세하고 심층적으로 소개하고 있음을 쉽게 확인할 수 있다. 그러나 전적으로 개인적인 느낌이 나 주관적 판단인지는 모르겠지만, 이처럼 다양한 통계 방 법론 책들이 소개한 각 통계 방법을 학습자가 ‘왜?’ 배워야 하는지에 대해서는 안타깝게도 이 책들에서 속 시원한 설
vii
명을 찾지 못했다. 다시 말해, 각 통계용어나 분석 기법들 이 어떤 연유에서 개발됐고, 각 통계 방법들이 다른 통계 방법들과 어떤 고유한 차별적 특징을 갖고 있기에 이론적 으로나 실무적으로 학습자가 반드시 이해해야 하는지에 대해서는 기존 책들에서 구체적인 설명을 찾지 못했다. 이런 이유로 통계 방법에 관심을 갖는 상당수의 학습자 들은 각 통계 방법을 학습한 후에도, 실무에서는 왜 특정 한 통계 기법을 사용해야 하는지, 그리고 한 걸음 더 나아 가 선택한 특정 통계 기법을 언제, 그리고 어떻게 사용해 야 할 것인지에 대해 여전히 혼란스러워하는 것 같다. 물 론 다시 한 번 강조하지만, 이것은 어디까지나 전적으로 주관적인 경험과 판단에 기초한 사견임을 분명하게 밝혀 둔다. 따라서 이 책에서는 커뮤니케이션 통계 방법 핵심 개념 10가지를 엄선한 후, ‘Why?’ 즉 ‘왜?’라는 의문사를 끊임없 이 제기하면서 초·중급 학습자들이 왜 특정한 통계 방법 을 학습해야만 하는지에 대해 통계원리와 함께 실무 적용 사례를 곁들여 소개하고 있다. 이 책에서 다룰 커뮤니케이션 통계 방법 핵심 개념 10 가지를 간략하게 소개하기 전에, 한 가지 밝혀둘 사안이 하나 있다. 실은 이 책 집필 의뢰를 받기 훨씬 이전에 나는
viii
학부생을 위한 사회과학 통계 방법론 책이 필요하다고 인 식했고, Why?로 배우는 사회과학 통계 방법론이란 가 제로 원고를 쓰고 있었다. 그리고 2012년 8월 현재 1차 원 고를 거의 완료한 상황이다. 따라서 이 책은 이미 1차 원 고 집필이 거의 완료된 Why?로 배우는 사회과학 통계 방법론의 축약본이라고 이해해도 무방하다. 만일 이 책 에서 다룬 내용을 좀 더 구체적이고 심층적으로 이해하고 자 한다면, 2013년 후반부에 출간 예정인 Why?로 배우 는 사회과학 통계 방법론을 참조하면 도움이 될 것 같다. 이 책은 학습자가 실제로 리서치 관련 조사업무에 투입 됐을 때, 실행하는 각 연구 방법 단계에 맞춰 아이템을 구 성했다. 리서치 업무는 크게 시간의 순서에 따라 두 가지 단계 로 구분할 수 있다. 첫째는 데이터 수집 단계로 연구목적 에 맞는 표본을 추출하고, 적절한 데이터 수집 방법을 적 용해 우수한 데이터를 얻는 과정이다. 따라서 이 단계에 서는 연구목적에 가장 적절한 표본을 추출하는 표본추출 과정과 표본으로부터 우수한 데이터를 수집하기 위해 높 은 신뢰도와 타당도를 갖는 측정도구를 검증하는 방법을 정확하게 이해할 필요가 있다. 따라서 이 책의 1∼3장은 표본추출, 측정, 그리고 측정도구의 신뢰도와 타당도에
ix
관한 내용으로 구성되어 있다. 둘째 단계는 데이터 분석 단계로서 수집한 데이터로부 터 연구가설을 검증하거나 연구문제에 대한 해답을 얻고 자 할 때 가장 적절한 통계분석 기법을 적용해 데이터를 분석하고 그 결과를 해석하며, 최종적으로 독자들이 이해 하기 가장 쉬운 일반적인 언어로서 분석결과를 표현하는 것이다. 이 단계는 다시 기술통계와 추론통계로 구분할 수 있는데, 기술통계는 각 변인에 대해 표본에서 수집한 데이터의 속성을 파악함으로써 표본의 속성을 설명하는 통계다. 기술통계는 주로 한 변인에 대한 데이터의 속성 을 파악하는 방법과 두 변인의 관계에 대한 데이터의 속성 을 파악하는 방법으로 구분할 수 있다. 반면에, 추론통계 는 확률이론에 근거해 모집단에서 무작위로 추출한 특정 한 표본에서 수집한 데이터를 분석해 얻은 연구결과가 모 집단의 속성을 제대로 반영하는지를 확인하는 과정 또는 절차다. 따라서 표본에 대한 속성 파악에 주안점을 두는 기술통계와 달리 추론통계는 모집단의 속성을 파악하는 데 주안점을 둔다는 차이점이 있다. 추론통계에서는 연구 가설과 연구가설에 속한 각 변인의 속성을 고려해 표본에 서 수집한 데이터를 교차분석, t-검정, 상관관계분석, 회귀 분석, 그리고 분산분석 등과 같은 다양한 통계분석 기법을
x
적용하고 분석함으로써 모집단 통계량을 추론할 수 있다. 따라서 4장에서는 기술통계를, 곧이어 5장에서는 추론 통계의 핵심 원리인 모수추정에 대해 살펴볼 예정이다. 6 장부터 10장까지는 연구가설 및 변인의 유형에 가장 적절 한 데이터 분석 기법에 대해 개별적으로 살펴볼 것이다.
데이터 수집 단계 1장 ‘표본추출’에서는 연구자가 관심을 갖고 정보를 얻고 자 하는 전체 대상인 모집단으로부터 특정한 표본을 추출 하는 과학적인 표본추출 방법을 소개할 것이다. 모집단은 연구자가 관심을 갖고 있는 대상이므로 당연히 전체 집단 을 대상으로 연구를 실시하면 가장 좋다. 이를 전수조사 또는 센서스(census)라고 한다. 그러나 일반적으로 모집 단은 규모가 대단히 크기 때문에 모집단에 속한 전체를 대 상으로 데이터, 즉 정보를 구하는 것은 엄청난 경비를 필 요로 한다. 따라서 통계청과 같은 국가기관이나 대규모 리서치 기관이 아닌 이상 전수조사를 실시한다는 것은 현 실적으로 거의 불가능하다. 따라서 개인 연구자는 그 자신 이 갖고 있는 비용이 허락하는 범위에서 모집단의 거의 모 든 속성을 반영할 수 있는, 즉 모집단의 속성을 대표할 수 있는 작은 규모의 대상자들을 추출해야 한다. 이때 추출한
xi
작은 규모의 대상자들을 우리는 표본이라고 일컫는다. 그리고 연구자는 그들을 대상으로 정보 즉 데이터를 수 집한 후, 그 데이터에서 얻은 결과를 바탕으로 모집단의 속성을 추정하고자 한다. 이때 추출한 표본의 속성이 모 집단의 속성을 대표할 수 있는지가 표본추출의 가장 중요 한 사안이다. 이와 관련해 여기서는 두 가지 범주의 표본 추출 방법을 소개할 것이다. 하나의 확률 표본추출 방법 으로서 단순 무작위 표본추출, 계통 표본추출, 층화 표본 추출, 집락 표본추출, 임의 전화 걸기 등이 있다. 다른 하 나는 비확률 표본추출방법으로 편의 표본추출, 유의 표본 추출, 지원자 표본추출, 눈덩이 표본추출, 할당 표본추출 등이 있다. 여기서는 각 범주의 표본추출 방법이 갖는 장·단점을 서로 비교하면서 소개할 예정이며, 또한 각 범 주 내 개별적인 표본추출 방법의 차별적 특성에 대해 살펴 볼 것이다. 모집단에서 과학적인 방법으로 표본을 추출했다면, 다 시 말해 구체적인 연구 대상자를 모집했다면, 그다음으로 연구 대상자들을 상대로 연구자가 측정하고자 하는 변인 들에 대한 그들의 응답, 즉 데이터를 수집해야 할 것이다. 사실 데이터를 수집하는 방법에는 설문조사, 실험, 관찰, 내용분석 등 다양한 방법들이 있지만, 이 책에서는 그중
xii
커뮤니케이션 과학에서 가장 자주 사용하는 설문조사만 을 대상으로 한다. 그렇다면 수집하려는 데이터는 도대체 무엇인가? 데이터는 표본 속에 포함된 각 연구 대상자의 기본적인 인구통계학적 속성뿐만 아니라, 연구자가 파악 하고자 하는 구성이나 변인들에 대한 연구 대상자의 응답 을 숫자로 표현한 것이다. 2장 ‘측정’에서는 어떤 추상적인 구성에 대한 단위에 구 체적인 숫자를 부여하는 수량화 과정인 측정에 대해 살펴 볼 것이다. 추상적인 구성을 구체적인 숫자로 표현하기 위해선 추상적인 구성을 측정할 수 있는 형태로 치환하는 과정이나 방법이 필요한데, 이것을 ‘조작적 정의’ 또는 ‘조 작화’라고 하며, 여기서는 조작적 정의가 무엇인지에 대해 서 가장 먼저 살펴볼 것이다. 그러고 나서 구성을 측정할 때, 구성의 속성을 고려해 측정도구 즉 측정문항을 과학적 인 방법으로 설계해야 한다. 이때, 측정문항은 추상적인 구성을 구체적인 숫자로 표현할 수 있는 네 가지 수준, 즉 명목수준, 서열수준, 등간수준, 그리고 비율수준 중 하나 를 선택한다. 2장에서는 각 수준이 갖는 특징에 대해 구체적으로 살 펴볼 예정이다. 특히 측정도구의 수준은 연구가설을 검증 하거나 연구문제에 대한 해답을 구하기 위한 데이터 분석
xiii
기법 선택 과정에서 매우 중요한 기준을 제공해 줌으로 학 습자 여러분이 반드시 이해해야 할 핵심 내용이다. 또한 2장에서는 수준별로 널리 알려진 척도, 예를 들어 리커트 척도, 의미분화 척도, 거트만 척도, 그리고 서스톤 척도에 대해서도 간략하게 소개할 것이다. 이제 데이터 수집 단계에서 마지막으로 확인해야 할 것 은 연구자가 사용하는 측정문항이 연구자가 측정하고자 하는 것을 제대로 측정할 수 있는지, 다시 말해 측정문항 이 높은 타당도를 갖고 있는지를 파악하는 것이다. 더불 어, 시·공간, 그리고 연구 대상과 상관없이, 측정문항이 항상 비슷한 응답을 도출할 수 있는지, 즉 측정문항은 높 은 신뢰도를 보유하고 있는지를 확인해야 할 것이다. 만 일 연구자가 측정하고자 하는 구성이나 변인을 측정문항 이 제대로 측정하지 못하거나, 시·공간이나 연구 대상자 에 따라 측정문항이 시시각각 다른 응답을 도출한다면 우 리는 측정도구를 통해 수집한 데이터를 전혀 신뢰하지 못 할 것이고, 따라서 이 데이터 분석을 통해 도출한 결과 역 시 신뢰할 수 없을 것이다. 따라서 3장 ‘신뢰도와 타당도’ 에서는 측정도구의 신뢰도와 타당도 개념에 대해 살펴볼 것이다.
xiv
데이터 분석 단계 1∼3장을 통해 학습자 여러분은 우수한 데이터를 수집하 는 각 과정을 이해할 수 있을 것이다. 이제 남은 건 수집한 우수한 데이터를 연구목적에 맞게, 다시 말해 연구가설을 논리적으로 검증하거나 연구문제에 대한 합당한 해답을 얻기 위해 가장 적절한 데이터 분석 기법을 사용해 분석 및 해석하고, 그 해석 내용을 독자가 이해하기 쉬운 글로 표현하는 것이다. 일반적으로 데이터를 분석하는 과정은 크게 두 가지로 나뉜다. 첫째는 기술통계이고, 둘째가 추론통계다. 기술 통계와 추론통계 간 차이를 구분하는 핵심은 파악하고자 하는 대상에 있다. 기술통계는 주로 표본의 속성을 파악 하는 데 주안점을 두는 반면, 추론통계는 주로 표본 속성 을 통한 모집단 속성 추정에 주안점을 두는 경향이 강하 다. 대부분의 연구는 표본을 통해 모집단의 속성을 파악 하고자 하며, 결국 추론통계가 연구의 가장 궁극적인 목표 라는 점에는 큰 이견이 없다. 다만 모집단으로부터 추출 할 수 있는 표본의 종류는 매우 다양하기 때문에, 연구자 가 직접 추출한 표본이 연구자가 관심을 갖는 특정한 구성 이나 변인에 대해 어떤 고유한 생각이나 태도 또는 행동을 하는지에 관한 기초 정보를 제공하는 것은 독자들이 표본
xv
의 고유한 속성을 이해하는 데 매우 유용할 것이다. 따라서 4장 ‘기술통계’에서는 기술통계의 대표적인 통 계량에 대해 상세하게 다룰 것이다. 구체적으로 표본의 대표적인 속성을 나타내는 중심경향성 통계량인 평균, 중 위수, 최빈값과 표본에 제공한 데이터의 흩어짐을 나타내 는 산포도로서 분산, 표준편차, 표준오차, 최소값, 최대값, 그리고 범위에 대해 집중적으로 살펴볼 것이다. 또한 데 이터 분포의 속성으로 기울어짐과 솟아오름을 나타내는 왜도와 첨도에 대해서도 함께 살펴볼 것이다. 5장 ‘모수추정’에서는 모집단에서 추출한 특정한 표본 으로부터 얻은 결과를 바탕으로 모집단의 속성을 추론할 수 있는 통계 원리에 대해 소개할 것이다. 구체적으로 표 본 평균의 표본추출 분포와 표준오차에 대한 개념을 간략 하게 설명한 후, 모수추정 이론의 가장 근본 이론인 중심 극한정리에 대해 상세하게 소개할 것이다. 또한 추정이론 에 근거한 점 추정치와 신뢰구간 추정 방법에 대해서도 추 가로 설명할 것이다. 6장부터 마지막 단원인 10장까지는 모수추정 이론에 기반을 두고서 연구자가 설정한 연구가설을 검증하기 위 해 가장 적절한 데이터 분석 기법을 실행함으로써 수집한 데이터를 분석 및 해석하고, 그 결과를 독자가 이해하기
xvi
쉬운 문장으로 표현하는 방법에 대해 학습할 것이다. 첫 번째 데이터 분석방법으로서 6장 ‘교차분석’에서는 범주 변인 간의 관찰된 빈도에 대한 유의성 검증을 실시하 는 교차분석에 대해 살펴볼 것이다. 6장에서는 기술통계 로 이해할 수 있는 교차표와 함께 각 범주 변인 간에 발생 한 관찰빈도가 기대빈도와 통계적으로 유의미한 차이를 나타내는지를 검증하는 카이제곱 교차분석 방법에 대해 살펴볼 것이다. 또한 행, 열, 그리고 전체에 따라 각 범주 변인의 빈도에 대한 퍼센트를 구하는 방법도 함께 소개할 것이다. 7장 ‘t-검정’에서는 두 집단 간 평균 차이에 대한 통계적 유의도를 검증하는 t-검정에 대해 살펴볼 것이다. t-검정 은 독립변인이 두 집단으로 구성된 범주 수준인 질적 데이 터이고, 종속변인이 양적 데이터일 경우에 적용할 수 있는 데이터 분석 기법으로 크게 세 가지 검증 기법으로 구분할 수 있다. 일표본 t-검정, 독립표본 t-검정, 그리고 대응표본 t-검정 등이다. 이 세 가지 종류의 t-검정들은 기본 통계적 작동원리가 동일하다. 다만 일표본 t-검정은 연구자가 모 집단으로부터 직접 추출한 표본이 단 하나의 집단만 있고, 다른 한 집단의 평균은 이미 제시된 경우에 주로 사용한 다. 또는 측정도구의 척도값 중 특정값, 예를 들어 중간에
xvii
위치한 값과 한 집단의 평균 간 차이에 대한 유의도를 검 증할 때도 사용할 수 있다. 독립표본 t-검정은 가장 일반적 으로 사용하는 t-검정 기법으로서 추출한 표본의 상이한 두 집단 간 평균 차이를 검증하는 데 적용할 수 있다. 독립 표본 t-검정을 실시할 경우엔, 종속변인에 대한 두 집단의 분산이 동질하다는 등분산 가정 검증을 실시할 필요가 있 으며, 이 책에서는 등분산 가정 검증을 위한 레빈 검증을 소개할 것이다. 마지막으로 소개할 대응표본 t-검정은 상 이한 두 집단 간 평균 차이를 검증하는 독립표본 t-검정과 달리, 동일한 집단 내에서 시간의 간격에 따라 각각 수집 한 데이터 간 평균 차이를 비교하는 검증방법이다. 8장 ‘상관관계분석’에서는 두 변인의 연관성에 대한 유 의도를 검증하는 통계 분석 기법으로 교차분석과 마찬가 지로 기술통계와 추론통계를 모두 실행할 수 있다. 다만, 교차분석이나 t-검정, 또는 회귀분석이나 분산분석의 경 우 독립변인과 종속변인을 구별하지만, 상관관계분석은 두 변인을 구별하지 않고 단지 두 변인 간 상호 연관성만 을 파악한다는 차별적 특성이 있다. 이 책에서 다룰 상관관계분석은 두 변인이 모두 양적 데이터일 경우에 한해 실행하는 피어슨 상관관계분석 기 법을 소개할 예정이다. 참고로 피어슨 상관관계는 두 변
xviii
인의 연관성에 대한 ‘강도’와 ‘방향’이란 두 가지 측면에서 연관성의 유의성을 검증한다. 상관관계는 크게 단순 상관 관계, 편 상관관계, 그리고 준편 상관관계 등 세 가지 종류 로 구분하며, 이 상관관계는 측정도구의 문항 간 내적 일 관성 검증 및 회귀분석과 분산분석 작동원리의 통계적 근 간 역할을 담당한다. 9장 ‘회귀분석’에서는 커뮤니케이션 분야에서 가장 자 주 사용하는 회귀분석을 소개할 것이다. 이 데이터 분석 기법은 일반적으로 독립변인과 종속변인이 모두 양적 데 이터일 경우에 주로 사용한다. 그러나 독립변인이 범주변 인일 경우에도 가변인 또는 더미변인을 생성할 수 있다면, 회귀분석을 실행할 수 있다. 회귀분석은 독립변인이 종속 변인의 변화량을 예측할 수 있기 때문에 상관관계분석과 는 또 다른 차별화된 장점을 갖고 있다. 특히, 다중 또는 위계적 회귀분석의 경우, 제3의 변인(들)이나 변인들로 구성된 세트를 통제함으로써 독립변인(들)이 종속변인에 미치는 영향, 즉 인과관계를 간접적으로 밝힐 수 있다는 유용성을 갖고 있다. 따라서 이 책에서는 단순, 다중, 그리 고 위계적 회귀분석의 기본 작동원리를 다양한 사례적용 을 통해 설명할 것이다. 이 책의 마지막 단원인 10장 ‘분산분석’에서는 독립변인
xix
이 2개 이상 범주로 구성된 변인이고, 종속변인이 연속 데 이터일 경우에 실행할 수 있는 분산분석에 대해 살펴볼 것 이다. 분산분석은 한편으로 t-검정의 확장된 형태이며, 2 개 이상 집단들의 평균을 비교하는 데 사용할 수 있다. 또 한 분산분석은 회귀분석의 특별한 한 형태이므로 회귀분 석과 작동원리가 거의 동일하다는 특징이 있다. 여기에서 는 분산분석의 작동원리를 구체적인 사례를 적용해 설명 할 예정이다. 또한 다중 회귀분석과 거의 동일한 작동원 리를 갖는 공분산분석 실행방법에 대해서도 간략하게 소 개하도록 하겠다.
알아두면 좋은 추가 정보 마지막으로 ‘커뮤니케이션 연구 방법’과 관련해 알아두면 여러분의 인생에 작은 도움이 될 같은 두 가지 추가 정보 를 소개하면서 이만 머리말을 줄이고자 한다. 첫 번째로 소개할 정보는 분량 때문에 이 책에서는 다루 지 않았지만 통계 방법 실무자가 되기 위해 반드시 알아 두 면 좋은 통계 분석 기법에 관한 것이다. 이 책에서는 측정 문항의 신뢰도 검증 방법을 소개했는데, 실제 양적 연구에 서는 신뢰도 검증과 함께 통계학의 기본 원칙인 ‘간결성 (parsimony)’을 준수하기 위해 요인분석(factor analysis)
xx
을 동시에 실행하는 것이 상당히 일반적이다. 참고로 인 자분석으로도 불리는 요인분석에는 탐색적 요인분석 (exploratory
factor
analysis)과
확인적
요인분석
(confirmatory factor analysis)으로 나눌 수 있다. 신뢰도 분석과 요인분석 간 차이에 대해 하나의 비유를 통해 간략 하게 설명하면 다음과 같다. 사과 열 개가 들어 있는 상자 가 하나 있다고 가정해 보자. 이 사과 상자 속에 들어 있는 사과들이 서로 교환이 가능할 정도로 모두 비슷한지 확인 하려고 한다. 이 때는 통계 분석 기법을 사용해 신뢰도 분 석을 하면 된다. 만일 이 상자 속에 사과 2개가 심하게 썩 었다면, 판매를 위해 적어도 썩은 사과 2개를 빼야 할 것이 다. 신뢰도 분석을 실행하면 교환 가능성에 근거해 썩은 사과 2개를 골라낼 수 있다. 한편, 사과 상자에 부사와 홍옥이 서로 섞여 있으며, 동 일한 종류 사과들로 재분류한 후 각 사과 종류 범주에 따라 서로 묶고자 한다고 가정해 보자. 이 경우 요인분석을 실행 하면, 동일한 (또는 유사한) 종류의 사과들로 재분류한 후, 재분류한 사과들을 각각의 범주로 묶을 수 있다. 그러고 나 서 각 사과 종류(범주) 안에 있는 사과들이 상호 교환이 가 능한지 신뢰도 분석을 통해 확인할 수 있다. 신뢰도 분석 과 요인분석을 모두 사용할 수 있다면, 측정 문항을 신뢰
xxi
할 수 있을뿐만 아니라 압축적으로 정리할 수 있다. 추가로 소개할 또 다른 통계 분석 기법은 경로 분석이라 고도 일컫는 통로분석(path analysis)이다. 이 책에서 배울 회귀분석은 하나 이상의 독립변인들과 하나의 종속변인 간 의 인과관계를 간접적으로 검증할 수 있지만, 통로분석은 여러 변인들 간의 인과관계를 동시에 검증할 수 있는 장점 이 있다. 만일 요인분석 (엄밀하게는 확인적 요인분석)과 통로분석을 정확하게 이해한다면, 이 두 가지 통계분석기 법이 통합된 구조방정식모델(Structural Equation Model: SEM)을 보다 정확하게 이해할 수 있고, 또한 좀 더 다양하 게 활용할 수 있을 것이다. 참고로 구조방정식모델은 학 계에서 사용빈도가 상당히 높은 고급 통계 기법이다. 두 번째 소개할 추가 정보는 커뮤니케이션 통계 방법 학습을 통해 얻은 조사 능력의 잠재적 혜택에 관한 것이 다. 근자에 들어, 리서치 회사뿐만 아니라 웬만한 광고나 홍보 기업, 언론 매체, 일반 대기업, 그리고 국가 기관에서 는 자체적으로 ‘조사 업무’ 부서를 두고 있다. 이 ‘조사 업 무’부서에서는 사회과학 통계 방법을 적용해 조사를 실시 하고, 이를 통해 얻은 정보 그 자체를 상품화하거나 또는 이 정보를 이용해 새로운 사업 전략이나 상품을 구상한 후 기획 과정을 거쳐 제작한다. 따라서 만일 여러분이 커뮤
xxii
니케이션 통계 방법 실무 능력을 갖춘 기취업자라면, 직장 내에서 경쟁력을 갖춘 우수한 재원으로 인정받을 개연성 을 높일 수 있다. 실례로, 대구대학교 신문방송학과 대학 원에 재학 중인 현역 기자들은 “커뮤니케이션 연구 방법 을 학습하면서, 통계자료를 이용한 다양한 기사 기획 및 정확한 보도 능력을 향상시킬 수 있었다”고 밝혔다. 또한 청년실업난이 가중되고 있는 현실을 고려해 볼 때, 미취업 자는 조사 업무를 실행 및 관장하는 통계청과 같은 다양한 공기관이나 리서치 회사를 비롯해 일반 대기업이나 광고․ 홍보 회사와 같은 사기업에 대한 취업 가능성을 확대할 수 있을 것이다. 자! 이제부터 ‘커뮤니케이션 통계 방법’이란 만만치 않 은 미지의 세계로 오신 여러분 모두를 진심으로 환영하며, 마지막 도착지에서 여러분 모두를 다시 만나길 간절히 기 원해 본다.
xxiii
차례
각종 통계 분석 방법의 이해와 적용
01
표본추출
02
측정
03
신뢰도와 타당도
04
기술통계
39
05
모수추정
51
06
교차분석
65
07
t-검정
08
상관관계분석
09
회귀분석
109
10
분산분석
131
1
13 25
79 95
v