토크토크 맨처음 SPSS_맛보기 by Communicationbooks

토크토크 맨처음 SPSS 현장에서 바로 쓰는 교육 ․ 복지 통계분석

장경희

대한민국, 서울, 학이시습, 2014

책을 내며

통계를 배우다 보면, ‘나, 바보 아니야?’ 하는 생각이 들 때가 많다. 이 책의 영문명을 ‘Statistics for dummies(바보들을 위한 통계 입문)’라고 한다면, 이 ‘바보들’ 중 한 사람은 다름 아닌 저자 인 나 자신이다. 통계에 정통한 전문가가 아니라는 것이다. 이런 내가 이 책을 쓴 이유는, 통계 교재를 쓴 많은 다른 이들과 같은 총명함을 ‘못 가진 자의 설움‘을 잘 알기 때문입니다. 그야말 로 느낌 아니까. 통계 강의를 몇 차례 하다 보니, 학생들이 통계를 이해하는 데 어려움을 겪는 이유 중 하나가 그들에게 친숙하면서 욕구에 맞는 자료가 부족해서가 아닐까 하는 생각이 들었 다. 또한 교재 따로, 수업 시간에 소개하는 개념 이해 따로, 자료를 분석하는 과제 따로, 현장에 서 실제 통계를 이용한 조사 프로젝트 따로 진행되는 경우가 많은데, 이 때문에 사람들은 통계 가 너무 어려워 연구자들이나 사용하는 것이라고 생각하는 경향이 있다. 통계는 현장의 실천 가뿐 아니라 일반인도 사회현상을 이해하고 어떤 행동을 할 것인가 결정할 때, 알게 모르게 통 용하는 중요한 도구다. 우연한 기회에 지인들과 만나 아줌마 폭풍 수다를 떨던 중, 내가 “좀 쉽 게 쓰인 통계 책이 있으면 좋겠어요”라는 말을 꺼낸 적이 있다. “네가 한번 써 보지?” 하는 지인 의 한마디에 이 책의 서론에 담긴 ’통계 책을 어떻게 다르게 쓸 것인가?‘에 대해 자문을 하는 것 을 시작으로 길고 긴 여정을 걸어 왔다. 졸서를 펴내며 거창하게 뭔가를 쓴다는 것이 부끄럽기는 하지만, 심혈을 기울여 처음으로 이 세상에 ‘책’을 내보내려니 이 기회를 빌려 그동안 여러 어려움에도 불구하고 이 자리까지 오 게 해 주신 수많은 분들에게 감사한 마음을 전하고 싶어진다. 늘 나를 묵묵히 지켜 준 나의 가 족, 교수님, 선후배, 동료들, 낯선 곳에서 도움을 주신 분들께 깊은 감사를 전하고 싶다. 추진력 있고 유쾌한 한림대학교 이지혜 교수님께서 선뜻 책을 써 보라며 격려해 주지 않았다면 이 책 은 세상에 나올 수 없었을 것이다. 그러나 믿을 곳이 있어야 발을 뻗는다고 했다. 통계에 정통 하지 않은 내가 이 책을 써서 감히 세상에 내놓을 생각을 했던 것은 사회과학자료원(KOSSDA) 의 정민혁 연구원과 서울여자대학교 김진석 교수께서 감수를 해 주신 덕분이다. 바쁘신 중에 도 졸서를 꼼꼼히 읽어 주고 귀한 조언을 해 주신 데 대해 깊이 감사드린다. 학습용으로 조야하 게 만들어진 데이터세트만으로는 통계가 현장에서 어떤 함의를 가지는지 알기에 부족하여 실 제 연구에 사용된 데이터세트가 필요했다. 어려운 부탁임에도 불구하고 선뜻 학습을 위해 데 이터세트를 사용하도록 허락해 주신 동아대학교 문영주 교수님께도 진심으로 감사를 표하고

싶다. 무엇보다 쳐다보기에도 버거운 두꺼운 통계 원고를 읽고 시원스럽게 진행해 주신 학이 시습의 김영희 편집장님께 감사드린다. 이 책의 독자들께 미리 감사드린다. 집필하는 동안 통계에 대해 그동안 안다고 생각했던 것들이 제대로 알지 못했던 것임을 깨달았고, 스스로 수많은 질문을 하고 많은 참고 자료를 보 면서 답변을 찾아 정리했다. 원고 내용도 여러 번 읽고 수정을 하면서 부끄럽지 않은 책을 내려 노력했으나 크고 작은 실수들을 피할 수 없었으리라고 생각한다. 그럼에도 불구하고 용감하게 책을 내는 이유는 이 책을 집필하는 과정에서 내가 배운 내용들을 정리한 일이 나 같이 ‘오리무 중’의 바다에서 헤매는 학생들에게 ‘상처를 가진 치유자’ 혹은 ‘느낌 아는 선배’로서 할 수 있는 일이라는 믿음에서였다. 이 책은 통계를 배우는 학생들에게 도움의 의미뿐 아니라 통계를 잘 하는 분들께 띄우는 나의 과제물라고 생각한다. 피드백을 겸허하게 받아들이고자 한다. 혹시 잘못된 점을 찾은 분은 지체 없이 알려 주면 감사하겠다. 끝으로, 석사과정 동안 가족처럼 돌보아 주신 미국인 어머니 두 분 로즈메리와 캐럴(Mom Rosemary & Mom Carol)께 못 다한 감사의 말씀을 이 자리를 빌려 전하고 싶다.

아차산 기슭에서 장경희

차례

책을 내며

서론: 이 책의 특징과 사용 방법

1주. 연구 프로젝트의 시작

2주. 연구계획부터 데이터 수집까지 1. 연구질문

2. 연구가설

3. 연구모델

4. 측정도구

5. 설문지 초안 만들기 6. 기초연구

7. 자료수집

3주. 데이터의 조직 1. 데이터 입력

1) SPSS에 직접 데이터 입력

2) 마이크로소프트 엑셀 이용

3) 외부에서 받은 SPSS 데이터 가져오기 2. 데이터의 가공

1) 더미변수 만들기

2) 나이 계산

3) 등간척도를 서열척도로 변환 4) 변수의 위치 변경

5) 변수 정의에 대한 수정 6) 역코딩 7) 지수화하기

66 69

4 주. 기술 통계

1. 범주형 변수의 기술

78 81

1) 범주형 변수의 오류 검토와 데이터 가공 84

2) 범주형 변수의 요약과 기술 2. 연속형 변수의 기술

84 86

1) 연속형 변수의 오류 검토와 데이터 가공 87

2) 연속형 변수의 요약와 기술 88

(1) 분포의 형태 92

(2) 대표값

(3) 산포도·분산도 3. 과제하기

예시문

범주형 데이터의 요약 기술

연속형 데이터의 요약 기술

101

5주. 추론통계

103

1. 기술통계 vs. 추론통계

104

2. 세 가지 분포: 표본분포, 모집단분포, 표집분포 3. 표집분포의 확률분포모델들

109

114 115

1) z분포, 언제나 변함없는 ‘표준’ 모델

2) t분포, 자유도에 따라 확률분포가 달라지는 모델

6 주. 범주형 변수에 대한 추정

121

127

1. 컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하거라! 2. 기본 사항 정리: 결과를 술술 써 보자! 3. 심층 탐구: 원리를 찬찬히 살펴봅시다!

3) 표집분포를 이용한 추론 4. 모비율 간의 ‘차이’ 추정 5. 과제하기

예시문

129

1) 표본데이터에 대한 기술 2) 모집단에 대한 상상

128

130 131

140

145

범주형 변수에 대한 신뢰구간 추정

146

127

7 주. 연속형 변수에 대한 추정

149

1. 컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하거라! 2. 기본 사항 정리: 결과를 술술 써 보자!

150

3. 심층 탐구: 원리를 찬찬히 살펴봅시다!

153

2) 모집단에 대한 상상

156

3) 표집분포를 이용한 추론

예시문

151

1) 표본데이터에 대한 기술

4. 과제하기

150

168

연속형 변수의 신뢰구간 추정

8주. 독립표본 t검정

169

174

1. 간단한 설명: 추정 vs. 가설검정

175

2. 컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하거라!

186 186

1) 독립변수의 영향을 고려하지 않은 종속변수의 표본분포 (1) 케이스선택

187

(2) 데이터탐색

188 188

(3) 케이스 복귀

189

2) 독립변수에 따른 종속변수의 표본분포

3) 독립표본 t분석: 2집단 평균차에 대한 가설검정 3. 기본 사항 정리: 결과를 술술 써 보자!

190

191

4. 심층 탐구: 원리를 찬찬히 살펴봅시다!

193

1) 표본데이터에 대한 기술

(1) 독립변수와 상관없는 종속변수의 분포: 총평균

193

(2) 독립변수에 따른 종속변수의 표본분포: 2집단의 평균 (3) 독립변수의 영향에 대한 가설검정을 위한 통계치 t값 199

2) 모집단에 대한 상상 199

(1) 가설 정리

(2) 통계분석을 위한 기본 가정-모집단에 대한 전제 3) 표집분포를 이용한 추론

203

204

(1) 가설검정

(2) 종속변수의 모수에 대한 추정 5. 과제하기

예시문

228

독립표본 t-분석

229

226

200

194 198

9주. 일원배치 분산분석

239

1. 간단한 설명: 독립표본 t검정 vs. 일원배치 분산분석 2. 컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하거라!

243

(2) 데이터탐색

244

243

1) 종속변수의 표본데이터 기술 (1) 케이스선택

239

245

(3) 케이스 복귀

245

2) 독립변수에 따른 종속변수의 표본데이터 기술

3) 일원배치 분산분석: 3집단 평균차에 대한 가설검정 3. 기본 사항 정리: 결과를 술술 써 보자! 4. 심층 탐구: 원리를 찬찬히 살펴봅시다!

246

247

254

1) 표본데이터에 대한 기술

254

(1) 종속변수의 분포: 총평균과 3집단의 평균

(2) 독립변수의 영향에 대한 가설검정을 위한 통계치 F값 계산 (3) 사후분석에 사용되는 통계치인 개별 평균차 계산 268

2) 모집단에 대한 상상 268

(1) 가설 정리

(2) 통계분석을 위한 기본 가정: 모집단에 대한 전제 272

(1) 가설검정: 모집단에서 독립변수의 영향 (2) 추정: 모집단에서 종속변수의 모수

예시문

269

272

3) 표집분포를 이용한 추론

5. 과제하기

257

267

286

289

일원배치 분산분석

290

10주. 이원배치 분산분석

301

1. 간단한 설명: 상호작용효과를 검정하는 완전요인 모형 vs. 주효과만 포함한 가법모형 2. 컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하거라!

306

1) 독립변수의 영향을 고려하지 않은 종속변수의 표본데이터 기술 (1) 케이스선택

306

(2) 데이터탐색

307

(3) 케이스 복귀

306

307

2) 정규성검정을 위한 파일 분할

308

3) 이원배치 분산분석(완전요인모형: 상호작용을 포함한 모형)

309

4) 이원배치 분산분석(가법모형: 상호작용효과를 없애고 주효과만 포함한 모형) 3. 기본 사항 정리: 결과를 술술 써 보자!

312

311

302

4. 심층 탐구: 원리를 찬찬히 살펴봅시다!

314

1) 표본데이터에 대한 기술

314

(1) 독립변수와 상관없는 종속변수의 표본분포: 총평균

315

(2) 독립변수에 따른 종속변수의 표본분포: 6집단의 평균

316

(3) 상호작용 효과에 대한 가설검정을 위한 통계치 F값 계산 324

2) 모집단에 대한 상상 324

(1) 가설 정리

(2) 통계분석을 위한 기본 가정: 모집단에 대한 전제 328

3) 표집분포를 이용한 추론

(1) 가설검정: 모집단에서 상호작용 효과 (2) 추정: 모집단에서 종속변수의 모수 5. 과제하기 예시문

326

328 342

351 352

이원배치 분산분석

11주 . 단순회귀분석과 다중회귀분석

361

1. 간단한 설명: 독립변수의 값에 따라 종속변수의 값 예측해 주는 회귀식 2. 컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하거라!

370

1) 독립변수의 영향을 고려하지 않은 종속변수의 표본데이터 기술 (1) 케이스선택

370

(2) 데이터탐색

372 372

(3) 케이스 복귀

372

2) 잔차 생성 및 회귀분석 실행 374

3) 정규성검정

3. 기본 사항 정리: 결과를 술술 써 보자! 4. 심층 탐구: 원리를 찬찬히 살펴봅시다!

375

380

1) 표본분포에 대한 기술통계

380

(1) 독립변수와 상관없는 종속변수의 표본분포: 총평균 (2) 독립변수에 따른 종속변수의 표본분포: 회귀식 예측값 (3) 표본에서 독립변수의 영향 2) 모집단에 대한 상상 (1) 가설 정리

397

(2) 통계분석을 위한 기본 가정: 모집단에 대한 전제 3) 표집분포를 이용한 추론

(2) 추정: 종속변수의 모수 추정을 위한 연구모델 정교화

예시문

다중회귀분석

399

409

410

(1) 가설검정

5. 과제하기

383

385

440

443

432

370

365

12주. 위계적회귀분석을 이용한 연구모델의 검정

458

1. 간단한 설명: 독립변수들의 그룹별 영향을 알아보는 위계적회귀분석 2. 컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하거라!

(1) 케이스선택

467

(2) 데이터탐색

467 468

(3) 케이스 복귀

468

2) 위계적회귀분석과 잔차 생성 470

3) 정규성검정

3. 위계적회귀분석과 관련된 설명과 정리

470

473

1) 모델 설계상의 오류

2) 서로 다른 연구모델에서 독립변수(성별)의 영향

예시문

464

467

1) 종속변수의 표본분포

4. 과제하기

481

490

492

위계적회귀분석의 원리

13주. 카이제곱검정

498

1. 간단한 설명: 비모수적 검정인 카이제곱검정에 대한 개요 2. 컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하거라!

498

501

1) 독립변수의 영향을 고려하지 않은 종속변수의 표본데이터 기술 501

(1) 케이스선택

502

(2) 빈도분석 (3) 케이스 복귀

503

2) 독립변수에 따른 종속변수의 표본분포: 교차분석 3) 독립변수의 영향을 검정하는 카이제곱 독립성검정 3. 기본 사항 정리: 결과를 술술 써 보자! 4. 심층 탐구: 원리를 찬찬히 살펴봅시다!

1) 표본데이터에 대한 기술

506

(1) 종속변수의 표본분포

506

2) 모집단에 대한 상상

511

3) 표집분포를 이용한 추정

예시문

514

519

카이제곱 독립성검정분석

520

503 504

505

506

(2) 표본에서 독립변수의 영향을 나타내는 χ2 계산

5. 과제하기

458

509

501

14주. 복습: 통계분석에 대한 요약

15주. 결론: 통계란 무엇인가? 1. 통계는 연구과정의 일부다

526

534 535

2. 통계는 거짓말을 하지 않는다?

537

3. 통계를 근거로 한 주장의 오류가능성

2) 무응답에 대한 부적절한 처리 3) 연구모델 설계상의 오류 4) 잘못된 측정 5) 부적절한 해석

미주

549

540

541

542 543

4. 통계가 거짓말이 되지 않으려면?

그리고 그 후…

538

1) 부적절한 표본추출 방법

547

544

서론 이 책의 특징과 사용 방법

이 세상에는 통계에 정통한 저자들이 저술한 수많은 통계 교재가 있고 인터넷에 떠도는 수많은 참고자료들도 있는데, 이 책은 세상에 나와 어떤 존재 가치를 가질까? 이 책을 쓰기 전 고민한 질문이다. 이 책을 쓸 때, 통계의 원리를 깊게 소개하고 있는 통계 교재들과 그동안 배웠던 교 수님들의 가르침, 그리고 여러 자료들을 많이 참조했다. 때로는 정통한 통계 교재들에서 언급 하지 않았던 어떤 ‘표현’이 안개 속 같던 머릿속을 기가 막히게 정리해 줄 때가 있다. 바로 그 깨 닫는 순간(A-ha! Moment)의 쾌감을 통계 초보(dummy)가 아닌 사람들은 잘 모를 수 있다. 하 지만 여러 자료들이 각각 긁어 주는 곳이 달라서 하나의 자료로 이 ‘참을 수 없는 총체적 가려움 증’을 해소하기 어려운 경우가 많았다. 통계를 여러 번 들었다는 어떤 학생이 나의 수업에서 “내용은 같은데, 전혀 다른 수업을 들은 것 같다”고 말한 적이 있다. 나도 통계 수업을 들었을 때 같은 경험을 했다. 그 교수자들의 화법과 주안점이 다르다는 점도 이유일 것이다. 나에게 깨달 음의 쾌감을 주었던 내용과 다양한 목소리들을 한 곳에 모아 보려 했다.(잘못된 내용이 아니라 면!) 기존의 통계 관련 자료와 차별을 두려는 점과 독자들이 이 책을 사용하기 위해 알아 둘 점 은 다음과 같다.

대상: 통계 초보 다음과 같은 신문 기사를 읽었다면 어떤 생각이 드는가?

“100명의 출구조사를 바탕으로 득표율은 ㄱ 후보가 38.5%로 ㄴ 후보의 35.6%보다 2.9%인 오 차 범위 안에서 앞서는 것으로 조사됐다(95% 신뢰도 기준 ±3.1 오차 범위).”

혹은 이런 것은?

“허리 수치 1인치 줄이면 생체나이가 2년 젊어지는 것으로 밝혀졌습니다.”

무슨 문제가 있는지 전혀 모를 수도 있다. 문장에 뭔가 문제가 있는 것 같기는 한데, 그것이 무

엇인지는 정확하게 모른다거나 어떤 말은 통계랑 도대체 어떤 관련이 있는지 이해가 가지 않을 수도 있다. 그렇다면 여러분은 통계를 잘 모르는, 처음 통계를 접했을 때의 나와 같이 통계 초 보인 셈이다. 그렇다면, 이 책의 주인공이자 또 한 명의 통계 초보자인 나몰라 씨와 함께 통계 의 세계로 여행을 떠날 기본 자격(?)을 갖춘 셈이다. 통계 초보에는 여러 단계가 있다. 아예 처 음 접하기 때문에 모르는 사람들도 있고, 한두 번 통계를 접했기 때문에 ‘통계적 유의’라는 말을 들어 본 적은 있으나 그 의미를 개념적으로 이해하지 못하는 초보 아닌 초보도 있다. 개념적으 로 이해는 하는데 막상 통계분석을 해서 보고서를 내라고 하면 머릿속이 새하얗게 되는 초보도 있다. 이 책은 이런 이들을 위한 책이다.

전개: 스토리텔링으로 실무자 업무 과정을 재구성 학생이나 실무자들이 통계 수업을 듣고 통계 서적을 다 읽고 나서도 막상 실제 데이터를 가지 고 통계분석을 하는 프로젝트를 하려면 무엇을 어디서부터 어떻게 해야 할지 막막한 경우가 많 다. 많은 책들이 ‘통계란 무엇인가?’라는 정의에서 시작해 다양한 통계분석 방법들을 나열한다. 이러한 형식이 배우는 학생 입장에서는 통계분석들 간의 연결성을 이해하거나 각 분석이 ‘어디 에 쓰는 물건인고?’를 이해하는 데 다소 부족하다는 생각을 했다. 이 책은 교육복지우선지원사 업(이하 교복우 사업이라 함)’을 진행해 오던 금천구 사례관리팀이 상부로부터 ‘서비스 프로그 램 개선을 위한 제안서를 작성하라!’는 지시를 받는 상황에서 시작한다. 등장인물 세 사람을 간 단히 소개한다.

널시켜 45세 남자. 대학에서 교육학을 공부하고 교육 현장에서 일하다가, 현재는 서울시 금천구 교복 우 사업에서 사회복지 실천가들과 함께 일하면서 반은 사회복지사가 된 베테랑 교육공무원이 다.(주의: 금천구라는 지역명은 실제감을 주기 위해 임의로 설정한 것이다. <무한도전>에서 ‘알라스카의 김상덕 씨 찾기’ 하듯 실제 인물을 찾아나서는 분이 없기를 바란다.) 상사라면 모 름지기 ‘똑게(똑똑하고 게으른 상사 모델)’가 되어야 아랫사람의 역량을 강화시켜 이 사회의 구 성원으로서 기능을 다할 수 있게 한다는 나름 확고한 신념을 가진 사람이다. 언젠가 나몰라 씨 가 통계 특강 시간에 나름 심오한 질문을 한 것을 기억하고 나몰라 씨에게 통계와 관련된 일을 하도록 일을 꾸민다. 통계나 연구에 대해 깊게 알고 있는 바는 없지만 학습 성취 위주의 교육 현 장에서 우리 학생들을 위해 진정한 교육복지를 이루겠다는 사명을 마음속 깊이 간직하고 성심 껏 노력하는 사람이다. 교육계와 사회복지계의 실천가들이 일을 함께 하면서 소통이 어려운 경우가 많은 것을 지각하고, 교육우 사업의 원활한 진행을 위해 교육과 복지를 모두 공부한 나

몰라 씨를 발탁했다.

나몰라 35세 남자. 대학에서 교육학과 사회복지학을 복수 전공했다. 이런저런 일을 전전하다가 대한 민국 교육복지에 이바지하겠다는 야무진 야망을 안고 교복우 사업의 사례관리 담당자로 일을 시작해 5년차가 되었다. 팀장인 널시켜 씨의 계략에 의해 어느 날 느닷없이 통계 업무가 떨어 진다. 널시켜 씨가 ‘잘되면 내 덕 안되면 네 탓’ 한다며 얄밉다고 투덜거리긴 하지만 그런 팀장 이 알게 모르게 보여 주는 신임을 알고 있기에 이 일을 잘 해내고 싶은 욕구가 강하다. 그러나 학교 다닐 때 얄팍하게 효율적으로 살아야 이 험한 세상에서 살아남을 수 있다는 개똥철학을 고수하면서 거둔 우수한 성적의 다른 과목과 달리 통계만큼은 전략적으로 실패하여 C학점의 멍에를 가슴에 안고 살고 있었다. 직장에서 보수교육으로 통계 특강을 ‘가볍게’ 들었으나 역시 통계에 대해 초보다.

난알아 35세 여자. 대학에서 도서관학을 전공하고 사서로 근무했다. 안정을 추구하는 자신에게 사서 직보다 잘 맞는 일이 없다며 천직이라고 생각하고 즐겁게 일했다. 그러나 어느 날 홀연히 신의 직장이라 불리던 대학교 교직원 자리를 박차고 뛰쳐나왔다. ‘그냥 멀리 넓은 곳에 가 볼 거야!’ 하며 미국으로 훌쩍 떠나 사회복지학 석사를 마쳤다. 그 후 ‘일찍이 뜻한 바 없었던’ 박사과정에 들어가 사회복지계에서는 다소 생소한 ‘지식경영’에서 틀을 가져와 사회복지에 적용해 보겠다 고 까불다가 어렵사리 박사학위를 취득했다. 지금은 나몰라 씨가 일하는 기관 한 귀퉁이에 앉 아 연구원으로 일하고 있다. 운 좋게 기회가 생기면 대학교에서 강의도 하며 사부작사부작 산 다. 머리에 있는 지식의 양이나 그 깊이는 달라도 소크라테스나 자신이나 ‘알고 있는 것 한 가지 는 자신이 모른다는 것 뿐’이라고 생각한다. 어떤 현상에 대해 평균적 경향을 찾아내어 일반화 하는 통계에 대해 많은 사람이 보내는 무조건적 신뢰를 항상 경계한다. 통계 수업을 한 번만 들 으면 척 알아듣는 천재가 아니라서 나몰라 씨의 아픔을 누구보다 잘 안다. 이제는 초보 딱지를 떼고 ‘상처를 안고 있는 치유자’의 마음으로 나몰라 씨를 돕고자 통계 과외를 시작한다.

이 책은 나몰라 씨가 제안서 작성을 목적으로 연구 설계를 하고, 설계에 따라 설문지를 만들어 수집하고, 설문의 응답 내용을 통계 전문 소프트웨어인 SPSS(새로운 명칭은 PASW)에 데이터 로 입력한 뒤, 여러 가지 통계분석을 통해 결과를 해석해 구체적 의사 결정을 하는 일련의 과정 을 기술했다. 통상적으로 통계책 마지막에는 ‘인터넷을 찾아보면 다 나오는’ 각종 분포표 (distribution tables)가 수록되어 있는 경우가 많다. 이 책 마지막에는 나몰라 씨가 연구하려는 내용에 맞는 특정 통계분석 방법을 사용해 자료를 분석했을 때 어떤 결론을 내리는지에 대한

시나리오를 제시하고, 앞에서 학습한 실제 내용을 바탕으로 통계라는 것이 어떤 것인지 개념 정리를 했다. 이런 방법으로 독자들이 각자 상황에서 어떻게 실제 데이터를 분석하여 실천 지 식으로 만드느냐에 대한 예시를 제시하고자 했다. 실제 프로젝트에서는 적어도 50개 이상의 설문 응답을 요구한다. 이렇게 케이스 양이 많으 면 통계분석에서 이 케이스들이 어떻게 처리되어 결과가 나오는지 개념적으로만 가늠해 볼 수 밖에 없다. 이 책의 통계분석에 포함된 데이터는 가상으로 만들어진 30여 개의 케이스로 이루 어져 있다. 100개의 설문응답이 있었으나 일부분만 가지고 분석연습을 해 본다는 설정이다. 이런 방법으로, 우리가 눈으로 확인하고 손으로 조작할 수 있는 정도의 실제 숫자들을 이용해 주요 통계 개념들을 구체적으로 설명했다. 시나리오 전개 과정 중, 한국연구재단이 지원한 기 존의 연구 자료와 데이터세트와 같이 유용한 자료가 기초학문자료센터 웹사이트에 구축되어 있다는 것도 자연스럽게 소개했다. 실무자와 학생, 다른 연구자들이 이런 자료들을 적극적으 로 이용하여 학문과 실천의 발전에 기여할 수 있도록 작은 통로 역할을 하고 싶었다. 또한 해당 사이트에서 실제 데이터세트를 다운로드받아 통계분석하는 과제도 했다. 이런 경험을 통해 독 자들이 통계분석을 실제 수행되었던 연구와 연결하여 더욱 현실감 있는 맥락에서 이해하고 그 효용성을 느낄 수 있도록 구성했다.

관점: 동갑내기 과외하기 나는 사회복지를 공부했다. 이 분야에서 가장 중요시하는 것이 내담자의 관점을 중심으로 한 실천(Client-oriented Practice)이다. 이러한 지혜는 여러 다른 분야에도 적용된다. 우선, 학과 수업을 받고 있는 우리 마음속을 들여다보자.

어제 친구들과 늦게까지 인생에 대한 토론을 하느라 마땅히 읽어야 할 교재를 읽어 오지 않았다. 나 만 빼고 모든 학생이 교수님의 이야기를 이해하는 것 같다. 우리 과 모범생 ‘나잘해’ 양이 초롱초롱 한 눈동자를 빛내며 나로선 처음 들어 본 단어를 써 가며 질문을 한다. 교수님이 답변하신 말씀 중 방금 전에 한 저 한마디 말의 의미만 정확하게 알면 웬만한 내용은 다 이해할 수 있을 것 같은데, 내 무지함의 깊이가 들통 날까 두려워 차마 질문을 하지 못하고 귀가했다. 수업 시간에는 이해할 것도 같았던 내용마저 막상 집에 돌아와 보면 머릿속이 새하얀 순수의 세계가 된다. 전문 용어로 ‘초기화 (Reset)’되었다. 책을 찾아서 읽어 본다. 어렵다. ‘어차피 읽어 갔어도 몰랐겠구나!’ 하고 정당화해 본다. 수업 시간에 했던 내용을 그대로 다시 녹화방송을 했으면 하는 생각이 간절하다. 참담하다. 내 안에 소용돌이치는 이 많은 질문을 누군가 날 이해해 주고 동감해 주는 사람에게 묻고 싶다. 그 것도 내 페이스대로 나갈 수 있도록…. 나잘해 양은 안 될 것 같다. 지난번에 뭐 하나 물었다가 ‘어떻 게 이런 걸 몰라?’ 하는 표정으로 동그란 눈이 축구공만 해지는 것을 보고 상처를 받았다.

이 책은 과거에 이런 상처를 안고 있는 주인공 나몰라 씨의 성장 기록이라고 볼 수 있다. 무 식이 용감한 학생인 나몰라 씨가 난알아 씨를 만나 일대일 과외 형식으로 둘의 대화가 이어지 게 구성했다. 교육은 지식의 전달이 가장 중요하겠지만, 학습자에 따라서는 교수자의 끊임없 는 ‘동기 부여’와 ‘치유’가 필요한 경우가 있다. 이 책에서 난알아 씨는 “모르겠어? 괜찮아. 나도 그랬어! 그냥 계속 열심히만 해 봐”라고 계속 나몰라 씨를 독려한다. 실제로 나의 강의를 들은 학생 중에는 이 부분에서 효과를 본 경우도 있었다.

문체: 참을 수 없는 존재의 가벼움 평범한 우리는 통계라는 말만 들어도 머리가 묵직해진다. 통계 교재나 통계를 사용한 학술 기 사를 보면 ‘음, 이런 것은 교수나 연구자들이 보는 책이지’ 하고 시선을 피하게 된다. 내가 학위 논문을 쓸 때 지도교수는 교육을 많이 받지 않은 할머니가 읽어도 이해할 수 있도록 쉽게 논문 을 작성해야 한다고 조언했다. 영어로 된 학술 서적은 문장을 논리적으로 구성한다면 누구나 쉽게 읽을 수 있는 단어와 문체로 기술한다. 표현력이 풍부한 한국어는 예술성이 뛰어나지만, 학술서에서 사용하는 단어나 문체는 우리가 평상시 사용하는 것과 많이 달라서 술술 읽어 가기 어렵다. 물 흐르듯 유연(fluent)하지 않고, 요철 구간에서 자동차 운전하는 것처럼 덜컹거리며 (bumpy) 읽게 된다. 게다가 한국어는 주어가 생략되는 경우가 많고 꾸밈말이 어디에 걸리는 지가 확실하지 않아서, 개념을 명확히 이해하는 데 걸림돌이 되기도 한다. 이런 이유로 학술서 가 일반 대중이나 현장에서 일하는 실천가들에게 널리 읽히고 활용되는 데 한계가 있다는 것이 안타까웠다. 통계는 수학이나 복잡한 컴퓨터 프로그램 사용법이 아니라, 우리가 일상생활에 합리적인 사고를 하여 좋은 결정을 내리기 위해 필요한 도구다. 통계책도 많은 사람들에게 요 리책처럼 읽히는 대중적인 책이 되었으면 좋겠다. 이 책은 대화 형식으로 되어 있기 때문에 문 어체보다는 구어체를 사용했다. 기존의 통계 교재들이 학술 서적이라는 정체성을 가지고 다소 딱딱한 문체로 기술된 것이 많아 일부 독자에게는 이해를 방해하는 요소로 작용하기도 했다고 본다. 적어도 말이 어려워 내용을 이해하기 어려운 문제는 해결하고 싶었다. 같은 맥락에서, 형 식적 용어에 대한 ‘정의 내리기’는 자제하고 가능하다면 상황 안에서 자연스럽게 의미를 이해 할 수 있도록 구성했다.

연습: 눈보다는 손과 머리로 이 책은 이론보다는 실제에 중심을 둔다. 일종의 ‘직접 활동을 통한 학습(Learning by Doing)’ 이랄까? 따라서 ‘컴퓨터를 이용한 통계 처리 절차: SPSS야, 분석하거라!’ 부분과 ‘기본 사항 정리: 결 과를 술술 써 보자!’ 부분을 통해 통계분석 과정을 요리책에서 조리법 설명하듯이 풀어 썼다. 통

계분석을 할 때 SPSS 조작을 어떻게 하는지 설명하고 나서, SPSS 조작 후에 나오는 결과물들을 어떻게 정리하여 보고서 형식으로 기술하는지 설명했다. 물론 이런 방식의 맹점은 분명히 있 다. 통계분석은 제품이 규격화된 공정 과정을 거쳐 동일하게 찍혀 나오는 과정과는 다르기 때 문이다. 하지만 조리법을 생각해 보자. 따라 하다 보면 다른 응용 방법도 나오기 마련이다. 문 제는 분석 방법에 익숙하다 하더라도 이론적 원리를 이해하지 못하면 제대로 응용할 수 없다는 점이다. 내가 여러 나이대의 학생들을 가르쳐 보았는데, 학생들의 나이가 어릴수록 실제 자료 를 분석하는 과제를 내주면 ‘빛의 속도’로 작성해 낸다. 컴퓨터 프로그램을 익히는 능력이나 타 자 속도가 가히 ‘빛의 속도’와 같아 놀라울 정도다. 안타깝게도 이 능력과 개념을 이해하는 능력 의 상관관계는 많이 낮다. ‘조리법’ 과정을 거치고 난 후 바로 ‘심층 탐구: 원리를 찬찬히 살펴봅시다!’ 부분에서 해당 통 계 방법의 원리를 자세히 설명한 이유는 조리법 스타일의 맹점을 보완하기 위해서다. 필요하 면 공식을 언급하기도 한다. 나도 수학 공식에 알레르기 반응이 있어 공식을 보는 순간 본능적 으로 못 본 척하는 경향이 있다. 하지만 원리가 이해되기 시작하면서 공식으로 이해의 깊이가 더해지는 놀라운 기적이 일어나기도 했다. 그러나 실제 데이터를 가지고 이리저리 ‘조리’해 보 고 음식이 어떻게 나오는지 눈으로 보지 않고 ‘개념적’으로만 이해하려고 했을 때 내게 수학 공 식은 자존감을 낮추는 것 외에 어떤 기적도 주지 못했다. 이 책에 있는 설명이 부족할 때라면, 다른 ‘교재’를 펴고 용어의 정의를 찾아보고 다른 설명 방법을 살펴보는 지적 호기심과 부지런 함을 권하고 싶다. 아무래도 이해가 안 되면, 죄 없는 머리카락만 쥐어뜯지 말고 ‘그렇다 치고’ 하고서 그냥 넘어가는 것도 하나의 방법이다. 일단 컴퓨터 앞에 앉아 이 책에서 제시하는 대로 바쁘게 따라 해 보자. 똑똑하지는 않아도 성실한 자신에 대한 자긍심도 높아지고, 어느 날인가 섬광처럼 깨달음이 오기도 한다.

내용: 미주알고주알 내가 통계를 처음 만났을 때의 기억을 떠올려 보면, 한마디로 암담했다. 시험 성적은 좋았으나 그 원리에 대한 설명은 알다가도 모를 것 같았다. 위로가 되는 것은 ‘대부분’의 학생들이 비슷한 경험을 한다는 것이었다. 수학적·개념적 이해가 빠른 ‘천재’들은 1과 10을 말해 주면 나머지

‘23456789’는 자동으로 이해한다. 나와 같은 평범한 사람들은 내가 ‘23456789’를 이해하지 못 하고 있다는 사실도 깨닫지 못한 채, 스치는 바람에도 괴로워한다. 이런 상태에서 천재들에게 가르침을 받으려 하면, 천재들은 우리가 뭘 모르는지도 모른다. 보통 어떤 것이 ‘이해’가 되지 않으면, 우리 자신의 ‘삼해’를 더해서 ‘오해’를 만들어 낸다. 같은 교재를 읽으면서 우리의 ‘창조 적 상상력’이 가히 달나라에도 갈 수준이라는 것을 그들이 알까? 그들은 우리의 무식함을 ‘인정’ 은 하지만 ‘이해’는 하지 못한다. 우리 같은 통계 초급자들에게 대부분 교수자들의 충고는 비슷 하다. “반복해서 여러 통계 수업을 들어라!” 나의 충고도 동일하다. 다만, 여러 차례 수업을 들 으면서 느낀 점은 정보가 너무 많아도 내 머리의 중앙처리장치(CPU) 용량에 과부하를 가져와 이해를 방해하기도 하지만 정보가 너무 적어서 이해를 못한 경우가 훨씬 많았던 것 같다. 사실, 수업에서 모든 내용을 다루기에는 시간 제약이 있다. 이럴 때는 문서로 된 자료를 읽으면서 원 리 부분에서 이해가 잘 안 되는 부분을 메워 나가야 한다. 내가 미국에서 공부하면서 접한 통계 관련 자료들은 원리부터 자세히 담고 있는 경우가 많았다. 초급자들은 이런 책을 펴는 순간 울 렁증이 일거나 읽어 보려고 노력해도 잘 이해되지 않는 경우가 많다. 국내에서 출간된 서적들 은 필요한 내용을 간략하게 한눈에 보기 좋게 구성한 것이 비교적 많았다. 이런 경우는 독자들 이 기술된 내용을 이해하는 데는 효과적이지만, 중요 내용에 대한 설명이 충분하지 않아 독자 들이 상상의 나래를 펴야 하는 단점이 있다. 이런 교재들을 가지고 공부할 때 이해가 되지 않는 부분이 있거나 좀 더 심도 있는 설명이 필요할 때면 학습자로서 당연히 다른 참고 자료도 찾아 보아야 할 것이다. 문제는 ‘귀찮다’는 것이다. 몰라서 답답하고 궁금하기는 한데, 그렇게 궁금 하지는 않다. 게다가 시간적 여유도 없다. 이 책을 쓰면서 기존 통계 관련 자료들의 장점을 취하고 단점을 줄이고자 노력했다. 초급 자들이 우선은 쉽게 따라할 수 있도록 했다. 그런 다음, “심층 탐구: 원리를 찬찬히 살펴봅시다!” 부분에서 초급자들이 가능하면 듣고 싶어 하지 않는 원리에 대한 설명까지 미주알고주알 기술 했다. 대신, 가능한 한 쉬운 말, 그림과 표로 설명하려고 노력했다. 독자들이 지루하지 않게 마 지막 장까지 읽어 갈 수 있기를 바라면서.

과제: 반복반복반복 통계 수업에서는 대부분 실제 분석 과제가 주어진다. 이런 과제는 수업이나 교재에서 배웠던 내용을 적용하는 좋은 기회다. 그러나 의외로 ‘원리에 대한 이해’와 실제 ‘분석’이 따로 가는 경 우가 많다. 수업을 들을 때는 지극히 순수하고 ‘인간’적이던 학생들도 과제를 할 때는 대부분 ‘숙제하는 기계’로 돌변한다. 통계 과제 받은 것을 다 할 줄 알고, 원리에 대한 지식을 알아보는 시험에 괜찮은 점수를 받고 나면 ‘이 정도면 됐지!’ 하고 그 자리에 머물게 된다. 그러다가 나중

에 본인이 ‘원리의 이해’와 ‘분석’을 연결시키지 못하고 있었다는 것과 내가 알고 있다고 생각했 던 것이 나만의 상상의 세계였다는 것을 깨달을 때가 있다. 이 책에서는 특정 변수를 이용해 통 계분석을 하고 이론적 개념을 포함해 분석 결과를 기술하는 ‘예시문’을 제시했다. ‘과제하기’에 서는 예시로 보여 준 것과 다른 변수들을 가지고 독자가 직접 분석하고 예시문과 같이 기술하 도록 구성했다. 과제에 대한 답은 인터넷으로 확인할 수 있도록 했다. 과제를 할 때 학생들이 통계분석을 하면서 원리의 내용을 미주알고주알 다 쓰도록 구성했다. 앞 장에서 다룬 내용이 라도 계속 반복하게 될 것이다. “Stay foolish! Stay hungry!”라는 스티브 잡스의 말처럼 우직하 게, 알고 싶다는 일념으로 열심히 반복하며 공부해 보자. 겸손한 CPU를 가진 우리도 성실하게 반복하다 보면, 통계를 난알아 씨만큼은 할 수 있다. 자! 우리도 똑똑한 바보(Intelligent dummy)가 되어 보자.

구성과 알아 둘 사항 이 책은 총 15주차의 일대일 과외 형식으로 내용을 구성했다. 1주차에서는 교육복지 실무자 나 몰라 씨가 통계분석이 필요한 업무를 지시받는 상황을 기술했다. 통계를 접하는 초보자들 중 에는 PASW와 같은 통계 프로그램 마스터쯤으로 생각하는 사람이 있다. 그러나 통계 프로그램 과 통계분석은 실증 연구의 한 부분으로 이해해야 하며 통계분석을 하는 사람은 이 분석의 결 과가 어떻게 활용될 것인가에 대한 연구방법론적 이해가 반드시 필요하다. 따라서 연구 설계 와 관련된 연구방법론적 이슈들을 설명하기 위해 2주의 상당 부분을 할애했다. 3-4주에 해당하 는 장에서는 데이터 입력, 조작하는 과정에서 알아 두면 도움이 되는 팁들을 가능한 한 상세히 기술했다. 이후에 이어지는 장에서는 기초 통계에 대한 자료에서 일반적으로 다루는 기술 통 계와 추론 통계에 대한 설명과 기초적으로 알아 두어야 할 통계분석들을 실제 데이터로 PASW 에서 수행하여 보고서를 기술하는 과정을 보여 준다. 통계분석이 저마다 다른 특징이 있기는 하지만, 대부분 비슷한 유형으로 전개했다. 즉, ‘컴퓨터를 이용한 통계처리 절차: SPSS야, 분석하 거라!’는 실제 데이터를 통계 프로그램으로 돌려 출력 결과를 저장하는 과정, ‘기본 사항 정리: 결 과를 술술 써 보자!’에서는 출력 결과를 일반적인 보고서에 포함하는 내용과 형식으로 정리하는

과정, ‘심층 탐구: 원리를 찬찬히 살펴봅시다!’에서는 통계의 이론적 내용을 설명하면서 원리 이 해를 도모하고, 각 장의 마지막에는 원리를 포함한 분석 내용을 정리한 ‘예시문’을 수록했다. ‘과 제하기’에서는 원리를 공부한 뒤 다른 예제를 가지고 동일한 과정을 복습하도록 했다. 마지막

장에서는 앞에서 실제 데이터 분석으로 학습한 내용을 토대로 통계라는 것이 무엇인지 요약하 고 정리했다. 이 책은 독자가 독학할 수 있도록 구성했다. 이 책을 들고 PASW 프로그램과 인터넷 사용

이 가능한 컴퓨터 앞에 앉아 학습하기를 권한다. 출판사 네이버카페(http://cafe.naver.com/ learningbooks)에서 가상으로 제공되는 설문 응답지를 보면서 데이터 입력을 해 보고, 해당 데

이터를 가지고 통계분석을 할 수 있다. 실제로 연구에 사용되었던 데이터를 다운로드해 복잡 한 통계분석과 실제 활용이 가능한 지식을 만드는 과정을 따라 해 보기를 권한다. 복잡한 통계 개념을 설명하기 위해 색채를 사용한 그림이 사용되었다. 인쇄본은 흑백으로 구성되어 있으나 독자는 언제든지 출판사 네이버카페에서 컬러로 된 PDF 파일을 확인할 수 있다. 통계 공부를 시작할 것인가는 여러분의 선택이다. 어떤 일의 시작을 결정할 때 ‘두려움’과 ‘설렘’이 모두 마음에 있는가를 살펴보라는 말이 있다. 통계에 ‘두려움’이 없다면, 이 여행을 떠 날 필요가 없다. 이미 많이 알고 있다는 뜻이니까. 통계에 ‘설렘’이 없어도 이 여행을 떠날 이유 가 없다. ‘통계를 알면 얼마나 좋을까!’라는 설렘 없이는 통계라는 쉽지 않은 주제를 이해하려 다 마음에 상처만 입고 포기하기 쉽다. 게다가 혼자 걷는 길이라면 더욱 그러할 것이다. ‘두려 움’과 ‘설렘’ 모두를 마음에 장착했다면, 나몰라 씨와 함께 통계의 세계로 떠나 보자.