Manual para el procesamiento de encuestas

Page 1


Este manual, elaborado por las estudiantes Sandro Pa tricio C贸rdenos Ole da y Homlbn Medino Chlo, se ha rea lizada ce rno Tre b uje de Grad o, bajo lo direcci贸n del profesor ALVARO CAlVACHE ARCHILA

P~og贸git:o y

Tec no l6gico de Colombm focclrod Secoooct Du,tomo Eswelo de Motem贸t't:a y Estodrs bcc Noviembre de 1997

Universidad


CO TENIDO

Pág. /

O. INíRODUCCION

1

1. ORIGEN DE IDA MS Breve reseña histórica de

IDAMS

Características Captura de datos, empleando el primer tipo de preguntas

l1

4 4

5

2. PREPARAR EL DICCIONARIO

~T

Selección de variables y asignación de códigos a categorías

6

/

3. CREACION DEL DICCIONARIO Pasos básicos en la creación del diccionario

8

Descripción de los elementos del Edito r

de Diccionario Curiosidades 1

9 9


rn

4. ALMACENAR EL DICCIOI\JARIO Instrucciones para almacenar las variables al diccionario Orden para grabar el diccionario Retomar nuevamente el trabajo en IDAM5 , en caso de no haber terminado de almacenar el diccionario Curiosidades 2

10 11

12 13

I

5. INlRODUCCION DE LOS DArOS Manera para entrar a la ventana dellDAM5 DATA EDITOR e introducir los datos al diccionario almacenado Formas r谩pidas Orden para grabar el archivo con los datos Curiosidades 3 Preparaci贸n del diccionario para el segundo tipo de preguntas

~

14 15 16 16 17

I

6. DESCRIPCION DEL 5 AS Utilidad de ciertas teclas para trabajar a trav茅s de las ventanas en SAS Tipos de archivos Paso DATA para la creaci贸n de un archivo de datos Procedimientos en SAS Proc Print Proc Sort Proc Freq Proc Means, Run, Libname Programa que origina un nuevo archivo de datos Orden para grabar en SA5 Curiosidades 1

21 22 23 24

25 26 27

29 29 31


o

/

7. EJEC UCION DE PROGRA MA S Empleo de la declaraciรณn Libname para la creaciรณn de un archivo de datos permanente en SAS Frecuencias y medias forma corta Curiosidades 2 Comparaciรณn de variables Ordenar variables por su frecuencia Curiosidades 3 Procesamiento para el segundo tipo de preguntas Programa para obtener la media Programa para obtener la media por subgrupos Curiosidades 4

32 33 33 35 36

38 38 40 40 41

/

8. PRESENTACION DE LOS RES ULTA DOS Diagramas mรกs usuales en la presentaciรณn de un informe

9. GLOSARI O

43

47

/

10. BIBLlOGRAF IA

48


/

INTRODUCCION El manual para el Procesamiento de Encuestas se realizó bajo la dirección del Matemático ALVARO CALVACHE ARCHILA durante el año de 1997. Es el resultado de la experiencia en el procesamiento de Encuestas,

que

la

Escuela

Matemática

de

Estadística de la Facultad Seccional

y

Duitama,

aplicó en poblaciones de la región, con el fin de detectar aceptación por nuevas carreras para la Facultad.

Surge de la necesidad de estudiantes y profesores de la Facultad Seccional Duitama, interesados en el procesamiento de encuestas, de contar con un documento adecuado que indique los pasos básicos a seguir en los paquetes Estadísticos IDAMS

y

SAS, y que incluya a su vez la presentación de los resultados obtenidos.

Este

manual

didáctica,

proporciona

creativa

y

en forma

resum ida

completa,

lo referente

a

Captura de Datos, mediante el paquete Estadístico IDAMS,

en

éste

se

describe

Creación

y


Almacenamiento del Diccionario e Introducción de los Datos. Lo anterior permite la creación de una base de datos en IDAMS, controlada directamente por el interesado, brindando una mayor confiabilidad de los datos recopilados.

El procesamiento de la información se lleva a cabo en el paquete Estadístico SAS, en él se encuentran las instrucciones de los programas que permiten hallar las frecuencias, los porcentajes, las medias, tablas de tabulación cruzada y comparación de variables.

Explica de manera concreta lo relacionado con procedimientos útiles y claves, algunos de ellos producto de la experiencia personal en el manejo de los paquetes IDAMS y SAS, proporcionando al usuario ventajas en su trabajo.

Se emplearon

WORD y EXCEL para lograr una

presentación de los resultados amena y precisa.

El

manual

facilita

que

una

persona

con

conocimientos básicos en Estadística y en el manejo del computador, obtenga en el menor tiempo y a un bajo costo los resultados de las Encuestas.


P".pcU"cU" .., Ah".c."... • 1 o.cc ••" .....


4

Captura de datos en IDAMS

[1]

DAMS proviene originalmente del software estadístico OSIRIS 111.2 desarrollado al comienzo de la década de los 70 en el Instituto para la Investigación Social de la Universidad de Michigan en los Estados Unidos de América . Este software ha sido y continúa siendo enriquecido, modificado y puesto al día por el secretariado de la UNESCO con la cooperación de expertos de diferentes países, a saber: especialistas estadounidenses, británicos, colombianos, franceses, húngaros , rusos y ucranianos; de ahí el nombre "IDAMS": "Internationally Developed Data Analysis and Management Software Package" en castellano : "Paquete de software para el análisis y manejo de datos desarrollado internacionalmente".

proporcione una almacenan en el IDAMS . (ir

Cada columna del arreglo es una variable, siendo esta un conjunto de valores para la misma medida, por ejemplo las edades, estudios realizados, el sexo, etc. Dicha variable se encuentra siempre en la misma posición fija dentro del registro . Un archivo de diccionario IDAMS puede contener hasta 1000 variables.

(ir

Cada variable está descrita en el diccionario, dentro del cual se le asigna un único número; el usuario toma como referencia de la variable el número asignado a la misma y entonces IDAMS en forma automática, trae del diccionario la información referente a la variable, tal como: nombre de la variable; posición del campo de la variable dentro de cada registro; los nombres de códigos de categorías.

(ir

El diccionario solo se genera una vez, después se guarda como parte del dataset IDAMS , además cualquier referencia a una variable se hace a través de su número de variable, cualquier otra información acerca de la variable se obtiene del diccionario que describe los datos.

(ir

Una ventaja del paquete IDAMS es ser un sistema abierto: es relativamente fácil procesar los datos para que tomen la forma de un dataset IDAMS. Como los datos y el diccionario son archivos independientes, los datos no están restringidos a ser usados exclusivamente con IDAMS , sino que,

IDAMS está disponible en versiones para microcomputadores y equipos mainframe de 18M, y los que sean compatibles. CARACTERíSTICAS (ir

Permite la presentación de datos en pantalla, edición y corrección de los mismos.

(ir

Un aspecto importante es el formato llamado "dataset IDAMS " que comprende dos archivos: los datos mismos y una información descriptiva de ellos llamada el diccionario.

(ir

Los datos se pueden imaginar como un arreglo rectangular. Cada fila de este arreglo es un caso o unidad de análisis (persona, entidad en estudio) y generalmente constituye un registro separado dentro de un archivo. Los registros (de aquí en adelante corresponden a la información que

encuesta) se archivo dataset

U.P.T.C. Duitama 1997


5

Captura de datos en IDAM5

por el contrario, pueden intercambiar información con otros paquetes como es el caso del SAS .

CAPTURA DE DATOS En el paquete IDAMS se utilizan los siguientes dos pasos:

Los valores individuales de las variables pueden ser los valores numéricos medidos o códigos que representan categorías específicas, o caracteres alfanuméricos que forman nombres. Cada variable numérica tienen un ancho de campo de 1 a 9 dígitos; las variables definidas como alfabéticas pueden tener hasta 255 caracteres.

r::¡r

1. Preparar y almacenar un diccionario que describa las variables. 2. Capturar los datos. Para la ejecución de los pasos anteriores emplearemos como ejemplo dos tipos de preguntas. Las del primero tipo que se presentan en la encuesta siguiente (gráfico 1.1).

UJIl1.VERSIDADPEDAGOGICA y TECNOLOGICA DE COLOMBIA FACULTAD SECCJONAL DUITAl\1A SO~DEO DE OPJNIÓ~

La UPTC está interesadaen ofrecerprogramasde Tecnologiasen la ciudad de Duitama La informaciónque ustednos aportees básica para la orientación inicialde los programas,especialmenteen cuantoa horariosy tipo de tecnologías a ofrecer.

Le agradecemos su cooperación, l.

ÚLflMO GRADO AP ROBADO:

u

SEXO. FEMENINO

IIJ.

MASCULINO

DE LAS SIGUIENTES TECNOLOGÍAS, POR FAVOR MARQUE EN ORDEN DE PREFERENCIA (J Y 2 ) LAS DOS QUE MÁS LE INTERESEN:

Toe. en InfOflllátic.aDigilal Tec. m So ura y Fundición Tee. en ManlmimientD Eléctrico Tec, en MlU11emmtcnto Mecánico Tec. en Construcciones Civiles 6. Tec. en e ternas

8. Tcc . en Mecánica 9. Tec. en Mecánica Automotriz 10. Tec . en Estadistica Computacional

1. 2. 3. 4. S.

11. Tec. en Ciencias Agropecuarias 12. Otra Cuál:

_

7. Tce. en Eleetricjded

IV.

¿QUÉ TIPO DE DEDlCAC IÓ ESTARL\ DISP UESTO A ASUMIR? PO R FAVO R, MARQUE EN O RD EN D E PREF ERENCIA LAS DOS QUE MÁS LE INT ER ESEN: l . Presencial Diurno 2. PresencialNocturno 3. Semipmeneiol (rDlC. de .emolla)

V.

U~A VEZ GRADUADO COMO TECNÓLOGO (ART.J680, ¿USTED ESTARÍA

DISP UESTO A CURSAR UN CICLO COMPLEM ENTARIO PARA OBTENER EL TÍT IIW DE J.JO:NCIADO O INGENIERO! (Apro,imadamete entre I y 3 oftos má.) SI_ _ VI.

_._ - -

OBSERVACIONES

- --- -

-

NO

(Si necesita mas espacio puede continuar al respaldo):

Gráfico 1.1 ENCUESTA TIPO UNO

U.P.T.C. Duítama 1997


6

Captura de datos en IDAMS

f]

ara preparar y almacenar el diccionario con las preguntas del primer tipo, es necesario conocer cuáles variables se pueden obtener de la encuesta que se desea procesar. Estas surgen de cada una de las preguntas propuestas, y es posible que cada pregunta dé origen a dos o más variables. Para el ejemplo de la encuesta anterior se van a utilizar las siguientes ocho (8) variables: 1. CIUDAD : aunque esta variable no aparece como pregunta en la encuesta, puede proporcionar información importante. Por esta razón la creamos y se tuvo la precaución de separar las encuestas por municipios. Las poblaciones en donde se aplicaron conforman lo que se denominarán las categorías, para este caso son: 1 2 3 4 5 6 7 8 9 10 11 12

DUITAMA BELÉN BETEITIVA CERINZA PAZ DE RIO SATIVA NORTE SATIVA SUR SOCHA SOCOTA TASCO TUTAZA SIN INFORMACiÓN

1 FEMENINO 2 MASCULINO 3 SIN INFORMACiÓN

Para la pregunta número cuatro, se debe realizar una división debido a que se pide marcar preferencia uno y dos. Tenemos entonces las variables: 4. PREFERENCIA UNO : con categorías que corresponden a las diferentes tecnologías que se dan a conocer en la encuesta, de esta forma la variable se mostrará de la siguiente manera: 1 TECN. EN INFORMÁTICA DIGITAL. 2 TECN. EN SOLDADURA Y FUNDICiÓN. 3 TECN. EN MANTENIMIENTO ELÉCTRICO. 4 TECN. EN MANTENIMIENTO MECÁNICO. 5 TECN. EN CONSTRUCCIONES CIVILES. 6 TECN. EN SISTEMAS. 7 TECN. EN ELECTRICIDAD. 8 TECN. EN MECÁNICA. 9 TECN. EN MECÁNICA AUTOMOTRIZ. 10 TECN. EN ESTADíSTICA COMPUTACIONAL. 11 TECN. EN CIENCIAS AGROPECUARIAS. 12 SIN INFORMACiÓN.

5. PREFERENCIA DOS : con las categorías igual que en la variable anterior:

2. ÚLTIMO GRADO APROBADO : Se está interesado en conocer las y los gustos de los preferencias estudiantes de los dos últimos grados de bachillerato, por tal razón solo se tendrán encuentra los grados: 1 UNDÉCIMO 2 DÉCIMO 3 SIN INFORMACiÓN

3. SEXO : esta variable la conforman las categorías correspondientes a:

1 TECN. EN INFORMÁTICA DIGITAL. 2 TECN. EN SOLDADURA Y FUNDICiÓN. 3 TECN. EN MANTENIMIENTO ELÉCTRICO. 4 TECN. EN MANTENIMIENTO MECÁNICO. 5 TECN. EN CONSTRUCCIONES CIVILES. 6 TECN. EN SISTEMAS. 7 TECN. EN ELECTRICIDAD. 8 TECN. EN MECÁNICA. 9 TECN. EN MECÁNICA AUTOMOTRIZ.

U.P. T.C.

Duitama 1997


7

Captura de datos en IDAMS

10 TECN. EN ESTADíSTICA COMPUTACIONAL. 11 TECN . EN CIENCIAS AGROPECUARIAS. 12 SIN INFORMACiÓN.

Para la pregunta número cinco se debe realizar el mismo tratamiento. De esta forma aparecen las variables:

6. DEDICACIÓN UNO : las respectivas categorías : 1 2 3 4

PRESENCIAL DIURNO PRESENCIAL NOCTURNO SEMIPRESENCIAL SIN INFORMACiÓN

7. DEDICACIÓN DOS : con las mismas categorías: 1 2 3 4

PRESENCIAL DIURNO PRESENCIAL NOCTURNO SEMIPRESENCIAL SIN INFORMACiÓN

8. CURSARíA OTRO CICLO : con las opciones que presenta la encuesta: 1 SI 2 NO 3 SIN INFORMACiÓN.

Para la última pregunta correspondiente a las OBSERVACIONES no se tendrá en cuenta para el ejemplo. Solo se mostrará la forma de procesar variables del tipo cerrado .

. En todas las variables anteriores se dejó 'como última categoría SIN INFORMACIÓN, esto es de gran utilidad cuando el encuestado no responde alguna pregunta.

Así como se mencionó anteriormente que el número de variables surge del total de preguntas en la encuesta, el usuario debe tener creatividad a la hora de preparar y almacenar el diccionario y seleccionar las posibles nuevas variables que puedan surgir . Una vez seleccionadas las variables anteriores y sus respectivas categorías se está listo para crear un Diccionario en IDAMS .

U.P.T.C. Duitama 1997


8

Captura de datos en IDAMS

ara entrar al paquete IDAMS se da la orden C :\CD IDAMS y luego '--_ ..1 se oprime la tecla Enter; después se da nuevamente la orden IDAMS y se oprime Enter si se trabaja en modo DOS, o activando el ícono respectivo bajo WINDOWS. Ahora aparece el menú principal

' Se anota el núnero de YOl'iables que se obtilU'lCn de la encuesta.

' ' -_ / 1

(conacido

t.IlQ IIU

Pi ..st Uapiable Nu~bep Last Ua..iable N~.. : Nu..be.. DE PeCDl'ds I!!l " case :

't,,,,''',*tiIiffli',¡'MWe.e¡

1 9

1

rI

int

... o,. t!/'PO fi ne.

c h4r ~

then pro. s . Ente,. <be a xu:)

Gráfico 3.3 DESCRIPCiÓN DEL DICCIONARIO.

Ganara l adito .. Diction r!l editor Data editor

Exacuta 41n 1 DA~ progr." Cr4phical Dxplorat inn o f data Print a.n IDAftS p .. lntout Sat colou.. . ro .. . dito rs onl!l CoIIIC! Me le to DOS

Copyright (C> 1993 UNESCO. AH

~ights

.... se~u.d.

Gráfico 3.1 MENÚ PRINCIPAL

Con la flecha del cursor seleccione la opción DICTIONARY y luego Enter, en la pantalla se observa :

AY or t,pe f irst eh.r, then E"TER (ESC .eti.e)

I ~i"" Hew dictio .r~ ;4íte •••

I'vil

En la posición First Variable Number se anota el valor 1, para la primera variable . En la siguiente posición Last Variable Number se anota el número de variables que se obtienen de la encuesta (conocido una vez se ha preparado el diccionario); recuerde que a veces una pregunta se puede separar en dos variables. Además se recomienda adicionar una o más variables al total de variables que resulten, ya que puede surgir una variable que quizá no se tuvo en cuenta. En los demás campos se deja por defecto el valor 1. Una vez realizado lo anterior oprima Co nt rol + Enter para aceptar las valores dados.

lo.d.n existing diclion.r, Cene b.ck to pre.i,us ~eou

Gráfico 3.2 CREACiÓN DEL DICCIONARIO

Seleccione CREA TE Yoprima Enter con esta opción se crea un diccionario.

ha

preparado el diccionario).

SC .. ipt61

Con el procedimiento descrito, se ha creado el diccionario. Ahora en la pantalla se puede apreciar el Editor de Diccionario, en el cual se describen las variables ya seleccionadas; a continuación se muestran los elementos que lo conforman :

En la pantalla descriptiva del diccionario :

U.P.T.C. Duitama 1997


9

Captura de datos en IDAM5

7. MD1 ,y MD2 : el primero y segundo código de datos faltantes , (para mayor información revisar en el IDAMS Manual del Usuario, página 6 y 349-352).

BARRA ME NU

8. LABEL corresponde a las categorías de cada una de las variables . 9. CODE : es el código asignado a la respectiva categoría.

Gráfico 3.4 EDITOR DE DICCIONARIO

CURIOSIDADES 1

1. VAR : el número de la variable a través del cual el usuario referencia a la misma.

hace

2. DESCRIPTION : corresponde al nombre de la variable de máximo 24 caracteres, el cual se utiliza como título en todos los listados. 3. LOC : la posición inicial del campo de la variable dentro de cada registro. 4. WDTH : el ancho del campo de la variable. 5. D : el número de cifras decimales dentro del campo. 6. T : el tipo de variable (numérica 0, alfabética 1). Las numéricas se refieren a aquellas variables que contienen números y las variables alfabéticas a las que contienen letras. Para el ejemplo de la encuesta que se está tratando, no se trabajarán variables de tipo abierto como se menciono anteriormente, en este caso la relacionada a las OBSERVACIONES.

Se pueden personalizar los colores de la pantalla de IDAMS de la siguiente manera:

©

Estando en el menú principal, se activa la orden COLOUR, y procede a seleccionar las diferentes opciones para los distintos elementos de la pantalla. En la parte inferior aparecen los movimientos que permiten los cambios.

Finalmente, grabar las modificaciones pulsando ESe donde se muestra la ventana siguiente:

Gráfico 3.5 GRABAR COLORES EN IDAMS,

luego Enter para aceptar.

U.P.T.C. Duitama 1997


10

Captura de datos en IDAMS

amo se mencionó anteriormente vamos a utilizar la encuesta para almacenar los datos en el diccionario que ya se creó. Una vez el usuario se encuentre en la pantalla Editor de Diccionario, se escribirán las variables con sus respectivas categorías, en el orden en que se preparó el diccionario (ver página 4) , para esto hay que seguir las instrucciones siguientes: c:Ir' A LT + E permite llenar el diccionario;

en la pantalla aparecerá titilando el cursor bajo la palabra Var, allí se escribe el valor 1. Para pasar al siguiente campo oprima la tecla Enter (utilice ésta misma orden para avanzar a los demás campos); en el campo Description se escribe el nombre de la primera variable, en este caso CIUDAD; en Loc se anota el valor 1 por ser la posición inicial del campo; en Wdth el ancho del campo es 2 (ver explicación gráfico 4.1); para este ejemplo en el campo siguiente no se trabajará con cifras decimales se dejará en blanco; en T se escribe el valor O, porque el tipo de variable es numérica . Los campos correspondientes a MD1 y MD2 no se llenan porque todos los datos de esa variable se consideran válidos, es decir para el ejemplo no existen datos faltantes, además se sugirió adicionar la categoría de SIN INFORMACIÓN para cuando el encuestado no responde alguna pregunta. Una vez realizado lo anterior se da la orden

Cont rol + Enter para aceptar los valores que se dieron a cada campo, y así completar una línea. c:Ir' Para especificar cuáles fueron las

ciudades en donde se realizó la encuesta, es decir escribir las categorías e identificarlas con su respectivo código, se debe pasar a la segunda ventana con la orden ALT + B, en ella se oprime AL T + E y bajo Code se anota el valor 1; en el campo Label se escribe DUITAMA, luego Control + Enter. c:Ir' Después de esto se da la orden ALT

+ A, ésta permite

introducir otra categoría; en este caso bajo Code el valor 2 y en Label BELEN y posteriormente Control + Enter. Para la siguiente ciudad se escribe ALT + A, bajo Code el valor 3 y en Label BETEl TI VA y luego Control + Enter. De igual forma se escriben el resto de las ciudades empleando las órdenes anteriores, siempre se recomienda llenar un último nivel con la posibilidad de SIN INFORMACIÓN, para aquellas preguntas que no tienen respuesta. Así la pantalla del Editor de Diccionario con la información referente a la primera variable se puede observar de esta forma

U.P. T.C. Duitama 1997


11

Captura de datos en IDAMS

II

2 porque en la segunda ventana. Code tiene máximo dos dígitos

h DT

n

1 CIUDAD

1

2

ttD1

l

para cambiar de ventana y digitar la siguiente variable, en este caso se oprime ALT + A y en Var se escribe 2; en Deseription la variable ÚL TIMO GRADO APROBADO, en Loe se anota el valor 4; en Wdth el ancho del campo es 1 (constan de un dígito los códigos de esta variable); en T se escribe el valor O y nuevamente Control + Enter , para que se acepten los valores que se dieron a cada campo.

"D2

0

Gráfico 4.1 EDITOR DE DICCIONARIO. Almacenamiento del diccionario.

Esto significará que al introducir los datos de la encuesta, en lugar de teclear el nombre de cada ciudad , nos referiremos a ella por su código . Lo anterior se graba con A LT + S y se escribe el nombre del arch ivo como sigue : Fil e: ENCUESTA.D/C, y luego se pulsa Enter. Esto le aparecerá en su pantalla

r:¡r

NOTA: En la segunda variable, bajo Loe el valor es 4 porque el tamaño de la variable anterior es 2 y entre cada variable se deja un espacio y así la segunda variable ocupará el cuarto lugar. Para el resto de las variables el valor de la posición corresponde a la suma de la posición y el ancho del campo de la , variable inmediatamente anterior más dos. ~ ......."",~- .......

Posteriormente se cambia de ventana con ALT + B y luego oprime ALT + E para escribi r en Code el valor 1; en el campo Label se escribe GRADO UNDÉCIMO, luego Control + Enter.

r:¡r Nombre del archivo y la extensión .Dle que hace referencia al dlcclonarfo. I

Fi le :

I

-

-

! r. ~ J:l l( ol~ h~ l .

Ese

.,

iié:;"l l

Después ALT + A para introducir otro nivel; en este caso bajo Code el valor 2 y en Label GRADO DÉCIMO Y posteriormente Control + Enter. Se repiten las órdenes anteriores en el último nivel con la posib ilidad de SIN INFO RMACIÓN.

r:¡r

Gráfico 4.2 GRABAR EL DICCIONARIO

Nuevamente se oprime ALT + B U.P. T.C. Duftama 1997

I


12

Captura de datos en IDAMS

El usuario puede introducir el resto de variables junto con sus categorías en el diccionario siguiendo los pasos descritos atrás. Si usted no terminó de almacenar el diccionario y salió de IDAMS , para retomar nuevamente el trabajo, entre a IDAMS seleccione Dictionary después oprima Enter; luego seleccione la opción Update para llamar un diccionario ya creado y oprima Enter; con las flechas del cursor escoja ENCUESTA.DIC y pulse Enter:

'.U'ílli·'·6'O:·M'@I'mn rC: 'IDRt1S-

~~AW';W·J

3 1

Gráfico 4.4 BARRA DE ÓRDENES

1 ALT + E = Edit: Permite llenar cada uno de los campos del diccionario, como es el caso de escribir el nombre de la variable y los valores respectivos a localización, ancho del campo, tipo de variable , etc.

=

SOCIO.DIC ENCUESTR.DIC

t.

PgUp. 9 • Nau g4 ion ~ey elect: curPently highlited H e s Bl e c t i n <CHRHGE Dr~> w111 A t fo a ne directory . ~. Ente~

Gráfico 4.3 SELECCIÓN DEL DICCIONARIO

De esta forma se presenta el diccionario que se estaba almacenando, para introducir el resto de las variables utilice las órdenes que ya se mencionaron. Para almacenar el Diccionario el usuario tiene la posibilidad de observar las órdenes anteriores en la parte baja de la pantalla del Editor de Diccionario, las cuales sirven en el almacenamiento de cualquier diccionario . Otras órdenes son:

2 AL T + B Change Window: Con esta instrucción se cambia de ventana, únicamente después de la orden Co nt rol + Enter.

=

3 ALT + I Ins Before: Sirve para insertar una variable antes de otra. 4 ESC = Quit: El oprimir esta tecla después de la orden Cont ro l + Enter permite salir de todas las pantallas de IDAMS . Si usted no ha grabado las variables que está almacenando en el diccionario, al dar esta orden aparecerá:

not sauBd for but e r 1 ant o los e c nges?

Gráfico 4.5 MENSAJE PARA GUARDAR CAMBIOS

U.P.T.C. Duitama 1997


13

Captura de datos en IDAMS

Para no perder lo almacenado usted da la orden NO, y luego graba . Si después de grabar presiona la tecla ESC, automáticamente aparece la pantalla anterior (la correspondiente al gráfico 3.2).

..(f Shift Tab: Ir al campo anterior. ..(f Con t rol + Ini c io : Ir al primer campo. ..(f Con t rol + Fin : Ir al último campo. ..(f Control + Enter: Aceptar la línea .

=

5 F10 Menú: Se activa la barra menú, donde se encuentra File y Edit (ubicados en la parte superior de la pantalla Editor de Diccionario).

=

6 F1 Help: Con esta tecla se va al menú de ayuda .

=

7 ALT + S Save: Se emplea para grabar el diccionario que se está almacenando.

..(f Ese: Salir de la línea donde se encuentra el cursor. ..(f ALT + K: Borra todo lo que hay en un campo.

t

I

8 A LT + D = Delete: Se utiliza para borrar una variable o un espacio en blanco, esta solo se puede utilizar cuando en el diccionario se ha dado la orden Control + Enter.

I

2 UI.1 ltO GRADO AP J SEXO .. PREPEIlEHCI A UNO 5 PREPEREMCIA DOS 6 DEDI CACI OH UNO ? DEDICACIOH DOS 8 CURSARlA OTRO CICLO

9 ALT + A = Add After: Cuando se desea adicionar una nueva variable.

CURIOSIDADES 2

Gráfico 4.6 EDITOR DE DICCIONARIO. Diccionario ya almacenado.

Otras órdenes adicionales y el gráfico 4.6 le pueden ser muy útiles . Estas solo se activan una vez se oprime ALT + E, las cuales permiten desplazarse en la línea que se está almacenando. ..(f Enter: Ir un campo hacia adelante. ..(f Tab: Al oprimir esta tecla el cursor va un campo hacia adelante.

Es importante tener en cuenta que NO SE DEBE DEJAR espacios (líneas en blanco) dentro de las ventanas, pues a veces se crean al adicionar una nueva variable; dichos espacios impiden llenar el diccionario que se creó. Siempre hay que verificar lo anterior al realizar cada cambio de ventana .

U.P. T.C. Duitama 1997


14

Captura de datos en IDAMS

~

na vez almacenado el diccionario con todas las variables que presente la encuesta , se graba nuevamente ALT + S, IDAMS le preguntará:

Gráfico 5.1 CONTINUAR GRABANDO EN IDAMS.

Para la primera pregunta usted oprime Ente r; para la segunda selecciona Ves, con lo cual escogió sobreescribir los últimos valores dados a los campos . De esta forma el diccionario está listo para introducir los valores. Ahora usted pulse ESC y asi retorna a la pantalla del Edito r de Diccionario; nuevamente ESC y se encontrará en el Menú Principal; allí seleccione DATA y luego oprima Enter, ahora aparecerá en la pantalla la ventana para seleccionar el diccionario, en este caso ENCUESTA.D/C, y luego oprima Ente r.

Posteriormente se presenta la ventana con el IDAMS DATA EDITOR; para que usted pueda introducir los códigos que dio a las categorías de las variables en la encuesta, debe oprimir ALT + E. Los códigos que se emplean son los que aparecen en la página 6 donde se preparó el diccionario. Así por ejemplo si la encuesta pertenece a la CIUDAD de DUlTAMA (primera variable y primera categoría), escriba el valor 1 y oprima Enter; (después de anotar el valor a cada variable pulse esta tecla para pasar al siguiente campo); si el ÚL TIMO GRADO aprobado fue DÉCIMO escriba 2; y si en la pregunta SEXO no respondieron oprima el valor 3; en la pregunta de PREFERENCIA 1 Y 2, si el número 1 está en TEC. SISTEMAS anote el valor 6 (así está dando el valor a la variable 4, categoría 6, que almacenó en el diccionario) y, si el número 2 está en TEC. EN INFORMÁ TICA DIGITAL, escriba el valor 1 (que corresponde a la variable 5, categoría 1). De igual manera se procede para llenar el resto de variables almacenadas. Una vez terminada la última pregunta de la encuesta se da la orden Co ntrol + Enter para aceptar este registro. Recuerde que un registro es la información que proporciona una encuesta.

Mldij'i,¡ia·i'Wflm1 i ii h

f. l .

sUPo Ps

• N. u

• 'pn

ya

E.. ~e" ee cte e ......... ly h hlited f e sale tin <CHANe DI > wl1 proRpt f o r a new dir o c or .

Gráfico 5.2

Para escribir los valores correspondientes a la segunda encuesta, oprima AL T + A y utilice el mismo procedimiento para anotar el valor de cada variable. Una vez se lleven varios datos introducidos al diccionario, la pantalla se presentará de la forma como sigue a continuación :

SELECCiÓN DEL DICCIONARIO UNA VEZ YA ALMACENADO.

U.P.T.C. Duitama 1997


15

Captura de datos en IDAMS

allí pulse Enter ; se presenta una ventana con cuatro opciones: Case

Ul U2 U3 U4 U5 U6 U? U8

LOS -DATOS SE PUEDEN

8? 111 2

1 2 3

IH lt2 2 I? 11'I 2

It? 8? It? 15 15 8? It? 15

4

5 6 ? 8 9 111 11 12

IH lt2 IH lIS 113 lIS 1M

13

VER COMO UN ARREGLO RECTAN GULAR,

lJ2 2 11'I 2 8.1 2 lt2 2 lt2 2

DONDE LAS FIlAS REPRESENTAN LOS RE6ISTROS y LAS COLUMNAS SON LAS VARIABLES .

2 2 2 2 2

Il 12 2

Gráfico 5.3 INTRODUCCiÓN DE LOS DATOS AL DICCIONARIO.

Code Checking: Revisa que el valor anotado en la variable, corresponda al código que se almacenó en el diccionario. Por ejemplo si en la variable SEXO se anotó el valor 9, IDAMS muestra un mensaje de error, pues el mayor valor para esta variable es 3, el cual corresponde a SIN INFORMACIÓN.

(jf;F

Append Cases: Adiciona automáticamente un nuevo caso, esta opción se utiliza para sustituir la orden ALT + A.

FORMAS RÁPIDAS Para evitar que el usuario esté pulsando la tecla Enter cada vez que quiere introducir un valor a cada campo, y oprimir Co ntrol + Enter para aceptar un caso, IDAMS presenta unas ayudas rápidas así:

Auto skip: Permite ir al campo siguiente en forma automática, este se utiliza para reemplazar la tecla Enter o la tecla Tab.

(jf;F

Zero - FiII : se utiliza para completar con ceros a la izquierda en valores que solo tienen un dígito, dependiendo del tamaño del código; por ejemplo en las variables uno, cuatro y cinco, donde el ancho del campo es dos así:

(jf;F Case

821

81 2 852 8'1 2 IH 1 86 1 liI82 8'11

!!n

1 2 J ]

Z

~

114 115 04 115 111

II? 03 iJJ 11] 116

2 1 1 1 4

~ ~ ~

1 1 2 1 1

~

Gráfico 5.4 FORMAS RÁPIDAS EN LA INTRODUCCiÓN DE LOS DATOS Y VENTANA DE AYUDA.

Antes de introducir cualquier valor al Diccionario, oprima la tecla F10 o después de pulsar Control + Enter la cual lo lleva a la barra Menú, con las flechas del cursor vaya hasta Option y

Gráfico 5.5 EMPLEO DE LA OPCION ZERO - FILL

U.P.T.C. Duitama 1997


16

Captura de datos en IDAMS

El usuario escogerá las opciones que considere más convenientes; para esto utilice las flechas del cursor, así aparece

CURIOSIDADES 3

iluminada la opción donde se encuentre

Hay órdenes que se activan después de

éste, y para activarla se oprime Enter;

oprimir ALT + E, estas son:

después de realizar la elección se pulsa ESC hasta que Option se desactive. De esta manera usted oprime AL T + E y ya puede

continuar

introduciendo

los

valores de las variables. Recuerde que debe grabar continuamente el trabajo, esta orden solo se activa después de haber pulsado Co nt ro l + Ente r; luego oprima AL T + S y la pantalla mostrará:

..

l!lI

Nombre del archivo y la extensión .DA T que hace referencia a los datos

.<JI

F1: Al estar en el campo de cualquier variable y pulsar esta tecla, automáticamente se despliega una ventana donde se muestra el Code y el Label de la misma.

.<JI

ESC: Se utiliza para abandonar un

registro, es decir perder toda la información que proporcione una encuesta.

.<JI

Co ntrol + Enter: registro.

Aceptar un

y después de dar la orden anterior se 01

J

Gráfico 5.6 GRABAR U\ INTRODUCCiÓN DE LOS DATOS.

y escriba el nombre del archivo pero con extensión .DAT luego Enter. Si el usuario no terminó de llenar el diccionario y salió de IDAMS , para retomar nuevamente el trabajo, entre a IDAMS seleccione DATA después oprima Ente r; elija ENCUESTA.DIC (que corresponde al diccionario que se preparó) y pulse Enter. Ahora en la pantalla se muestra el diccionario, para recuperar el trabajo antes realizado se oprime ALT + L.

puede emplear:

.<JI

F2: Para salir temporalmente de IDAMS y ejecutar cualquier otro programa; si desea regresar nuevamente a IDAMS escriba EXIT y oprima Enter.

.<JI

ESC: Para abandonar el IDAMS DATA EDITOR Y regresar al Menú Principal.

.<JI

Además usted puede utilizar todas

las órdenes de CURIOSIDADES 2, para desplazarse en el registro que está almacenando.

U.P .T.C . Duitama 1997


17

Captura de datos en IDAM5

PREPARACiÓN DEL DICCIONARIO PARA EL SEGUNDO TIPO DE PREGUNTAS Como se mencionó en el capítulo 1, una forma alternativa de CAPTURAR LOS DATOS en IDAMS, es utilizando otro tipo de preguntas, que contengan variables del siguiente estilo:

SEXO ESTATURA PESO TALLA PANTALÓN TALLA CAMISA NÚMERO DE CALZADO EDAD En este caso no hay que marcar opciones para cada pregunta, el encuestado tiene la posibilidad de contestar dichas preguntas sin ninguna restricción , escribiendo el valor correspondiente. La preparación del Diccionario se realiza de la siguiente forma: el número de variables dependerá del total de preguntas en la encuesta como ya se mencionó, en este caso se observan seis (6) variables:

1. SEXO : Como en el ejemplo anterior se categorizó, en este caso se utiliza directamente las letras F o M sin necesidad de asignar un código a cada categoría. 2. ESTA TURA : Esta variable se expresa en metros, con dos cifras decimales.

3. PESO : Para esta variable se trabajan las unidades en kilos .

4. TALLA PANTALÓN : El encuestado puede contestar con cualquiera de las tallas existentes.

5. TALLA CAMISA :

Se emplean las letras de las tallas S, M, L o XL .

6. NÚMERO DE CALZADO : Al igual que en la variable cuatro (4), cualquiera de los números existentes.

7. EDAD : En este caso se escribirá el número de años cumplidos. En la selección de las variables anteriores se puede notar que NO HAY NECESIDAD DE ESPECIFICAR simplemente en la CATEGORíAS, INTRODUCCiÓN DE LOS DATOS se escribirá el respectivo valor. Para la CREACiÓN DEL DICCIONARIO se siguen las ordenes que se dieron en el capitulo 3, tenga presente que cuando esté en la pantalla DESCRIPCiÓN DEL (gráfico 3.3), se DICCIONARIO recomendó adicionar una o más variables al total que resulten , ya que puede surgir una variable que no se tuvo en cuenta.

Para ALMACENAR EL DICCIONARIO cuando se encuentre en la pantalla Editor de Diccionario , siga las instrucciones que se dan en el capítulo 4, página 10. El diccionario ya almacenado se muestra de la siguiente manera: I

U.P.T.C.

Duitama 1997


18

Captura de datos en IDAMS

1

2 ESTATUM J

mo

1 TALLA PAKTALON 5 TALLA CllnlSA 6CllLZllDO 1 EDAD

J 9

Los demás campos se llenaron siguiendo las instrucciones del capítulo 4. En esta ocasión el diccionario se almacenó con el nombre MUESTRA.DIC.

lJ

11 21 25

Gráfico 5.7 EDITOR DE DICCIONARIO.

Los datos se introducen tal como se hizo en el ejemplo anterior. Algunos de ellos se pueden observar en la pantalla:

2

J 4 5 6

?

8 9 111 11

En la variable SEXO , el campo correspondiente a T el valor es 1, porque el tipo de variable es alfabética. En la variable ESTATURA, el ancho del campo (w dt h) es 4, porque tiene un número entero, el punto decimal y las dos cifras decimales ; en el campo D se anota el valor dos debido a las dos cifras. Para la variable TALLA CAMISA, en el campo T nuevamente el número 1.

12 lJ 14

Gráfico 5.8 INTRODUCCiÓN DE LOS DATOS AL DICCIONARIO.

El archivo que contiene los valores de estas variables se llama MUESTRA. DA T.

U.P.T.C. Duitama 1997



20

Procesamiento de la Información

LI

I

a sigla SAS viene de Statistlcal Analysis System que traduce - - Sistema de Análisis Estadístico , este es un sistema de computación para análisis de datos, útil para toda clase de ellos: experimentales de las ciencias físicas; datos de la ciencia social ; datos mercantiles; datos agrícolas ; datos mercadotécnicos. No está orientado a ninguna área en particular . El SAS no enseña estadísticas. Aunque SAS es una importante herramienta estadística, la explicación de los conceptos de sus resultados estadísticos no son el propósito de este.

Sistema

de

computación:

Un sistema de computación es un grupo de programas para computadoras que funcionan conjuntamente.

Datos:

Los valores de los datos son letras o números que representan información.

Análisis: Después que la información ha sido recolectada, se está listo para el análisis de los datos, chequeando primero si hay errores en los mismos. Una vez realizado lo anterior, se sigue con el procesamiento de la información que desea de las encuestas . Hay que tener una idea clara de lo que representan los datos; el valor del dato es una medida sencilla , puede representar el sexo, la edad, la talla de una persona , el año escolar , etc. Una

observación es un conjunto de datos para el mismo individuo, lo que en el paquete IDAMS se llamó un registro y corresponde a la información suministrada por una encuesta. También es importante recordar que una variable es un conjunto de valores para la misma medida , por ejemplo las edades, estudios realizados, el sexo etc. Usted le da a cada variable un nombre, el cual usará para describrirle la variable a SAS. El nombre puede contener de uno a ocho caracteres . Puede contener números , pero debe empezar con una letra (por ejemplo V1, V2, V3) . Para entrar en SAS se da la orden C:\CD SAS y luego se oprime la tecla Enter; después se da nuevamente la orden SAS y se oprime Enter si se trabaja en modo DOS, o activando el icono respectivo bajo WINDOWS. Después de realizar la instrucción anterior, aparecerán en la pantalla de su ordenador tres ventanas, a través de las cuales se trabajan los programas así: La primera llamada PROGRAM EDITOR ,

Gráfico 6.1 TRES VENTANAS QUE APARECEN AL ENTRAR ASAS.

U.P.T.C. Duitama 1997


21

Procesamiento de fa Información

la cual le permite al usuario digitar los programas que utilizará para procesar la información de las encuestas o la base de datos que tenga. La segunda es LOG de lógica. En esta aparecen en secuencia las órdenes digitadas en el PROGRAM EDITOR ; el usuario tiene la facilidad de corregir el programa si cometió algún error, pues ella mostrará todos los posibles errores que se pudieron llevar a cabo durante la ejecución del programa, estos aparecerán subrayados.

y la tercera ventana es la llamada OUTPUT , esta presenta todos resultados después de correr programas, es decir muestra información ya procesada.

los los la

Para poder trabajar en estas ventanas es necesario conocer la utilidad de ciertas teclas como estas: F1: muestra la ventana de ayuda, la cual presenta las palabras que se pueden emplear en los diferentes procedimientos; si desea conocer más sobre cualquier procedimiento se escribe el nombre de éste en la línea comando y Enter.

r::¡j=>

F2: Abre la ventana que contiene teclas de ayuda y formas rápidas para trabajar en SAS .

r::¡j=>

F3: con ella se desplaza el usuario a la ventana LOG .

CiT"

F4: permite desplazarse a la ventana OUTPUT .

r::¡j=>

F5: con esta tecla el usuario puede transitar a través de las ventanas abiertas.

r::¡j=>

F6: permite desplazarse a la ventana PROGRAM EDITOR. F7: amplía la ventana donde está ubicado el cursor.

r::¡j=>

F8: línea.

r::¡j=>

se emplea para borrar una

SHIFT + F8: con esta orden el cursor se desplaza una pantalla a la derecha.

r::¡j=>

SHIFT + F9: renglón el texto.

r::¡j=>

SHIFT + F10: por renglón.

r::¡j=>

sube renglón por

baja el texto renglón

F9: recupera en la ventana de PROGRAM EDITOR el programa que se está ejecutando.

r::¡j=>

F10: corre el programa que se digitó en la ventana PROGRAM EDITOR , además permite cerrar las demás ventanas que estén abiertas, excepto las ventanas LOG y OUTPUT .

r::¡j=>

Es importante saber grabar un archivo en SAS . Para esto usted necesita conocer que hay tres tipos de archivos: aquellos donde se graban las instrucciones de los programas que se van a ejecutar; otros donde se guarda la información ya procesada, y los que guarda U.P.T.C. Duitama 1997


22

Procesamiento de la Informaci6n

automáticamente el SAS . El nombre de cada archivo debe constar máximo de ocho caracteres.

Archivos que contienen los programas: Todos estos se sugieren guardar con la extensión .PRG; para poder grabar los programas el cursor debe estar en la ventana PROGRAM EDITOR , pulse la tecla inicio (para ir a la línea de comando) y escriba la orden: FILE '[ Nombre del archivo.PRG]', luego oprima Enter. En lo posible el nombre del archivo debe describir el trabajo que se está realizando. Esta orden también sirve para grabar los programas en un disquete así: FILE ' Nombre de la unidad : Nombre del archivo.PRG' .

Archivos que contienen los resultados : Es decir la información ya procesada; para grabar dichos resultados, el cursor debe estar ubicado en la pantalla OUTPUT , luego se pulsa la tecla inicio y se escribe la orden anterior, solo que en ésta se sugiere la extensión .RES y luego oprimir Enter. Así .RES hace referencia a los resultados. Al igual que en el caso anterior usted puede grabar dichos resultados en el disquete, empleando la misma orden.

grabar el diccionario ALMACENADO en IDAMS, junto con el DATA conservando cada uno su Extensión. De aquí en adelante se trabajarán todos los programas de SAS para procesar la información desde este directorio. Se

puede

guardar

el

archivo

que

contiene los resultados sin necesidad de grabar previamente el archivo con los programas. Si usted desea recuperar un programa, la información ya procesada o una base de datos, primero debe ubicar el cursor en la ventana PROGRAM EDITOR , después oprimir la tecla inicio para ir a la línea de comando (command) y luego utilizar la orden: INC '

e :Nombre del archivo.Extensión ,

y luego Enter. Si se desea salir temporalmente del SAS para ejecutar algún otro programa, el cursor

debe

estar

en

la

ventana

PROGRAM EDITOR, en la línea de comando se escribe la letra X y después se

pulsa

Ente r.

Si

se

salió

temporalmente del SAS y se desea regresar se escribe la palabra EXIT y luego se oprime Enter.

Crear un directorio de archivos : Es recomendable crear dentro de SAS un Archivos, que directorio llamado contendrá los archivos de datos y los programas que contienen las instrucciones a ejecutar en el procesamiento de la información. Dentro de este directorio conviene entonces

Toda tarea de SAS está formada por declaraciones; las declaraciones le piden a SAS que ejecute algunas actividades. La primera palabra de una declaración le indica a SAS cuál

actividad se está

interesado en ejecutar (por ejemplo crear U.P.T.C. Duitama 1997


23

Procesamiento de la Información

un archivo de datos SAS, imprimir una linea de datos), en el resto de la declaración se da más información sobre la forma como se desea que la actividad

efe

se ejecute (qué nombre darle al archivo de datos, cómo ordenar la línea que desea imprimir). Cada declaración se finaliza con PUNTO Y COMA. El primer paso a seguir en cualquier tarea de SAS es la creación de un archivo de datos , el cual se entiende como una colección de datos formada de varias observaciones, cada una incluyendo muchas variables, también se le conoce como conjuntos de datos. Para esto se dispone de las siguientes declaraciones:

efe DATA:

Esta declaración comienza con la palabra DATA, le indica a SAS que origine un nuevo archivo de datos; después se escribe el nombre que se ha escogido para el archivo que se está creando ; puede seleccionar el nombre que desee para su archivo mientras que este SEA MÁXIMO DE OCHO CARACTERES, además debe empezar con una letra; es más fácil de entender si selecciona un nombre que describa el archivo de datos . Esta declaración tiene la forma: DATA Nombre del archivo ;

Después

de

ésta

y

todas

INPUT : Usualmente sigue a la declaración DATA, le indica a SAS cómo están ordenados los valores de los datos y cuáles son los nombres de las variables. Se escribe primero INPUT y luego se eligen los nombres de las variables, las cuales deben iniciar con letras y NO DEBEN tener más de ocho caracteres y tampoco incluir puntos, comas o guiones. Si los valores contiene letras , la variable es alfabética y se escribe el signo pesos ($) después del nombre de la variable (por ejemplo el nombre de las personas, o una letra que puede significar el género al que pertenece una persona como F o M). Escriba los nombres de las variables dejando un espacio entre ellas, y al final el símbolo arroba (@), este símbolo permite al usuario determinar el tamaño de cada variable cuando esté introduciendo los valores de dichas variables . La forma de esta declaración es: INPUT Nombre de las variables ;

efe

CAROS : Esta es la última declaración en el procedimiento de creación de un archivo, indica que los datos siguen inmediatamente. Los datos tienen un máximo de longitud de 80 columnas. Solamente una declaración CAROS puede ser usada con una declaración DATA. La forma que tiene es:

las

declaraciones al final de línea SIEMPRE SE ESCRIBE PUNTO Y COMA.

CAROS; Línea de datos

U.P.T.C. Duitama 1997


24

Procesamiento de la Información

Con estas declaraciones ya se está listo para crear el archivo de datos. A las declaraciones DATA , INPUT Y CAROS

se

les

conoce

con

el

nombre de paso DATA. Para lograr observar los valores de los datos, el nombre de las variables y en general cuántas observaciones se tienen, se utiliza la declaración PROC PRINT y posteriormente la declaración RUN .

PROCEDIMIENTOS EN SAS

Gráfico 6.2 ELEMENTOS QUE CONFORMAN UN PASO PROC.

Una vez se haya creado un archivo de datos , estará listo para usar los procedim ientos que analizan o procesan los archivos. Los procedimientos son programas que leen el archivo de datos, ejecutan varias operaciones e imprimen sus resultados. Las declaraciones que le indican a SAS que procese un archivo de

Los procedimientos que se van a utilizar en este manual son :

+

El primer paso a seguir después de colocar los datos PROC PRINT :

datos forman un paso PROC .

en un archivo de SAS es su impresión. De esta manera se puede

Los pasos DATA y PROC toman su nombre de las declaraciones DATA y PROC (la forma abreviada de escribir PROCEDURE = PROCEDIMIENTO), las cuales inician los pasos.

verificar si los datos fueron leídos

El paso PROC siempre comienza con la declaración PROC , indicando el nombre del

procedimiento

a

ejecutar.

correctamente y a la vez chequear si hay

errores .

SAS

imprime

los

resultados a manera de un informe. Esta declaración permite la reorganización de los valores de los datos, cuando no requiera una prueba estadística.

Los

elementos que lo conforman son: el

Después de usar un paso DATA para

nombre del procedimiento, las opciones y

colocar sus valores dentro de un archivo

finalmente las utilidades si se requieren.

de datos, puede imprimir los valores de los datos en una forma fácil de leer con

Estos elementos se pueden observar en

la declaración

la ventana de ayuda, así: PROC PRINT; . U.P.T.C. Duitama 1997


25

Procesamiento de la Información

El uso de la declaración escrita del modo

orden, para lo cual se trabaja con la

anterior, imprime el archivo de datos

utilidad VAR del modo siguiente:

creado recientemente. Cada

procedimiento

tiene

múltiples

opciones y utilidades.

A manera de

ejemplo,

las

obsérvense

continuación

se

PROC PRINT; VAR Nombre de las variables ;

que

a

con

el

presentan

Esta declaración se puede combinar con otros procedimientos como se ilustrará más adelante.

procedimiento PRINT :

+ Si desea imprimir otro archivo de datos, se puede emplear la opción DATA= y a continuación el nombre del archivo, así:

PROC PRINT DATA=Nombre del archivo ; Esta declaración tiene la utilidad de colocar hasta 10 títulos en las páginas de su informe. Por ejemplo:

PROC PRINT ; TITLE ' Título del informe • ; También se pueden usar varios títulos aplicando el siguiente formato:

PROC PRINT; TITLE ' primer título • ; TITLE5 ' tercer título ' ; el

formato

aparecerán

anterior

los

respectivamente

Clasificar es reordenar las observaciones en el archivo de datos en una forma determinada. Para clasificar los datos, se utiliza la declaración PROC SORT seguida de la utilidad BY que indique las variables a ser clasificadas, como se muestra en el formato:

PROC SORT DATA=Nombre del archivo ; BY Variables a clasificar ;

TITLE3 ' segundo título • ;

Con

PROC SORT : El orden de las observaciones de datos no es tan importante para ciertos procedimientos estadísticos, como es el caso del promedio. Sin embargo, en algunas ocasiones se desea clasificar las observaciones en un orden específico, por ejemplo, para el estudio de edad - peso, obtener primero la información de las mujeres y luego la información sobre los hombres.

títulos en

la

Con ello SAS reorganiza el archivo en el orden de las variables indicadas en la

primera, tercera y quinta línea.

utilidad

Hasta el momento, con esta declaración

reorganizado en el mismo lugar y con el

se han impreso las variables en el mismo

mismo nombre de donde fue leído.

orden en que estaban originalmente en el

versión

archivo de datos ;

pero se pueden

BY ,

no

y

escribe

clasificada

el

del

archivo La

archivo

desaparece.

seleccionar para que aparezcan en cierto U.P.T.C. Duitama 1997


26

Procesamiento de 18 Información

Para no alterar la versión original no clasificada, se acude a la opción

OUT=

en la declaración PROC SORT , creando de esta manera un archivo con la versión clasificada. De la siguiente forma:

Usted también puede obtener la frecuencia para las variables que sean de su mayor interés . Para esto indique los nombres de las variables después de la utilidad TABLES, si por ejemplo se tienen las variables V1, V2 y V3 la orden queda de la siguiente manera:

PROC SORT DATA= Nombre del archivo de datos original OUT=Nom bre del nuevo archivo ; BY Variables a clasificar ; PROC SORT no imprime ningún procedimiento de salida, aunque imprime un informe en el registro permanente de SAS, indicando cuánta memoria y tiempo es usado y cuántas observaciones contiene el archivo de datos clasificado.

+

PROC FREQ : Esta declaración se emplea para obtener las frecuencias de las variables . Las tablas de frecuencias muestran la distribución de los valores de una variable; se puede apreciar cuántas observaciones

PROC FREQ; TABLES V1 V3 ; Se pueden separar los datos aún más con tablas de tabulación cruzada, las cuales muestran la distribución de los valores para dos o más variables ; para obtener una tabla de tabulación cruzada , se emplea la declaración PROC FREQ seguida de la utilidad TABLES, se indica primero la variable que desea en el lado inferior de la tabla, luego un asterisco (*) y después la variables que desea en la parte superior, por ejemplo si se quiere una tabla con las variables V1 y V2 la orden se escribe : PROC FREQ; TABLES V1*V2 ;

en el archivo de datos contienen un valor asignado . Para obtener tablas de frecuencias para todas las variables en el archivo de datos de más reciente creación, se usa simplemente una declaración así:

Puede pedir tantas tablas como desee en una sola utilidad TABLES , si usted tiene las variables V1, V2, V3, V4, V5 y V6 puede escribir PROC FREQ; TABLES V1*V4 V2*V5 V3*V6 ;

PROC FREQ; Si desea usar otro archivo de datos, use la opción

DATA=

en la declaración

PROC FREQ de la siguiente forma PROC FREQ DATA= Nom bre del archivo de datos;

para producir de esta manera tres tablas de tabulación cruzada. Para

tabular

cruzada mente

tres

variables , se conectan los tres nombres de las variables con asteriscos :

U.P.T.C. Duitama 1997


27

Procesamiento de la Información

PROC FREQ; TABLES V1*V4*V5 ;

previamente clasificados; por lo tanto usted necesitará usar antes PROC SORT :

Significa que se elabora una tabla de dos entradas: de la segunda y tercera variable, para cada categoría de la primera variable.

PROC SORT DATA= Nom bre del archivo de datos ; BY Nombre de la variable a clasificar; PROC MEANS; BY nuevamente el nombre de la variable a clasificar ; VAR Nombre de otra variable a comparar ;

4ft PROC

MEANS: Se utiliza para computar la media ó promedio, incluyendo el número de observaciones, el mínimo y el máximo, la media y la desviación estándar. Para obtener estadísticas para todas las variables en el último archivo de datos creado, se usa: PROC MEANS;

Si lo que se quiere es obtener estadísticas para otro archivo de datos, se emplea la opción DATA= como sigue:

Se puede separar los subgrupos aún más usando dos o más variables en la declaración BY, habiéndolas ordenado todas en esa misma forma.

.y. RUN:

Con esta declaración se corre el programa para que aparezcan los datos en la ventana OUTPUT.

PROC MEANS DATA= Nom bre del archivo de datos ; De igual forma permite obtener los promedios de algunas variables específicas dependiendo de la necesidad del usuario, para esto se emplea la utilidad VAR y enseguida el nombre de las variables a las cuales usted desea hallar el promedio, por ejemplo si se tienen las variables V1, V2 y V3 entonces la orden será:

PROC MEANS; VAR V2 V3 ; Si se desea procesar los datos en subconjuntos, se recurre a la utilidad BY , siempre y cuando los datos estén

Una forma de crear un archivo permanente en SAS es utilizando la declaración L1BNAME. Veamos en que consiste:

4ft

L1BNAME: La declaración L1BNAME define un camino, que contiene usualmente un directorio para ser usado en SAS . Si usted quiere crear un archivo permanente en SAS, debe definir el camino para ser utilizado en una declaración L1BNAME.

La declaración L1BNAME evita que en la pantalla PROGRAM EDITOR aparezcan U.P.T.C. Duitama 1997


28

Procesamiento de la Información

todos los datos en la ejecución del programa. Es de gran utilidad porque en la mayoría de los casos el volumen de datos es muy grande. El uso de la declaración L1BNAME junto con un procedimiento DATA, crea archivos de datos en SAS .

Tales archivos los guarda automáticamente el SAS en el directorio que se definió, con extensión SSO. Con esta declaración no hay necesidad de guardar las instrucciones para crear el archivo de datos con la orden FILE.

U.P.T.C. Duitama 1997


29

Procesamiento de la Información

De aquí en adelante se emplearán colores diferentes para las ventanas del 5A5. Si usted desea cambiar el color a alas ventanas, vea (Página 31).

CURIOSIDADES 1

ocurrió presentando mensajes subrayados y en otro color. Una vez culminado correctamente el programa, puede verificar en la ventana OUTPUT el total de datos de su archivo dataset elaborado en IDAM5. La pantalla mostrará

Ahora vamos a dar las instrucciones para procesar la información. Lo primero que debe realizarse en cualquier tarea del 5A5 es llevar a cabo la ejecución del programa que origina un nuevo archivo de datos, para la creación de este archivo se emplea el paso DATA .

2'13 1l"M

~

2.71

211

R?'1

al

2 282 21 %1

Para esto entre a 5A5, luego oprima Enter para ir a la primera línea y después digite el siguiente programa:

Gráfico 6.4 RESULTADOS QUE PERMITEN OBSERVAR LAS VARIABLES Y SUS DATOS.

j'kOGRAtl h1JI fOR

Después de CAROS. se escribe en la líne a com ando la orden INC' '. Con esto se recu peran los datos almacenados para su procesamiento. 221!l1 1 2 01 1 2 01

0b 08

121 1 3 1 1 2 1

2 2

12 12

1 1

~ ~

1 2

nM~

12 12

~

2 4

i

En este caso los datos estan recortados, para lograr ver la parte final del programa.

1 1

Gráfico 6.3 PROGRAMA PARA CREAR UN ARCHIVO DE DATOS.

Oprima la tecla F10 para correr el programa. Ahora pulse la tecla F3 para ir a la ventana LOG y F7 para ampliarla; al revisar su contenido usted puede chequear si se cometió algún error durante la ejecución del programa.

En este caso aparece una columna para enumerar las observaciones y en las columnas restantes el nombre para cada variable junto con los datos. En PROGRAM EDITOR pulse inicio y grabe el programa con extensión .PRG; como se recomendó en un

comienzo .

IIIL...

r-pROGRAM EDITOR:========== 11 FILE'C:\SAS\ARCHIUOS\TOTAL.PRG'

El programa le indicará qué tipo de error Gráfico 6.5 GRABAR UN PROGRAMA EN SAS.

U.P.T.C. Duitama 1997


30

Procesamiento de la Información

Con el fin de ahorrar tiempo se puede ,n'

evitar seguir la ruta indicada en el gráfico, trabajando directamente en el directorio

Archivos

de

la

siguiente

manera:

lU I

0001 lIBHAME PAZ 'C:\SAS\ARCHIUOS\'; 0002 0003 PRIC SORT DATA=PAZ.EHCUESTA OUT=PAZ.ClASE; ¡ 000,. BY SEXO; , 0005 I ; 0006 PROC PRIHT DATA=PAZ.ClASE; ! 0007 BY SEXO; ' 00000

,:

l ií ÍJ o o ~ RUH;

En PROGRAM EDITOR pulse inicio,

W!lI"

~

Escriba X y salga temporalmente, Entre al directorio Archivos,

Gráfico 6.6

Con EXIT retorne a SAS.

PROGRAMA PARA CLASIFICAR VARIABLES.

escribir

el

En la ventana OUTPUT los resultados

grabar

y

muestran la clasificación de las variables,

recuperar. Optaremos por emplear este

teniendo en cuenta primero a las mujeres

mecanismo en lo que resta del trabajo.

y luego a los hombres, así:

Así

en

nombre

adelante del

bastará

archivo

para

Como el archivo de datos incluye varios grupos diferentes, usted puede imprimir un listado por separado para cada grupo. Por ejemplo imprimir primero los datos para las mujeres y luego

para

los

hombres, empleando la orden: PROC PRINT; BY SEXO; Recuerde que antes de poder usar la utilidad

BY

(con

PROC

PRINT

o

cualquier otro procedimiento SAS ), el archivo de datos debe estar previamente clasificado de acuerdo con las variables especificadas en la utilidad BY (es decir, separar las categorías que conforman la variable).

Para

esto

necesita

I

una

declaración PROC SORT antes de la

Gráfico 6.7 RESULTADOS DE LA CLASIFICACiÓN DE VARIABLES

declaración PROC PRINT; puede así ejecutar éste programa:

U.P.T.C. Duitama 1997


31

Procesamiento de la InformacIón

CURIOSIDADES 1

• •

Para modificar los colores en cada una de las ventanas, el usuario puede basarse en las siguientes instrucciones, para esto debe ubicar el cursor en la línea de comando y escribir:

TITLE: Títulos en OUTPUT . SOURCE: Números y declaraciones en LOG. NUMBERS:

Números

en

PROGRAM EDITOR.

Estos son los colores disponibles del programa :

COLOR Área Color Las áreas que permiten cambiar el color en todas las ventanas:

BACKGROUND: ventana.

BANNER: comando .

BORDER: La línea de borde y nombre de la ventana.

Fondo

de

la

Encabezado y línea de

COMMAND: Línea donde se graban y recuperan programas .

BLACK, -BLUE , BROWN - -CYAN , GRAY GREEN , MAGENTA, RED, , WHITE. Al elegir el color se escribirá la letra que aparece resaltada. Para que los colores elegidos permanezcan en SAS , ubique el cursor en la línea comando de cada ventana, escriba WSAVE y pulse Enter.

• MESSAGE: Línea de mensaje .

Las áreas que permiten cambiar el color en una ventana específica:

• DATA: Líneas de los datos en

OUTPUT . •

FOOTNOTES : Notas de pie de página en OUTPUT. HEADER:

Encabezados en

OUTPUT . •

TEXT:

Áreas de texto en

PROGRAM EDITOR.

Gráfico 6.8 PANTALLAS DE DIFERENTE COLOR PARA SAS.

U.P.T.C. Duitama 1997


32

Procesamiento de la Información

Existe una declaración que permite hallar este y otros procedimientos de una forma más breve, sin necesidad de traer siempre a la ventana PROGRAM EDITOR el archivo de datos.

na vez se tiene el DATA en este caso ENCUESTA, se puede hallar la frecuencia de cada variable . Para esto se adiciona al programa anterior la declaración PROC FREO , ésta puede escribirse después de PROC PRINT; como se indica en la ventana

U

Para esto se emplea la declaración L1BNAME, con la cual se crea un archivo de datos permanente en SAS y para esto hay que definir antes el directorio que va a ser usado con esta declaración. Como se indicó en un comienzo , el directorio con el cual se va a trabajar se llama Archivos; el programa que usted debe utilizar es :

o OB1 LIBHAME PAZ 'C:\SAS\ARCHIUOS\';

DI 12

1

Gráfico 7.1 PROGRAMA PARA OBTENER FRECUENCIAS PARA CADA VARIABLE .

Pulse F10 para correr el programa y obtener los resultados así:

01013 08 14 000 5 080 6 01 17 00 18 00019 0001 00011 00012 00013 002'0 00291 00292 002n 00294 00295 00296

DATA PAZ.ENCUESTA; INPUT CIUDAB GRADO SEXO PIEFER1 PREFER2 IEDICl DEDIC2 OUTPUT; CARIS; 1 2 2 1 1 2 1 1 2 1 1 1 1 2 1 1 1 2 1 2 1 1 2 2 ;

Bl 11 11 al 11 al 12 12

06 06 08 16 16 05 12 12

1 1 1 1 1 2 1 1

2 3 2 3 3 3 2 4

EL p~ rME ~ ?ROGR....-i1A DEBE 1.NCLU1.J? TODOS 05 OA7"OS. PA~A QUE' 5",5 LOS UA~D E ,""UTOMÁT 1.a-MEN T E CON E )(.T ~N5rÓN

.550 .

PRDC PRINT; RUN;

Gráfico 7.3 PROGRAMA PARA CREAR UN ARCHIVO DE DATOS PERMANENTE CON EL USO DE LA DECLARACiÓN L1BNAME.

En la primera línea se escribe la declaración L1BNAME seguida de un nombre para asociarlo con el directorio y la ruta donde se encontrará el archivo de datos . La segunda línea del programa contiene DATA TAREA.ENCUESTA; el DATA está conformado por dos partes, TAREA (llamado nombre de primer nivel) Gráfico 7.2 RESULTADOS DE LAS FRECUENCIAS PARA CADA VARIABLE.

U.P.T.C. Duitama 1997


33

Procesamiento de la Información

que hace referencia a la librería y ENCUESTA (nombre de segundo nivel) que identifica el archivo de datos.

programa que contiene todos los datos (gráfico 7.1).

También se escriben las declaraciones que acompañan a un paso DATA , como son: DATA , INPUT, CARDS , y las declaraciones PROC PRINT y RUN que permiten la aparición de los datos con sus respectivas variables en la ventana OUTPUT .

CURIOSIDADES 2 PROGRAI1 EDI OH=. and === 00001

p~

CUIlS~

AQ.V\

o!J

Como el archivo contiene todas las variables junto con los datos, al oprimir F10, SAS guarda automáticamente el archivo de datos ENCUESTA, colocándole extensión .SSO, sin necesidad de emplear la orden FILE para guardarlo. Si usted sale temporalmente de SAS puede verificar la extensión del archivo de datos.

FRECUENCIAS Y MEDIAS, FORMA CORTA De igual forma, se pueden hallar las frecuencias y las medias para cada variable utilizando la declaración L1BNAME. Solo necesitará el siguiente programa :

00006

Gráfico 7.5 AYUDA.

En la ventana de PROGRAM EDITOR ubicando el cursor sobre los números,

usted puede emplear cualquiera de las órdenes siguientes:

.(f 1#: Inserta el número de lineas que el usuario requiera , para esto en el símbolo # anote el valor específico y Enter.

.(f lA: 0901 LIBNA"E TAREA 'C='SAS'ARCHIUOS"; PROC FREQ DATA=TAREA.ENCUESTA;

Permite insertar una línea después de otra. Colocar lA y luego Enter. También puede emplear IA#.

B91!l2 8'1903

0004 '1985 8liI86

PROC "ERNS DRTA=TARER.ENCUESTA;

001rl

0908 RUN;

.(f lB: Insertar una línea antes de otra. Colocar la orden lB y luego Enter. De igual forma se puede emplear IB#.

.(f DD: Gráfico 7.4 PROGRAMA PARA OBTENER LA MEDIA Y LA FRECUENCIA EMPLEANDO LA DECLARACiÓN L1BNAME.

Se emplea para borrar un bloque. Escribe DD al comienzo y al final del bloque; luego Enter.

.(f Los resultados que obtiene para el programa de encontrar las frecuencias, son iguales a aquellos donde se utilizó el

CC: Sirve para copiar un bloque,

para esto escriba CC al comienzo y al final del bloque; luego se ubica el cursor en el lugar donde se desea

U.P.T.C. Duitama 1997


34

Procesamiento de la Información

copiar, se escribe la letra 8 y después Enter.

,(f

MM:

bloque,

Se utiliza para mover un para esto escriba

MM al

comienzo y al final del bloque. Ubique cursor sobre la línea de números que desee desplazarse y escriba la letra O, luego Enter.

1, lA o 18 y Enter. Esta instrucción se conserva activa mientras no finalice su 8A8 . Si desea sesión de desactivarla, escriba nuevamente sobre la línea de números MA8K y Enter, así le aparecerá el contenido, luego presione FIN. Tenga presente que cuando quiera desactivar esta orden , no se encuentre otro MA8K en la pantalla, de lo contrario no permitirá desactivarla.

,(f RR: Cuando se está interesado no en mover un bloque sino en repetirlo, escriba al inicio del bloque RR y al final del bloque RR# ; en el símbolo # anote el número de veces que desea repetir el bloque, después Enter.

,(f MA8K: En algunas ocasiones hay líneas que se repiten con frecuencia,

Las órdenes anteriores deben estar contenidas en su totalidad dentro de los números . Otras órdenes que le pueden ser útiles al oprimir las teclas siguientes :

<?

INICIO: El cursor se ubica en la línea de comando (Command) .

como es el caso de :

,(f FIN: Borra todo el contenido de la L1BNAME TAREA

-c :\SAS\ARCHIVOS\' ;

para evitar escribir siempre esta línea, usted escriba

puede guardarla , para esto MA8K sobre

la línea de

línea a la derecha donde se encuentre el cursor.

<?

ENTER: Al estar en cualquier ventana, permite desplazarse línea por línea hacia abajo.

números, Enter y luego el contenido: Existen órdenes que puede emplear en cualquier ventana en la línea de comando :

<? TOP : Se emplea para ubicar el cursor en la primera línea. Gráfico 7.6 USO DE LA ORDEN MASK.

Para que aparezca dicho contenido , cada vez que lo necesite , puede escribir cualquiera de estas opciones

<? 80T:

Se emplea para ubicar el cursor en la última línea del programa.

<?

END: Se emplea para cerrar las ventanas que estén abiertas.

U.P.T.C. Duitama 1997


35

Procesamiento de la Información

La forma en que se muestran los resultados, es de acuerdo al orden en que se almacenaron las variables y sus respectivas categorías en el IDAMS , pero se pueden ordenar las frecuencias, los porcentajes y las medias de manera descendente. Así solo necesitará emplear este programa:

COMPARACiÓN DE VARIABLES Muchas veces surge la necesidad de comparar las variables que se tienen en la encuesta y conocer a la vez el porcentaje. Para esto el SAS ofrece las declaraciones siguientes: PROC SORT , PROC FREQ y la utilidad TABLES. Se puede pensar que el usuario está interesado en conocer el porcentaje más alto de las personas que desean estudiar en la jornada diurna, cuál carrera tiene mayor preferencia, teniendo en cuenta el sexo y el último grado aprobado. Para esto utilice el siguiente programa:

80081 LIBNA"E TAREA 'C:'SAS'ARCHIUOS"; 88992 9i13

80001 PROC SORT

Gráfico 7.7 PROGRAMA PARA OBTENER VARIABLES ORDENÁNDOLAS POR SU FRECUENCIA

Los resultados que muestra SAS permiten identificar más rápidamente la variable que tiene el valor más alto, por ejemplo:

005 BY DE»1 ci ; 99096

DATA~TAREA.ENCUESTA

OUT~TAREA.ORDEN;

liI90li1? PROC FREQ DATA=TAREA.ORDEN; 9BO TABLES SEKO GRADO PREFER1; 80989 BY DED 1ci ; 80019 08011 RUN; 00012

Gráfico 7.9 PROGRAMA PARA COMPARAR TODAS LAS CATEGORIAS DE LAS VARIABLES.

Con el programa anterior usted puede comparar todas las categorías de la variable DEDIC1 (Diurno, Nocturno, Semipresencial, Sin Información) con las variables SEXO, ÚLTIMO GRADO Y PREFERENC~

APROBADO UNO, cada una de ellas con sus respectivas categorías.

Gráfico7.8 RESULTADOS DE FRECUENCIAS ORDENADAS.

Además debe recordar que el programa anterior solo puede ejecutarse una vez se ha grabado el archivos de datos DATA ; para el ejemplo este corresponde a TAREA.ENCUESTA. La ventana OUTPUT mostrará los resultados de la siguiente forma U.P. T.e. Duitama 1997


36

Procesamiento de la Información

00081 00002 000113 00004 00085 00006 00007 00008 00089 00018 00011

LIBNAHE TAREA 'C:'SAS'ARCHIUOS"; PROC SORT DATA ~TAREA.ENCUESTA OUT =TAREA.ORDEN; BY DEDIC1; PROC FREQ DATA =TAREA.ORDEN ORDER=FREQ; TABLES SEXO GRADO PREFER1; BY DEDIC1; RUN;

Gráfico 7.11 PROGRAMA PARA COMPARAR TODA S LAS CATEGORiAS DE LAS VARIABLE S ORDENANDÓLAS EN FORMA DESCENDENT E.

Gráfico 7.10 RESULTADO S DE COMPARACiÓN DE VARIABLES .

Los resultados indican que en la jornada diurna desean estudiar 144 hombres, es decir el 72%; el 28% restante corresponde a mujeres. Del grado décimo 161 estudiantes que equivalen al 80.5% y 33 estudiantes del grado undécimo que representan un 16.5%. La carrera que tiene más aceptación como primera opción es TECNOLOGíA EN INFORMÁTICA DIGITAL con el 25.5%; le siguen en su orden TECNOLOGíA EN SISTEMAS con 49 personas, lo cual equivale al 24.5% después TECNOLOGíA EN CONSTRUCCIONES CIVILES con el 11.5%.

Si usted desea realizar más comparaciones, emplee las mismas declaraciones con las variables que le interesan . Debe tener presente que el DATA que acompaña a la declaración PROC SORT es aquel que contiene todos los datos, éste es fijo.

Esta declaración ORDER=FREQ , siempre se escribe en la línea donde esté ubicada la declaración PROC FREQ . Los resultados del programa mencionado antes se observarán de la siguiente manera

_10 l!XO

2 I

2

3

t

y

144 "6

ES MAs

FAaL ENCONTRAR a PORCENTAJE y LA FRECUENCIAMAs ALTA. SI SE PRESENTAN DE ESTA FORMA LOS RESULTADOS.

Gráfico 7.12 RESULTADOS ORDENADOS DE MAYOR A MENOR DE LA COMPARACiÓN DE VARIABLE S

Una forma más cómoda para leer los resultados anteriores , se logra con la declaración ORDER=FREQ, la cual presenta las variables ordenadas por su frecuencias, así:

En los gráficos de los resultados solo se muestra la frecuencia y el porcentaje, pero también aparecen otras dos columnas, la de Frecuencia Acumulada y Porcentaje Acumulado .

U.P.T.e. Duitama 1997

72.8 28.8


37

Procesamiento de la Información

Usted puede emplear una tabla de tabulación cruzada con tres variables o más , dando los nombres de las variables separados por asteriscos, así:

Otra forma fácil de encontrar las frecuencias en un archivo de datos es utilizar una tabla de tabulación cruzada. Para esto puede ayudarse del programa como sigue:

08a 1

LIBNA~E TAREA 'C:'SAS'ARCHIUOS"; 08802 08803 PROC PREQ DATA=TAREA.ENCUESTA ORDER~PREQ; 0890 4 TABLES SEKO*PREFER1*CICLO; 08905

0800 6

09907 RUN; 00008

Gráfico7.15 PROGRAMA PARA OBTENER TABLA DE TABULACiÓN CRUZADA CON TRES VARIABLES

Gráfico 7.13 PROGRAMA PARA OBTENER LAS TABLAS DE TABULACiÓN CRUZADA, EMPLEANDO LA DECLARACiÓN LlBNAME

y la información se observará así: De nuevo emplee la declaración PROC FREQ , después el nombre del archivo y de igual forma que en los programas anteriores, se pueden ordenar las variables por su frecuencia, haciendo uso de la opción ORDER=FREQ. En seguida se escribe la utilidad TABLES, indicando primero la variable que desea en el lado inferior de la tabla, luego (*) y la variable que desea en la parte superior. Después de correr el programa los resultados se muestran así:

elc o

p

4:

- -- - - - - -<. -...' - -+ - - - - \ . . . - - - -+

To

1

45

:

22.73

1

- - - -+-----;,.----..- - -+

Total

(Continued>

!===-=..--

-

198

00.

-

-

-

PORCENTAJE

----:= ACUMULADO l

- - - - - -..1

Gráfico 7.16 RESULTADOS DE UNA TABLADE TABULACiÓN CRUZADA.

SA

s o

I'R

Prequency r Pe n Ro .. P t

Ca

: :

Pct

21, 1

"15 :

1

----+ Tot (Con

nu d)

1 5.as 1 64 ..29: 22.73 : - ..- - -

198

69 .72

También puede emplear otras instrucciones para la tabulación cruzada, estas son: TABLEs a....(b....c); es equivalente aTABLES a"'b a....e: TABLES (a b)....(c d); es equivalente a TA8I..ES a c b c a"'d b....d; TABLES (a b c)....d; es equivalente a TA8I..ES a d b d c....d; TABLES a--c; es equivalente a TABlES a b c; TABLES (a--c)*d; es equivalente aTABLES a....d b....d c....d;

Gráfico7 .14 RESULTADOS DE LAS TABLAS DE TABULACiÓN CRUZADA EMPLEANDO LA DECLARACiÓN LlBNAME .

U.P.T.C. Duitama 1997


38

Procesamiento de la Información

En el gráfico anterior las letras a, b, e y d corresponden a las variables que se estén utilizando, usted puede reemplazar cualquiera de las declaraciones anteriores en el programa según la necesidad .

que puede presentar una encuesta , para esto tomaremos el ejemplo que se da en la página 17. Lo primero que se debe realizar es la creación del archivo de datos permanente, usted puede guiarse con las instrucciones de la página 32, gráfico 7.3.

CURIOSIDADES 3

Una vez se tenga el archivo de datos, para el ejemplo se guardó como MUESTRA.SSD; éste se puede clasificar de acuerdo a las variables en las que el usuario esté interesado, digamos SEXO y PESO. El programa a ejecutar es :

En el uso de la declaración L1BNAME , el nombre de la librería que se dió al programa que contiene el archivo de datos, no necesariamente tiene que utilizarse en el resto de los programas; usted puede cambiarlo , debe tener presente que éste debe coincidir cuando escriba el DATA .

I"".... snd

EDITOR

0i1981 • 00082 LIBNAME EJEMPLO 'C:\SAS\ARCHIUOS\';

1 0i1083

l

0i1984 PROC SORT DATA=EJEMPLO.MUESTRA OUT =EJEMPLO. ORDEN; • 00005 BY SEXO PESO; 0i1006

0080? PROC PRINT DATA=EJEMPLO.ORDEN; 00088 BY SEXO PESO; 00009 RUN;

1 LIBNAME TRABAJO' C:'SAS\ARCHIUOS\'; ll0OO5

rABLES SEXO*PREFER1*DEDIC1;

08llII6

00007 RUN;

Gráfico 7.18

El ~MBRE DE LALI BRERÍA

PRO G RAMA PARA CLAS IFICAR VARIA BLES

~ J\ElESARIA~ TI EI\E QJE SER

El NJ.SMO PARALAEJEOJa ÓN DE TODOS LOSPRQ;RAMAS r--

-

11

Una vez se pulse F10, se obtienen

99081 LIBNAME GUIA' C:\SAS\ARCHIUOS\'; 99082 09093 PROC FREQ DATA =GUIA.ENCUEsrA ORDER=FREQ; 0004 09995 TABLES GRADO*PREFER1MCICLO: Il9l196 0llOO7 RUN;

los resultados como se aprecia en el gráfico siguiente:

Gráfico 7.17 USO DE LA DECLARACi ÓN L1BNAME CON DIFERENTE NOMBRE

1lIT.

ilUlUWl

PROCESAMIE NTO PARA EL SEGUNDO TIPO DE PREGUNTAS

. 6~

14

1 .74

rALLIIPIII

TILIoACII

C111.D11O

IIlllB

tl

31

19

JlLIollClIIl

--

lIlll

22

S

11 -

Ahora mostraremos la manera de procesar el segundo tipo de preguntas

13

,.

CIILDlIO

U

TllJ.LllJ'llll

12

LDIO J:Z

-

-

-

--

-

.1

aa -

"-

Gráfico 7.19 RESULTADOS DE LA CLAS IFICAC iÓN DE VARIABLES

U.P.T.C. Duitama 1997


39

Procesamiento de la Información

En el programa anterior se aplicó el procedimiento PROC SORT, en la misma línea de esta declaración se utilizó la opción OUT= . Ahora bien, cuando no se usa esta opción, los datos del archivo original se pierden y se clasifican de acuerdo a las variables que se escribieron en la utilidad BY ; en este caso en OUT= se crea un nuevo archivo llamado ORDEN .SSD y clasifica las observaciones de acuerdo a las variables SEXO y PESO. Si usted desea ver este nuevo archivo utilice el programa:

r

-- - - --

PROGRAI1 EDITOR le

--

-

00001 00002 LIBNAME EJEMPLO 'C:'SAS'ARCHIUOS"; 00003 00004 PROC PRINT DATA=EJEMPLO.ORDEN; 00005 RUN;

-

-

-

- ---

-

-;;;;;."

Gráfico 7.20 PROGRAMA PARA IMPRIMIR UN ARCHIVO DE DATOS

Al correr el programa los resultados aparecen en forma ordenada por peso y clasificando primero a mujeres y luego hombres:

De la misma forma que para la encuesta anterior se emplearon diferentes procesos, el usuario tiene la posibilidad de volver a hacer uso de ellos en este nuevo archivo de datos; puede ejecutar los programas para hallar la frecuencia, siguiendo las indicaciones del capítulo 7, gráficos 7.7, 7.9 que se describieron en la página 35 y el gráfico 7.13 de la página 37. También se puede obtener en las respectivas variables la media, empleando ahora la declaración PROC MEANS . El usuario puede escribir la declaración anterior después de PROC FREQ o de PROC PRINT .

-

-

. nuunnl'

. lU JI

-

-

-

00287 002 8 002 9 00290 00291 00292 00293 00294 00295 00296

1 1 1 1 1 1.

2 2 2 2 2 2

1 1 2 2 1 2

12 12 12 12 12 12

11 12 01 01 12 12

1 1 1 2 1 1

3 1 1 2 1 1 2 1 lJ 1 lJ

,.

PROC MEANS; RUN;

Gráfico 7.22 PROGRAMA PARA OBTENER LA MEDIA DE CADA VARIABLE.

Luego oprime F10 Y en la ventana OUTPUT aparecen los resultados

Gráfico 7.21 RESULTADOS QUE SE PRESENTAN AL IMPRIMIR UN ARCHIVO DE DATOS

Gráfico 7.23 RESULTADOS DE LA MEDIA PARA CADA VARIABLE

U.P. T.C. Duitama 1997


40

Procesamiento de fa fnformación

Usted puede observar que con esta declaración también aparece el mínimo, el máximo, la media y la desviación estándar. Asimismo se puede emplear la declaración L1BNAME, para simplificar el trabajo; el programa a ejecutar es el siguiente:

,,'

Gráfico 7.26 RESULTADOS DE LA MEDIA PARA VARIABLES ESPECíFICAS

LIBNAME EJEMPLO 'C='SAS'ARCHIUOS"; PROC MEANS DAIA~EJEMPLO.MUESTRA; RUH;

Para procesar los datos por subconjuntos, se clasifican los datos por variables, después se hallan los promedios:

Gráfico 7.24 PROGRAMA PARA OBTENER LA MEDIA DE CADA VARIABLE USANDO LA DECLARACiÓN L1BNAME

LIBNRME TRREA 'C:\SAS\ARCHIUOS\';

Los resultados que se obtienen al ejecutar el programa anterior son iguales a los que aparecen en el gráfico 7.23 Si se desea obtener los promedios para ciertas variables, se emplea como ya se mencionó la utilidad VAR. El programa a ejecutar es el siguiente:

o 003 OOOO~ o 005 o 006

PROC SORT DATA=TAREA.MUESTRA; BY PESO EDAD;

PROC MEANS; BY PESO EDAD; OOOOB UAR ESTATURA TALLRPRN CRLlADO; 00009 RUN: 00007

Gráfico 7.27 PROGRAMA PARA OBTENER LA MEDIA POR SUBCONJUNTOS

Los resultados se muestran del siguiente modo:

1:01

t

00001 LIBNBME TBREB 'C:\SBS\BRCHIUOS\'; 00002 00003 PROC MEBNS DBTB=TBREB.MUESTRB; OOOO~ UBR PESO ESTBTURB EDBD; 00005 00006 RUN;

Gráfico 7.25 PROGRAMA PARA OBTENER LA MEDIA DE VARIABLES ESPECiFICAS

Los resultados en la ventana OUTPUT se observan así:

Gráfico 7.28 RESULTADOS DE LA MEDIA POR SUBCONJUNTOS

U.P.T.C. Duitama 1997


41

Procesamiento de la Información

CURIOSIDADES 4 Una vez se tenga la información ya procesada , se pueden imprimir dichos resultados en el SAS . Para esto se debe ubicar el cursor en la ventana PROGRAM EDITOR ; se pulsa la tecla inicio y en la línea comando se utiliza la orden para recuperar el archivo que contiene los resultados. A manera de ejemplo se recuperó el archivo que contiene los resultados de las frecuencias de todas las variables. En la pantalla se observa :

como se puede apreciar en el gráfico 7.29 ésta aparece separando las Tablas de frecuencia para cada variable ; dicha línea también se presenta al recuperar el archivo con las observaciones, o si se ejecutó el programa para obtener Tablas de Tabulación Cruzada, separando cada una de ellas. Para imprimir los resultados , lo primero que se lleva a cabo es el arreglo del informe por páginas, de la manera como se indica a continuación:

Se borran todas las líneas como la que se muestra en el gráfico 7.30, excepto una. Como en SAS cada página la conforman 60 líneas, iniciando desde la línea 0001 cada vez que cuente ésta cantidad , se copia la línea que aparece en el gráfico 7.30 para iniciar otra página. La información se distribuye en cada página de acuerdo a como lo considere conveniente el usuario.

IHe'FIEC.tU' SU

&IU080

Frequenc, 28~

GRADO

Frequenc,

':52 Sotor••"

Perceat

C....... t iee

CII.... htiue

Frellllllellc,

'ercellt

111.1 Percent

Fe....., 2

1•••• tlllflMl1ati.e freq.enc,

C."'lIIhti.e

'Irc:e.t

44 232

,

Cuando el informe se haya arreglado, en la Gráfico 7.29 RESULTADOS QUE SE RECUPERAN EN LA VENTANA PROGRAM EDITOR. línea comando se escribe la orden FILE'PRN' y se pulsa Enter para comenzar a imprimir En ésta ventana los resultados muestran la siguiente línea,

SAS

10:02

Satu~day~ Feb~ua~y 2~

1

Gráfico 7.30 LINEA QUE SE EMPLEA PARA SEPARAR PÁGINAS EN SAS

U.P. T.e. Dultama 1997



43

Presentación de fos resultados

n la presentación de los resultados se puede emplear un ~ procesador de texto para organizar y elaborar un informe que describa su interpretación, incluyendo gráficos adecuados. Si el archivo que contiene los resultados no se imprime en SAS , éste se puede recuperar en una hoja electrónica como EXCEL por ejemplo. A continuación se muestra un gráfico, que contiene las frecuencias para cada variable, del archivo recuperado en EXCEL:

.. . ~c:livo Edición Ver

~~ A~~m= ~ o

10

p

20

3040

Henanierl..

eo

60

70

80

No.Enalostas

~Tg~1

. !Ir Insertif Formato

Barras y columnas en dos y tres dimensiones, diagrama de anillos, de dispersión, y diagramas circulares también en dos y tres dimensiones. Al realizar los diagramas de barras y circulares en tres dimensiones se pueden ver así:

PRESENCIAl.

Datos Venlana

DIURNO

?

D151"ii11 ~ ~r~ I ifJ,I~I~~..1~r~*IHl ill.!L .

1

.

B 2 3

e

H

Cumulative Cumula tivl!'

Frequency Peleen'

5 •• - .---

""6 F ~M '""8 '"""9

---------- 12 8

f-¡Q

1.4 1.5 1.56 1.57

Frequenes

Per cent

60.0 100.0

Cumulative Cumulative Frequency

Percent

---- --- -------- -----------------------

~ '·I·'I\MU[ ~T RA I

NOCTURNO ''5

Gráfico 8.2

15:1O F.ida" Februer 22, 1991 2

f requenoy Petcent

1 2 2 1

PRESENCIAL

60 12 4020

5A5

'it ~E5TATURA f-11- --- ---17

G

F

I

~5EXO

~ ~ ~

E

D

5 1 103 105 56

5.0 15.0 25.0 30.0

l·'

DIAGRAMAS DE BARRAS Y CIRCULARES EN TRES DIMENSIONES .

Estos gráficos se pueden copiar en un procesador de texto como WORD . Allí se procede a escribir la interpretación de los resultados, y para que el informe sea completo se puede complementar con la presentación de tablas .

Gráfico 8.1 ARCHIVO QUE CONT IENE LOS RESULTADOS. UNA VEZ RECUPERADO EN EXCEL.

este paquete se puede utilizar para la elaboración de diagramas que ilustren de una forma más agradable, vistosa y clara la interpretación de los resultados. Los más usuales para presentar en cualquier informe son:

En esta parte se pone en juego la creatividad del usuario, para obtener un informe de fácil interpretación pero a su vez muy completo; una alternativa que este manual ofrece es presentar los resultados como sigue:

U.P.T.e. Duftama 1997


44

Presentación de los resultados

posteriormente se hace la interpretación de los resultados bajo cada diagrama , la presentación de este formato se puede observar del siguiente modo:

Elaboración de diagramas circulares en tres dimensiones indicando el porcentaje junto a cada sector y el nombre de la variable en un cuadro de convenciones ,

y

RESU LTADOS DE LA ENCUESTA APLICADA EN LA CIU DAD DE DUITAMA PREFERENCIA PARA PRIMERA OPCIÓN

1:1 TECNOlOG

A EN ' NFORl.IATICA DIGITAl. • TECNOlOGIA EN SISTEMAS

28%

e TECNOlOGIA EN CONSTRUCCIONES CMlES

Gra fico 1.

TECNOLOG íA COMO PREFERENC IA PARA PRIMERA OPCiÓN

Según la Encuesta aplicada a las 284 personas, en la ciudad de DUITAMA, se puede obse rvar que el 37% tiene preferenc ia para primera opción la TECNOLOGíA EN INFORMÁTICA DIGITAL con 70 encuestados, le siguen en su orden TECNOLOGíA EN SISTEMAS c on el 35% y finalmente 1ECNOLOGíA EN CONSTRUCCIONES CIVILES con 31 pe rsonas, es dec ir el 28%. JORNADA EN LA CUAL LE GUSTARÍA ESTUDIAR DIURNO

70%

SEMIPRESENCIAL 9% Gráfico 2.

RESULTADOS DEL TI PO DE JORNADA

¿ CURSARlA OTRO CICLO? 1% 5%

eSI

@

• SIN INFORMACION 94%

Gráfico 3

PORCENTAJES PARA CURSAR OTRO en.o

De estos enc uestados el 70% tiene gran acep tación por es tud iar en la jornada DIURNA, el 20% en la jornada NOCTURNA y tan solo el 9% en SEMIPRESENClAL, además 266 personas o sea el 94% estaría dispuesto a c ursar otro c iclo pa ra ob tener el título de profes ional

Gráfico 8.3 PRESENTACION CON DIAGRAMAS CIRCULARES Y LA RESPECTIVA DESCRIPCION

U.P.T.C. Dultama 1997


45

Presentación de los resultados

Para visualizar mejor los valores que la conforman , se realiza un diagrama circular, y luego se lleva a cabo la interpretación de los resultados. Por ejemplo:

Cuando se incluyen tablas en ellas se pueden presentar los porcentajes y si se desea se especifican las frecuencias.

RESULTADOS DE LA ENCUESTA APLICADA EN LA CIUDAD DE DUITAMA

PORCENTAJE

TECNOLOGíA

No. DE PERSONAS

PREFERENCIA UNO " ~?r'~ATl C A D SlSTEMAS

INFORMÁ nCA DIGITAL. SISTEMAS CONSTRUCCIONES CIVIL S SOLDADURA Y FUNDICI N MECÁNIC A

70 67 31 22 19

31% 29% 20% 9% 6%

"

COHSTR UCQ

OtE:S QVf~

e

SOLDADLRA

YFUH:lIClON

29%

MECÁNCA

Gráfico 1. Por sectores para Tecnología.

Tabla1 . Tecno logía para primera opción

Según la encuesta aplicada a las 284 personas, en la ciudad de DU/TAMA se puede observar que el 31% tiene como preferencia para primera opción la Tecnología en Informática Digital, le siguen en su orden Tecnología en Sistemas con el 29%, Tecnología en Construcciones Civiles con el 20%, Tecnología en Soldadura y Fundición con un 9% y finalmente Tecnología en Mecánica con 19 personas, es decir el 8%, PORCENTAJE

JORNADA DIURNO NOCTURNO SEMIPRESENCIAL. SIN INF ORMACiÓN

TIPO DE JORNADA

No. DE PERSONAS

9% 1%

266 56 26 2

7 0%

20% 9% 1%

Tabla 2. TIpo de Jornada

NOC TURNO

D

SEMI PRES E ~IAL

70%

Grafico 1. Por sectores para tipo Jornada .

De estos encuestados 0170%tiene gran aceptación por estudiar en la jornada DIURNA con 266 personas, el 20% en la jornada NOCTURNA lo que equivale a 56 personas y tan solo el 9%en SEMIPRESENCIAL.

CICLO

PORCENTAJE

~ o. DE PERSONAS

:>1

lIJ .7 0%

266

NO

5% 1.40%

13 4

¡SIN INFORMACIÓ ~

Tabla 2. Porcentajes para cursar otro ciclo.

¿ CURSAR íA OTRO CICLO?

.... 1 l .'"

c:J SI

5% 93 .7%

..

NO

<::1

SIN I~ORMAC1ÓN

Grafico 2. Por sectores para c urs ar otro c iclo.

Además 266 personas o sea el 93,7% estaría dispuesto a cursar otro CICLO para obtener el título de profesional, tan solo un 5% no tomaría el otro ciclo lo cual es equivalente a 13 personas.

Gráfico 8.4 PRESENTACiÓN CON TABLAS , DIAGRAMAS CIRCULARES Y LA RESPE CTIVA DESCRIPCiÓN.

U.P. t.c. Oultama 1997


46

Presentación de los resultados

Podemos presentar entonces, algunos de los resultados correspondientes a la primera encuesta presentada en este manual, mediante una tabla y un diagrama de barras:

La atracción del usuario por cada aspecto en el que esté interesado, determina el diseño y presentación del informe final.

TABLA DE TABULACiÓN CRUZADA PARA PREFERENCIA COMO PRIMERA OPCiÓN

TECNOLOGíA

HOMBRES

MUJERES

INI- U R M A II~A DI G IT A L

15.85% 12.32% 8.80% 6.34% 6.34% 5.63%

8 .8 0% 1 1.27% 19.3 5 % 1.41% 0 .3 5 % 0 .3 5 %

SI STE M A S CO N STR U C C IO N E S CIVIL E S SO LDA D U R A Y F U ND ICiÓN MEC Á NIC A EL E C TRI C IDAD

TABLA DE TABULACiÓN CRUZADA Clasificando los resultados por sexo.

Los resultados anteriores corresponden a una TABLA DE TABULACiÓN CRUZADA , donde se muestra el porcentaje de Hombres y Mujeres que prefieren como primera opción las siguientes tecnologías: La Tecnología de mayor aceptación para los hombres es INFORMÁTICA DIGITAL con el 15.85%, le siguen en su orden Tec. en SISTEMAS con el 12.32%; Tec. en CONSTRUCCIONES CIVILES con 8.80% después Tec. en MECÁNICA con el 6.34%. La Tecnología de mayor preferencia entre las mujeres es CONSTRUCCIONES CIVILES con el 19.35%, después se encuentra Tec. SISTEMAS con 11.27% , le sigue Tec. en INFORMÁTICA DIGITAL con 8 .80%, y las dos tecnologías con menor porcentaje lo ocupan Tec., MECÁNICA y Tec. en ELECTRICIDAD , ambas con el 0.35%.

en en el en

Los resultados se pueden apreciar mejor en el siguiente diagrama:

PREFERENCIA PARA PRIMERA OPCiÓN CLASIFICÁNDOLA POR SEXO

n

20.00% 15.00% 10.00% 5.00% 0.00%

o

M B

'" •

INFORMÁTICA DOGITAL SISTEMAS

'" CONSTRUCCIONES CIVILES '" SOLDADURA Y FUNDICION • MECÁNICA '" ELECTRICIDAD

0::3

a: W

~ ~

s

DIAGRAMA DE BARRAS PREFERENCIA PARA PRIMERA OPCiÓN

Gráfico 8.4 PRESENTACiÓN CON TABLAS, LA DESCRIPCiÓN Y FINALMENE EL DIAGRAMA DE BARRAS.

U.P.T.C. Duitama 1997


/

BIBLIOGRAFIA CURSO PASO A PASO WINDOWS 95 y LOS 13 PROGRAMAS LIDERES. s.l: s.n, s.f. Fasclculos 2, 3, Y 4. p. 123-129, 130-140, 143-148, 150-160, 177180. /

/

IDAMS, Manual del usuario. s.l: s.n, s.f. p. 3-8, 3136, 349-352. REVISTA Pe. COMPUTING EN ESPAテ前L. Aテアo 12, Nツー 08. Los 1001 tips para Windows 95. s.l: s.n, Agosto de 1995. p .58-62. /

GUIA INTRODUCTORIA AL SAS. s.l: s.n, s.f. p. 2-6. SAS INSTITUTE. 0049(6221)474830. HTTP://VWIW.sAS.COM. SAS LANGUAGE GUIDE. s.l: Release 6.03 Edition, s.f p. 136-139, 320-327, 337-338, 344-354, 494-495. SAS PROCEDURE GUIDE. S.I: Edition, s.f. P. 219-222, 234-236.

Release 6.03

Unesco. Division Of The General Information Programme Idams. 1 Rue Millois. 75732 Parテュs Cedex 15 Francia.


NIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE COLOM FACULTAD SECCIONAL DU ITAMA I

I

ESCUELA DE MATEMATICA y ESTADISTICA

1997


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.