Este manual, elaborado por las estudiantes Sandro Pa tricio C贸rdenos Ole da y Homlbn Medino Chlo, se ha rea lizada ce rno Tre b uje de Grad o, bajo lo direcci贸n del profesor ALVARO CAlVACHE ARCHILA
P~og贸git:o y
Tec no l6gico de Colombm focclrod Secoooct Du,tomo Eswelo de Motem贸t't:a y Estodrs bcc Noviembre de 1997
Universidad
CO TENIDO
Pág. /
O. INíRODUCCION
1
1. ORIGEN DE IDA MS Breve reseña histórica de
IDAMS
Características Captura de datos, empleando el primer tipo de preguntas
l1
4 4
5
2. PREPARAR EL DICCIONARIO
~T
Selección de variables y asignación de códigos a categorías
6
/
3. CREACION DEL DICCIONARIO Pasos básicos en la creación del diccionario
8
Descripción de los elementos del Edito r
de Diccionario Curiosidades 1
9 9
rn
4. ALMACENAR EL DICCIOI\JARIO Instrucciones para almacenar las variables al diccionario Orden para grabar el diccionario Retomar nuevamente el trabajo en IDAM5 , en caso de no haber terminado de almacenar el diccionario Curiosidades 2
10 11
12 13
I
5. INlRODUCCION DE LOS DArOS Manera para entrar a la ventana dellDAM5 DATA EDITOR e introducir los datos al diccionario almacenado Formas r谩pidas Orden para grabar el archivo con los datos Curiosidades 3 Preparaci贸n del diccionario para el segundo tipo de preguntas
~
14 15 16 16 17
I
6. DESCRIPCION DEL 5 AS Utilidad de ciertas teclas para trabajar a trav茅s de las ventanas en SAS Tipos de archivos Paso DATA para la creaci贸n de un archivo de datos Procedimientos en SAS Proc Print Proc Sort Proc Freq Proc Means, Run, Libname Programa que origina un nuevo archivo de datos Orden para grabar en SA5 Curiosidades 1
21 22 23 24
25 26 27
29 29 31
o
/
7. EJEC UCION DE PROGRA MA S Empleo de la declaraciรณn Libname para la creaciรณn de un archivo de datos permanente en SAS Frecuencias y medias forma corta Curiosidades 2 Comparaciรณn de variables Ordenar variables por su frecuencia Curiosidades 3 Procesamiento para el segundo tipo de preguntas Programa para obtener la media Programa para obtener la media por subgrupos Curiosidades 4
32 33 33 35 36
38 38 40 40 41
/
8. PRESENTACION DE LOS RES ULTA DOS Diagramas mรกs usuales en la presentaciรณn de un informe
9. GLOSARI O
43
47
/
10. BIBLlOGRAF IA
48
/
INTRODUCCION El manual para el Procesamiento de Encuestas se realizó bajo la dirección del Matemático ALVARO CALVACHE ARCHILA durante el año de 1997. Es el resultado de la experiencia en el procesamiento de Encuestas,
que
la
Escuela
Matemática
de
Estadística de la Facultad Seccional
y
Duitama,
aplicó en poblaciones de la región, con el fin de detectar aceptación por nuevas carreras para la Facultad.
Surge de la necesidad de estudiantes y profesores de la Facultad Seccional Duitama, interesados en el procesamiento de encuestas, de contar con un documento adecuado que indique los pasos básicos a seguir en los paquetes Estadísticos IDAMS
y
SAS, y que incluya a su vez la presentación de los resultados obtenidos.
Este
manual
didáctica,
proporciona
creativa
y
en forma
resum ida
completa,
lo referente
a
Captura de Datos, mediante el paquete Estadístico IDAMS,
en
éste
se
describe
Creación
y
Almacenamiento del Diccionario e Introducción de los Datos. Lo anterior permite la creación de una base de datos en IDAMS, controlada directamente por el interesado, brindando una mayor confiabilidad de los datos recopilados.
El procesamiento de la información se lleva a cabo en el paquete Estadístico SAS, en él se encuentran las instrucciones de los programas que permiten hallar las frecuencias, los porcentajes, las medias, tablas de tabulación cruzada y comparación de variables.
Explica de manera concreta lo relacionado con procedimientos útiles y claves, algunos de ellos producto de la experiencia personal en el manejo de los paquetes IDAMS y SAS, proporcionando al usuario ventajas en su trabajo.
Se emplearon
WORD y EXCEL para lograr una
presentación de los resultados amena y precisa.
El
manual
facilita
que
una
persona
con
conocimientos básicos en Estadística y en el manejo del computador, obtenga en el menor tiempo y a un bajo costo los resultados de las Encuestas.
P".pcU"cU" .., Ah".c."... • 1 o.cc ••" .....
4
Captura de datos en IDAMS
[1]
DAMS proviene originalmente del software estadístico OSIRIS 111.2 desarrollado al comienzo de la década de los 70 en el Instituto para la Investigación Social de la Universidad de Michigan en los Estados Unidos de América . Este software ha sido y continúa siendo enriquecido, modificado y puesto al día por el secretariado de la UNESCO con la cooperación de expertos de diferentes países, a saber: especialistas estadounidenses, británicos, colombianos, franceses, húngaros , rusos y ucranianos; de ahí el nombre "IDAMS": "Internationally Developed Data Analysis and Management Software Package" en castellano : "Paquete de software para el análisis y manejo de datos desarrollado internacionalmente".
proporcione una almacenan en el IDAMS . (ir
Cada columna del arreglo es una variable, siendo esta un conjunto de valores para la misma medida, por ejemplo las edades, estudios realizados, el sexo, etc. Dicha variable se encuentra siempre en la misma posición fija dentro del registro . Un archivo de diccionario IDAMS puede contener hasta 1000 variables.
(ir
Cada variable está descrita en el diccionario, dentro del cual se le asigna un único número; el usuario toma como referencia de la variable el número asignado a la misma y entonces IDAMS en forma automática, trae del diccionario la información referente a la variable, tal como: nombre de la variable; posición del campo de la variable dentro de cada registro; los nombres de códigos de categorías.
(ir
El diccionario solo se genera una vez, después se guarda como parte del dataset IDAMS , además cualquier referencia a una variable se hace a través de su número de variable, cualquier otra información acerca de la variable se obtiene del diccionario que describe los datos.
(ir
Una ventaja del paquete IDAMS es ser un sistema abierto: es relativamente fácil procesar los datos para que tomen la forma de un dataset IDAMS. Como los datos y el diccionario son archivos independientes, los datos no están restringidos a ser usados exclusivamente con IDAMS , sino que,
IDAMS está disponible en versiones para microcomputadores y equipos mainframe de 18M, y los que sean compatibles. CARACTERíSTICAS (ir
Permite la presentación de datos en pantalla, edición y corrección de los mismos.
(ir
Un aspecto importante es el formato llamado "dataset IDAMS " que comprende dos archivos: los datos mismos y una información descriptiva de ellos llamada el diccionario.
(ir
Los datos se pueden imaginar como un arreglo rectangular. Cada fila de este arreglo es un caso o unidad de análisis (persona, entidad en estudio) y generalmente constituye un registro separado dentro de un archivo. Los registros (de aquí en adelante corresponden a la información que
encuesta) se archivo dataset
U.P.T.C. Duitama 1997
5
Captura de datos en IDAM5
por el contrario, pueden intercambiar información con otros paquetes como es el caso del SAS .
CAPTURA DE DATOS En el paquete IDAMS se utilizan los siguientes dos pasos:
Los valores individuales de las variables pueden ser los valores numéricos medidos o códigos que representan categorías específicas, o caracteres alfanuméricos que forman nombres. Cada variable numérica tienen un ancho de campo de 1 a 9 dígitos; las variables definidas como alfabéticas pueden tener hasta 255 caracteres.
r::¡r
1. Preparar y almacenar un diccionario que describa las variables. 2. Capturar los datos. Para la ejecución de los pasos anteriores emplearemos como ejemplo dos tipos de preguntas. Las del primero tipo que se presentan en la encuesta siguiente (gráfico 1.1).
UJIl1.VERSIDADPEDAGOGICA y TECNOLOGICA DE COLOMBIA FACULTAD SECCJONAL DUITAl\1A SO~DEO DE OPJNIÓ~
La UPTC está interesadaen ofrecerprogramasde Tecnologiasen la ciudad de Duitama La informaciónque ustednos aportees básica para la orientación inicialde los programas,especialmenteen cuantoa horariosy tipo de tecnologías a ofrecer.
Le agradecemos su cooperación, l.
ÚLflMO GRADO AP ROBADO:
u
SEXO. FEMENINO
IIJ.
MASCULINO
DE LAS SIGUIENTES TECNOLOGÍAS, POR FAVOR MARQUE EN ORDEN DE PREFERENCIA (J Y 2 ) LAS DOS QUE MÁS LE INTERESEN:
Toe. en InfOflllátic.aDigilal Tec. m So ura y Fundición Tee. en ManlmimientD Eléctrico Tec, en MlU11emmtcnto Mecánico Tec. en Construcciones Civiles 6. Tec. en e ternas
8. Tcc . en Mecánica 9. Tec. en Mecánica Automotriz 10. Tec . en Estadistica Computacional
1. 2. 3. 4. S.
11. Tec. en Ciencias Agropecuarias 12. Otra Cuál:
_
7. Tce. en Eleetricjded
IV.
¿QUÉ TIPO DE DEDlCAC IÓ ESTARL\ DISP UESTO A ASUMIR? PO R FAVO R, MARQUE EN O RD EN D E PREF ERENCIA LAS DOS QUE MÁS LE INT ER ESEN: l . Presencial Diurno 2. PresencialNocturno 3. Semipmeneiol (rDlC. de .emolla)
V.
U~A VEZ GRADUADO COMO TECNÓLOGO (ART.J680, ¿USTED ESTARÍA
DISP UESTO A CURSAR UN CICLO COMPLEM ENTARIO PARA OBTENER EL TÍT IIW DE J.JO:NCIADO O INGENIERO! (Apro,imadamete entre I y 3 oftos má.) SI_ _ VI.
_._ - -
OBSERVACIONES
- --- -
-
NO
(Si necesita mas espacio puede continuar al respaldo):
Gráfico 1.1 ENCUESTA TIPO UNO
U.P.T.C. Duítama 1997
6
Captura de datos en IDAMS
f]
ara preparar y almacenar el diccionario con las preguntas del primer tipo, es necesario conocer cuáles variables se pueden obtener de la encuesta que se desea procesar. Estas surgen de cada una de las preguntas propuestas, y es posible que cada pregunta dé origen a dos o más variables. Para el ejemplo de la encuesta anterior se van a utilizar las siguientes ocho (8) variables: 1. CIUDAD : aunque esta variable no aparece como pregunta en la encuesta, puede proporcionar información importante. Por esta razón la creamos y se tuvo la precaución de separar las encuestas por municipios. Las poblaciones en donde se aplicaron conforman lo que se denominarán las categorías, para este caso son: 1 2 3 4 5 6 7 8 9 10 11 12
DUITAMA BELÉN BETEITIVA CERINZA PAZ DE RIO SATIVA NORTE SATIVA SUR SOCHA SOCOTA TASCO TUTAZA SIN INFORMACiÓN
1 FEMENINO 2 MASCULINO 3 SIN INFORMACiÓN
Para la pregunta número cuatro, se debe realizar una división debido a que se pide marcar preferencia uno y dos. Tenemos entonces las variables: 4. PREFERENCIA UNO : con categorías que corresponden a las diferentes tecnologías que se dan a conocer en la encuesta, de esta forma la variable se mostrará de la siguiente manera: 1 TECN. EN INFORMÁTICA DIGITAL. 2 TECN. EN SOLDADURA Y FUNDICiÓN. 3 TECN. EN MANTENIMIENTO ELÉCTRICO. 4 TECN. EN MANTENIMIENTO MECÁNICO. 5 TECN. EN CONSTRUCCIONES CIVILES. 6 TECN. EN SISTEMAS. 7 TECN. EN ELECTRICIDAD. 8 TECN. EN MECÁNICA. 9 TECN. EN MECÁNICA AUTOMOTRIZ. 10 TECN. EN ESTADíSTICA COMPUTACIONAL. 11 TECN. EN CIENCIAS AGROPECUARIAS. 12 SIN INFORMACiÓN.
5. PREFERENCIA DOS : con las categorías igual que en la variable anterior:
2. ÚLTIMO GRADO APROBADO : Se está interesado en conocer las y los gustos de los preferencias estudiantes de los dos últimos grados de bachillerato, por tal razón solo se tendrán encuentra los grados: 1 UNDÉCIMO 2 DÉCIMO 3 SIN INFORMACiÓN
3. SEXO : esta variable la conforman las categorías correspondientes a:
1 TECN. EN INFORMÁTICA DIGITAL. 2 TECN. EN SOLDADURA Y FUNDICiÓN. 3 TECN. EN MANTENIMIENTO ELÉCTRICO. 4 TECN. EN MANTENIMIENTO MECÁNICO. 5 TECN. EN CONSTRUCCIONES CIVILES. 6 TECN. EN SISTEMAS. 7 TECN. EN ELECTRICIDAD. 8 TECN. EN MECÁNICA. 9 TECN. EN MECÁNICA AUTOMOTRIZ.
U.P. T.C.
Duitama 1997
7
Captura de datos en IDAMS
10 TECN. EN ESTADíSTICA COMPUTACIONAL. 11 TECN . EN CIENCIAS AGROPECUARIAS. 12 SIN INFORMACiÓN.
Para la pregunta número cinco se debe realizar el mismo tratamiento. De esta forma aparecen las variables:
6. DEDICACIÓN UNO : las respectivas categorías : 1 2 3 4
PRESENCIAL DIURNO PRESENCIAL NOCTURNO SEMIPRESENCIAL SIN INFORMACiÓN
7. DEDICACIÓN DOS : con las mismas categorías: 1 2 3 4
PRESENCIAL DIURNO PRESENCIAL NOCTURNO SEMIPRESENCIAL SIN INFORMACiÓN
8. CURSARíA OTRO CICLO : con las opciones que presenta la encuesta: 1 SI 2 NO 3 SIN INFORMACiÓN.
Para la última pregunta correspondiente a las OBSERVACIONES no se tendrá en cuenta para el ejemplo. Solo se mostrará la forma de procesar variables del tipo cerrado .
. En todas las variables anteriores se dejó 'como última categoría SIN INFORMACIÓN, esto es de gran utilidad cuando el encuestado no responde alguna pregunta.
Así como se mencionó anteriormente que el número de variables surge del total de preguntas en la encuesta, el usuario debe tener creatividad a la hora de preparar y almacenar el diccionario y seleccionar las posibles nuevas variables que puedan surgir . Una vez seleccionadas las variables anteriores y sus respectivas categorías se está listo para crear un Diccionario en IDAMS .
U.P.T.C. Duitama 1997
8
Captura de datos en IDAMS
ara entrar al paquete IDAMS se da la orden C :\CD IDAMS y luego '--_ ..1 se oprime la tecla Enter; después se da nuevamente la orden IDAMS y se oprime Enter si se trabaja en modo DOS, o activando el ícono respectivo bajo WINDOWS. Ahora aparece el menú principal
' Se anota el núnero de YOl'iables que se obtilU'lCn de la encuesta.
' ' -_ / 1
(conacido
t.IlQ IIU
Pi ..st Uapiable Nu~bep Last Ua..iable N~.. : Nu..be.. DE PeCDl'ds I!!l " case :
't,,,,''',*tiIiffli',¡'MWe.e¡
1 9
1
rI
int
... o,. t!/'PO fi ne.
c h4r ~
then pro. s . Ente,. <be a xu:)
Gráfico 3.3 DESCRIPCiÓN DEL DICCIONARIO.
Ganara l adito .. Diction r!l editor Data editor
Exacuta 41n 1 DA~ progr." Cr4phical Dxplorat inn o f data Print a.n IDAftS p .. lntout Sat colou.. . ro .. . dito rs onl!l CoIIIC! Me le to DOS
Copyright (C> 1993 UNESCO. AH
~ights
.... se~u.d.
Gráfico 3.1 MENÚ PRINCIPAL
Con la flecha del cursor seleccione la opción DICTIONARY y luego Enter, en la pantalla se observa :
AY or t,pe f irst eh.r, then E"TER (ESC .eti.e)
I ~i"" Hew dictio .r~ ;4íte •••
I'vil
En la posición First Variable Number se anota el valor 1, para la primera variable . En la siguiente posición Last Variable Number se anota el número de variables que se obtienen de la encuesta (conocido una vez se ha preparado el diccionario); recuerde que a veces una pregunta se puede separar en dos variables. Además se recomienda adicionar una o más variables al total de variables que resulten, ya que puede surgir una variable que quizá no se tuvo en cuenta. En los demás campos se deja por defecto el valor 1. Una vez realizado lo anterior oprima Co nt rol + Enter para aceptar las valores dados.
lo.d.n existing diclion.r, Cene b.ck to pre.i,us ~eou
Gráfico 3.2 CREACiÓN DEL DICCIONARIO
Seleccione CREA TE Yoprima Enter con esta opción se crea un diccionario.
ha
preparado el diccionario).
SC .. ipt61
Con el procedimiento descrito, se ha creado el diccionario. Ahora en la pantalla se puede apreciar el Editor de Diccionario, en el cual se describen las variables ya seleccionadas; a continuación se muestran los elementos que lo conforman :
En la pantalla descriptiva del diccionario :
U.P.T.C. Duitama 1997
9
Captura de datos en IDAM5
7. MD1 ,y MD2 : el primero y segundo código de datos faltantes , (para mayor información revisar en el IDAMS Manual del Usuario, página 6 y 349-352).
BARRA ME NU
8. LABEL corresponde a las categorías de cada una de las variables . 9. CODE : es el código asignado a la respectiva categoría.
Gráfico 3.4 EDITOR DE DICCIONARIO
CURIOSIDADES 1
1. VAR : el número de la variable a través del cual el usuario referencia a la misma.
hace
2. DESCRIPTION : corresponde al nombre de la variable de máximo 24 caracteres, el cual se utiliza como título en todos los listados. 3. LOC : la posición inicial del campo de la variable dentro de cada registro. 4. WDTH : el ancho del campo de la variable. 5. D : el número de cifras decimales dentro del campo. 6. T : el tipo de variable (numérica 0, alfabética 1). Las numéricas se refieren a aquellas variables que contienen números y las variables alfabéticas a las que contienen letras. Para el ejemplo de la encuesta que se está tratando, no se trabajarán variables de tipo abierto como se menciono anteriormente, en este caso la relacionada a las OBSERVACIONES.
Se pueden personalizar los colores de la pantalla de IDAMS de la siguiente manera:
©
Estando en el menú principal, se activa la orden COLOUR, y procede a seleccionar las diferentes opciones para los distintos elementos de la pantalla. En la parte inferior aparecen los movimientos que permiten los cambios.
Finalmente, grabar las modificaciones pulsando ESe donde se muestra la ventana siguiente:
Gráfico 3.5 GRABAR COLORES EN IDAMS,
luego Enter para aceptar.
U.P.T.C. Duitama 1997
10
Captura de datos en IDAMS
amo se mencionó anteriormente vamos a utilizar la encuesta para almacenar los datos en el diccionario que ya se creó. Una vez el usuario se encuentre en la pantalla Editor de Diccionario, se escribirán las variables con sus respectivas categorías, en el orden en que se preparó el diccionario (ver página 4) , para esto hay que seguir las instrucciones siguientes: c:Ir' A LT + E permite llenar el diccionario;
en la pantalla aparecerá titilando el cursor bajo la palabra Var, allí se escribe el valor 1. Para pasar al siguiente campo oprima la tecla Enter (utilice ésta misma orden para avanzar a los demás campos); en el campo Description se escribe el nombre de la primera variable, en este caso CIUDAD; en Loc se anota el valor 1 por ser la posición inicial del campo; en Wdth el ancho del campo es 2 (ver explicación gráfico 4.1); para este ejemplo en el campo siguiente no se trabajará con cifras decimales se dejará en blanco; en T se escribe el valor O, porque el tipo de variable es numérica . Los campos correspondientes a MD1 y MD2 no se llenan porque todos los datos de esa variable se consideran válidos, es decir para el ejemplo no existen datos faltantes, además se sugirió adicionar la categoría de SIN INFORMACIÓN para cuando el encuestado no responde alguna pregunta. Una vez realizado lo anterior se da la orden
Cont rol + Enter para aceptar los valores que se dieron a cada campo, y así completar una línea. c:Ir' Para especificar cuáles fueron las
ciudades en donde se realizó la encuesta, es decir escribir las categorías e identificarlas con su respectivo código, se debe pasar a la segunda ventana con la orden ALT + B, en ella se oprime AL T + E y bajo Code se anota el valor 1; en el campo Label se escribe DUITAMA, luego Control + Enter. c:Ir' Después de esto se da la orden ALT
+ A, ésta permite
introducir otra categoría; en este caso bajo Code el valor 2 y en Label BELEN y posteriormente Control + Enter. Para la siguiente ciudad se escribe ALT + A, bajo Code el valor 3 y en Label BETEl TI VA y luego Control + Enter. De igual forma se escriben el resto de las ciudades empleando las órdenes anteriores, siempre se recomienda llenar un último nivel con la posibilidad de SIN INFORMACIÓN, para aquellas preguntas que no tienen respuesta. Así la pantalla del Editor de Diccionario con la información referente a la primera variable se puede observar de esta forma
U.P. T.C. Duitama 1997
11
Captura de datos en IDAMS
II
2 porque en la segunda ventana. Code tiene máximo dos dígitos
h DT
n
1 CIUDAD
1
2
ttD1
l
para cambiar de ventana y digitar la siguiente variable, en este caso se oprime ALT + A y en Var se escribe 2; en Deseription la variable ÚL TIMO GRADO APROBADO, en Loe se anota el valor 4; en Wdth el ancho del campo es 1 (constan de un dígito los códigos de esta variable); en T se escribe el valor O y nuevamente Control + Enter , para que se acepten los valores que se dieron a cada campo.
"D2
0
Gráfico 4.1 EDITOR DE DICCIONARIO. Almacenamiento del diccionario.
Esto significará que al introducir los datos de la encuesta, en lugar de teclear el nombre de cada ciudad , nos referiremos a ella por su código . Lo anterior se graba con A LT + S y se escribe el nombre del arch ivo como sigue : Fil e: ENCUESTA.D/C, y luego se pulsa Enter. Esto le aparecerá en su pantalla
r:¡r
NOTA: En la segunda variable, bajo Loe el valor es 4 porque el tamaño de la variable anterior es 2 y entre cada variable se deja un espacio y así la segunda variable ocupará el cuarto lugar. Para el resto de las variables el valor de la posición corresponde a la suma de la posición y el ancho del campo de la , variable inmediatamente anterior más dos. ~ ......."",~- .......
Posteriormente se cambia de ventana con ALT + B y luego oprime ALT + E para escribi r en Code el valor 1; en el campo Label se escribe GRADO UNDÉCIMO, luego Control + Enter.
r:¡r Nombre del archivo y la extensión .Dle que hace referencia al dlcclonarfo. I
Fi le :
I
-
-
! r. ~ J:l l( ol~ h~ l .
•
Ese
.,
iié:;"l l
Después ALT + A para introducir otro nivel; en este caso bajo Code el valor 2 y en Label GRADO DÉCIMO Y posteriormente Control + Enter. Se repiten las órdenes anteriores en el último nivel con la posib ilidad de SIN INFO RMACIÓN.
r:¡r
Gráfico 4.2 GRABAR EL DICCIONARIO
Nuevamente se oprime ALT + B U.P. T.C. Duftama 1997
I
12
Captura de datos en IDAMS
El usuario puede introducir el resto de variables junto con sus categorías en el diccionario siguiendo los pasos descritos atrás. Si usted no terminó de almacenar el diccionario y salió de IDAMS , para retomar nuevamente el trabajo, entre a IDAMS seleccione Dictionary después oprima Enter; luego seleccione la opción Update para llamar un diccionario ya creado y oprima Enter; con las flechas del cursor escoja ENCUESTA.DIC y pulse Enter:
'.U'ílli·'·6'O:·M'@I'mn rC: 'IDRt1S-
~~AW';W·J
3 1
Gráfico 4.4 BARRA DE ÓRDENES
1 ALT + E = Edit: Permite llenar cada uno de los campos del diccionario, como es el caso de escribir el nombre de la variable y los valores respectivos a localización, ancho del campo, tipo de variable , etc.
=
SOCIO.DIC ENCUESTR.DIC
t.
PgUp. 9 • Nau g4 ion ~ey elect: curPently highlited H e s Bl e c t i n <CHRHGE Dr~> w111 A t fo a ne directory . ~. Ente~
Gráfico 4.3 SELECCIÓN DEL DICCIONARIO
De esta forma se presenta el diccionario que se estaba almacenando, para introducir el resto de las variables utilice las órdenes que ya se mencionaron. Para almacenar el Diccionario el usuario tiene la posibilidad de observar las órdenes anteriores en la parte baja de la pantalla del Editor de Diccionario, las cuales sirven en el almacenamiento de cualquier diccionario . Otras órdenes son:
2 AL T + B Change Window: Con esta instrucción se cambia de ventana, únicamente después de la orden Co nt rol + Enter.
=
3 ALT + I Ins Before: Sirve para insertar una variable antes de otra. 4 ESC = Quit: El oprimir esta tecla después de la orden Cont ro l + Enter permite salir de todas las pantallas de IDAMS . Si usted no ha grabado las variables que está almacenando en el diccionario, al dar esta orden aparecerá:
not sauBd for but e r 1 ant o los e c nges?
Gráfico 4.5 MENSAJE PARA GUARDAR CAMBIOS
U.P.T.C. Duitama 1997
13
Captura de datos en IDAMS
Para no perder lo almacenado usted da la orden NO, y luego graba . Si después de grabar presiona la tecla ESC, automáticamente aparece la pantalla anterior (la correspondiente al gráfico 3.2).
..(f Shift Tab: Ir al campo anterior. ..(f Con t rol + Ini c io : Ir al primer campo. ..(f Con t rol + Fin : Ir al último campo. ..(f Control + Enter: Aceptar la línea .
=
5 F10 Menú: Se activa la barra menú, donde se encuentra File y Edit (ubicados en la parte superior de la pantalla Editor de Diccionario).
=
6 F1 Help: Con esta tecla se va al menú de ayuda .
=
7 ALT + S Save: Se emplea para grabar el diccionario que se está almacenando.
..(f Ese: Salir de la línea donde se encuentra el cursor. ..(f ALT + K: Borra todo lo que hay en un campo.
t
I
8 A LT + D = Delete: Se utiliza para borrar una variable o un espacio en blanco, esta solo se puede utilizar cuando en el diccionario se ha dado la orden Control + Enter.
I
2 UI.1 ltO GRADO AP J SEXO .. PREPEIlEHCI A UNO 5 PREPEREMCIA DOS 6 DEDI CACI OH UNO ? DEDICACIOH DOS 8 CURSARlA OTRO CICLO
9 ALT + A = Add After: Cuando se desea adicionar una nueva variable.
CURIOSIDADES 2
Gráfico 4.6 EDITOR DE DICCIONARIO. Diccionario ya almacenado.
Otras órdenes adicionales y el gráfico 4.6 le pueden ser muy útiles . Estas solo se activan una vez se oprime ALT + E, las cuales permiten desplazarse en la línea que se está almacenando. ..(f Enter: Ir un campo hacia adelante. ..(f Tab: Al oprimir esta tecla el cursor va un campo hacia adelante.
Es importante tener en cuenta que NO SE DEBE DEJAR espacios (líneas en blanco) dentro de las ventanas, pues a veces se crean al adicionar una nueva variable; dichos espacios impiden llenar el diccionario que se creó. Siempre hay que verificar lo anterior al realizar cada cambio de ventana .
U.P. T.C. Duitama 1997
14
Captura de datos en IDAMS
~
na vez almacenado el diccionario con todas las variables que presente la encuesta , se graba nuevamente ALT + S, IDAMS le preguntará:
Gráfico 5.1 CONTINUAR GRABANDO EN IDAMS.
Para la primera pregunta usted oprime Ente r; para la segunda selecciona Ves, con lo cual escogió sobreescribir los últimos valores dados a los campos . De esta forma el diccionario está listo para introducir los valores. Ahora usted pulse ESC y asi retorna a la pantalla del Edito r de Diccionario; nuevamente ESC y se encontrará en el Menú Principal; allí seleccione DATA y luego oprima Enter, ahora aparecerá en la pantalla la ventana para seleccionar el diccionario, en este caso ENCUESTA.D/C, y luego oprima Ente r.
Posteriormente se presenta la ventana con el IDAMS DATA EDITOR; para que usted pueda introducir los códigos que dio a las categorías de las variables en la encuesta, debe oprimir ALT + E. Los códigos que se emplean son los que aparecen en la página 6 donde se preparó el diccionario. Así por ejemplo si la encuesta pertenece a la CIUDAD de DUlTAMA (primera variable y primera categoría), escriba el valor 1 y oprima Enter; (después de anotar el valor a cada variable pulse esta tecla para pasar al siguiente campo); si el ÚL TIMO GRADO aprobado fue DÉCIMO escriba 2; y si en la pregunta SEXO no respondieron oprima el valor 3; en la pregunta de PREFERENCIA 1 Y 2, si el número 1 está en TEC. SISTEMAS anote el valor 6 (así está dando el valor a la variable 4, categoría 6, que almacenó en el diccionario) y, si el número 2 está en TEC. EN INFORMÁ TICA DIGITAL, escriba el valor 1 (que corresponde a la variable 5, categoría 1). De igual manera se procede para llenar el resto de variables almacenadas. Una vez terminada la última pregunta de la encuesta se da la orden Co ntrol + Enter para aceptar este registro. Recuerde que un registro es la información que proporciona una encuesta.
Mldij'i,¡ia·i'Wflm1 i ii h
f. l .
sUPo Ps
• N. u
• 'pn
ya
E.. ~e" ee cte e ......... ly h hlited f e sale tin <CHANe DI > wl1 proRpt f o r a new dir o c or .
Gráfico 5.2
Para escribir los valores correspondientes a la segunda encuesta, oprima AL T + A y utilice el mismo procedimiento para anotar el valor de cada variable. Una vez se lleven varios datos introducidos al diccionario, la pantalla se presentará de la forma como sigue a continuación :
SELECCiÓN DEL DICCIONARIO UNA VEZ YA ALMACENADO.
U.P.T.C. Duitama 1997
15
Captura de datos en IDAMS
allí pulse Enter ; se presenta una ventana con cuatro opciones: Case
Ul U2 U3 U4 U5 U6 U? U8
LOS -DATOS SE PUEDEN
8? 111 2
1 2 3
IH lt2 2 I? 11'I 2
It? 8? It? 15 15 8? It? 15
4
5 6 ? 8 9 111 11 12
IH lt2 IH lIS 113 lIS 1M
13
VER COMO UN ARREGLO RECTAN GULAR,
lJ2 2 11'I 2 8.1 2 lt2 2 lt2 2
DONDE LAS FIlAS REPRESENTAN LOS RE6ISTROS y LAS COLUMNAS SON LAS VARIABLES .
2 2 2 2 2
Il 12 2
Gráfico 5.3 INTRODUCCiÓN DE LOS DATOS AL DICCIONARIO.
Code Checking: Revisa que el valor anotado en la variable, corresponda al código que se almacenó en el diccionario. Por ejemplo si en la variable SEXO se anotó el valor 9, IDAMS muestra un mensaje de error, pues el mayor valor para esta variable es 3, el cual corresponde a SIN INFORMACIÓN.
(jf;F
Append Cases: Adiciona automáticamente un nuevo caso, esta opción se utiliza para sustituir la orden ALT + A.
FORMAS RÁPIDAS Para evitar que el usuario esté pulsando la tecla Enter cada vez que quiere introducir un valor a cada campo, y oprimir Co ntrol + Enter para aceptar un caso, IDAMS presenta unas ayudas rápidas así:
Auto skip: Permite ir al campo siguiente en forma automática, este se utiliza para reemplazar la tecla Enter o la tecla Tab.
(jf;F
Zero - FiII : se utiliza para completar con ceros a la izquierda en valores que solo tienen un dígito, dependiendo del tamaño del código; por ejemplo en las variables uno, cuatro y cinco, donde el ancho del campo es dos así:
(jf;F Case
821
81 2 852 8'1 2 IH 1 86 1 liI82 8'11
!!n
1 2 J ]
Z
~
114 115 04 115 111
II? 03 iJJ 11] 116
2 1 1 1 4
~ ~ ~
1 1 2 1 1
~
Gráfico 5.4 FORMAS RÁPIDAS EN LA INTRODUCCiÓN DE LOS DATOS Y VENTANA DE AYUDA.
Antes de introducir cualquier valor al Diccionario, oprima la tecla F10 o después de pulsar Control + Enter la cual lo lleva a la barra Menú, con las flechas del cursor vaya hasta Option y
Gráfico 5.5 EMPLEO DE LA OPCION ZERO - FILL
U.P.T.C. Duitama 1997
16
Captura de datos en IDAMS
El usuario escogerá las opciones que considere más convenientes; para esto utilice las flechas del cursor, así aparece
CURIOSIDADES 3
iluminada la opción donde se encuentre
Hay órdenes que se activan después de
éste, y para activarla se oprime Enter;
oprimir ALT + E, estas son:
después de realizar la elección se pulsa ESC hasta que Option se desactive. De esta manera usted oprime AL T + E y ya puede
continuar
introduciendo
los
valores de las variables. Recuerde que debe grabar continuamente el trabajo, esta orden solo se activa después de haber pulsado Co nt ro l + Ente r; luego oprima AL T + S y la pantalla mostrará:
..
l!lI
Nombre del archivo y la extensión .DA T que hace referencia a los datos
.<JI
F1: Al estar en el campo de cualquier variable y pulsar esta tecla, automáticamente se despliega una ventana donde se muestra el Code y el Label de la misma.
.<JI
ESC: Se utiliza para abandonar un
registro, es decir perder toda la información que proporcione una encuesta.
.<JI
Co ntrol + Enter: registro.
Aceptar un
y después de dar la orden anterior se 01
J
Gráfico 5.6 GRABAR U\ INTRODUCCiÓN DE LOS DATOS.
y escriba el nombre del archivo pero con extensión .DAT luego Enter. Si el usuario no terminó de llenar el diccionario y salió de IDAMS , para retomar nuevamente el trabajo, entre a IDAMS seleccione DATA después oprima Ente r; elija ENCUESTA.DIC (que corresponde al diccionario que se preparó) y pulse Enter. Ahora en la pantalla se muestra el diccionario, para recuperar el trabajo antes realizado se oprime ALT + L.
puede emplear:
.<JI
F2: Para salir temporalmente de IDAMS y ejecutar cualquier otro programa; si desea regresar nuevamente a IDAMS escriba EXIT y oprima Enter.
.<JI
ESC: Para abandonar el IDAMS DATA EDITOR Y regresar al Menú Principal.
.<JI
Además usted puede utilizar todas
las órdenes de CURIOSIDADES 2, para desplazarse en el registro que está almacenando.
U.P .T.C . Duitama 1997
17
Captura de datos en IDAM5
PREPARACiÓN DEL DICCIONARIO PARA EL SEGUNDO TIPO DE PREGUNTAS Como se mencionó en el capítulo 1, una forma alternativa de CAPTURAR LOS DATOS en IDAMS, es utilizando otro tipo de preguntas, que contengan variables del siguiente estilo:
SEXO ESTATURA PESO TALLA PANTALÓN TALLA CAMISA NÚMERO DE CALZADO EDAD En este caso no hay que marcar opciones para cada pregunta, el encuestado tiene la posibilidad de contestar dichas preguntas sin ninguna restricción , escribiendo el valor correspondiente. La preparación del Diccionario se realiza de la siguiente forma: el número de variables dependerá del total de preguntas en la encuesta como ya se mencionó, en este caso se observan seis (6) variables:
1. SEXO : Como en el ejemplo anterior se categorizó, en este caso se utiliza directamente las letras F o M sin necesidad de asignar un código a cada categoría. 2. ESTA TURA : Esta variable se expresa en metros, con dos cifras decimales.
3. PESO : Para esta variable se trabajan las unidades en kilos .
4. TALLA PANTALÓN : El encuestado puede contestar con cualquiera de las tallas existentes.
5. TALLA CAMISA :
Se emplean las letras de las tallas S, M, L o XL .
6. NÚMERO DE CALZADO : Al igual que en la variable cuatro (4), cualquiera de los números existentes.
7. EDAD : En este caso se escribirá el número de años cumplidos. En la selección de las variables anteriores se puede notar que NO HAY NECESIDAD DE ESPECIFICAR simplemente en la CATEGORíAS, INTRODUCCiÓN DE LOS DATOS se escribirá el respectivo valor. Para la CREACiÓN DEL DICCIONARIO se siguen las ordenes que se dieron en el capitulo 3, tenga presente que cuando esté en la pantalla DESCRIPCiÓN DEL (gráfico 3.3), se DICCIONARIO recomendó adicionar una o más variables al total que resulten , ya que puede surgir una variable que no se tuvo en cuenta.
Para ALMACENAR EL DICCIONARIO cuando se encuentre en la pantalla Editor de Diccionario , siga las instrucciones que se dan en el capítulo 4, página 10. El diccionario ya almacenado se muestra de la siguiente manera: I
U.P.T.C.
Duitama 1997
18
Captura de datos en IDAMS
1
2 ESTATUM J
mo
1 TALLA PAKTALON 5 TALLA CllnlSA 6CllLZllDO 1 EDAD
J 9
Los demás campos se llenaron siguiendo las instrucciones del capítulo 4. En esta ocasión el diccionario se almacenó con el nombre MUESTRA.DIC.
lJ
11 21 25
Gráfico 5.7 EDITOR DE DICCIONARIO.
Los datos se introducen tal como se hizo en el ejemplo anterior. Algunos de ellos se pueden observar en la pantalla:
2
J 4 5 6
?
8 9 111 11
En la variable SEXO , el campo correspondiente a T el valor es 1, porque el tipo de variable es alfabética. En la variable ESTATURA, el ancho del campo (w dt h) es 4, porque tiene un número entero, el punto decimal y las dos cifras decimales ; en el campo D se anota el valor dos debido a las dos cifras. Para la variable TALLA CAMISA, en el campo T nuevamente el número 1.
12 lJ 14
Gráfico 5.8 INTRODUCCiÓN DE LOS DATOS AL DICCIONARIO.
El archivo que contiene los valores de estas variables se llama MUESTRA. DA T.
U.P.T.C. Duitama 1997
20
Procesamiento de la Información
LI
I
a sigla SAS viene de Statistlcal Analysis System que traduce - - Sistema de Análisis Estadístico , este es un sistema de computación para análisis de datos, útil para toda clase de ellos: experimentales de las ciencias físicas; datos de la ciencia social ; datos mercantiles; datos agrícolas ; datos mercadotécnicos. No está orientado a ninguna área en particular . El SAS no enseña estadísticas. Aunque SAS es una importante herramienta estadística, la explicación de los conceptos de sus resultados estadísticos no son el propósito de este.
Sistema
de
computación:
Un sistema de computación es un grupo de programas para computadoras que funcionan conjuntamente.
Datos:
Los valores de los datos son letras o números que representan información.
Análisis: Después que la información ha sido recolectada, se está listo para el análisis de los datos, chequeando primero si hay errores en los mismos. Una vez realizado lo anterior, se sigue con el procesamiento de la información que desea de las encuestas . Hay que tener una idea clara de lo que representan los datos; el valor del dato es una medida sencilla , puede representar el sexo, la edad, la talla de una persona , el año escolar , etc. Una
observación es un conjunto de datos para el mismo individuo, lo que en el paquete IDAMS se llamó un registro y corresponde a la información suministrada por una encuesta. También es importante recordar que una variable es un conjunto de valores para la misma medida , por ejemplo las edades, estudios realizados, el sexo etc. Usted le da a cada variable un nombre, el cual usará para describrirle la variable a SAS. El nombre puede contener de uno a ocho caracteres . Puede contener números , pero debe empezar con una letra (por ejemplo V1, V2, V3) . Para entrar en SAS se da la orden C:\CD SAS y luego se oprime la tecla Enter; después se da nuevamente la orden SAS y se oprime Enter si se trabaja en modo DOS, o activando el icono respectivo bajo WINDOWS. Después de realizar la instrucción anterior, aparecerán en la pantalla de su ordenador tres ventanas, a través de las cuales se trabajan los programas así: La primera llamada PROGRAM EDITOR ,
Gráfico 6.1 TRES VENTANAS QUE APARECEN AL ENTRAR ASAS.
U.P.T.C. Duitama 1997
21
Procesamiento de fa Información
la cual le permite al usuario digitar los programas que utilizará para procesar la información de las encuestas o la base de datos que tenga. La segunda es LOG de lógica. En esta aparecen en secuencia las órdenes digitadas en el PROGRAM EDITOR ; el usuario tiene la facilidad de corregir el programa si cometió algún error, pues ella mostrará todos los posibles errores que se pudieron llevar a cabo durante la ejecución del programa, estos aparecerán subrayados.
y la tercera ventana es la llamada OUTPUT , esta presenta todos resultados después de correr programas, es decir muestra información ya procesada.
los los la
Para poder trabajar en estas ventanas es necesario conocer la utilidad de ciertas teclas como estas: F1: muestra la ventana de ayuda, la cual presenta las palabras que se pueden emplear en los diferentes procedimientos; si desea conocer más sobre cualquier procedimiento se escribe el nombre de éste en la línea comando y Enter.
r::¡j=>
F2: Abre la ventana que contiene teclas de ayuda y formas rápidas para trabajar en SAS .
r::¡j=>
F3: con ella se desplaza el usuario a la ventana LOG .
CiT"
F4: permite desplazarse a la ventana OUTPUT .
r::¡j=>
F5: con esta tecla el usuario puede transitar a través de las ventanas abiertas.
r::¡j=>
F6: permite desplazarse a la ventana PROGRAM EDITOR. F7: amplía la ventana donde está ubicado el cursor.
r::¡j=>
F8: línea.
r::¡j=>
se emplea para borrar una
SHIFT + F8: con esta orden el cursor se desplaza una pantalla a la derecha.
r::¡j=>
SHIFT + F9: renglón el texto.
r::¡j=>
SHIFT + F10: por renglón.
r::¡j=>
sube renglón por
baja el texto renglón
F9: recupera en la ventana de PROGRAM EDITOR el programa que se está ejecutando.
r::¡j=>
F10: corre el programa que se digitó en la ventana PROGRAM EDITOR , además permite cerrar las demás ventanas que estén abiertas, excepto las ventanas LOG y OUTPUT .
r::¡j=>
Es importante saber grabar un archivo en SAS . Para esto usted necesita conocer que hay tres tipos de archivos: aquellos donde se graban las instrucciones de los programas que se van a ejecutar; otros donde se guarda la información ya procesada, y los que guarda U.P.T.C. Duitama 1997
22
Procesamiento de la Informaci6n
automáticamente el SAS . El nombre de cada archivo debe constar máximo de ocho caracteres.
Archivos que contienen los programas: Todos estos se sugieren guardar con la extensión .PRG; para poder grabar los programas el cursor debe estar en la ventana PROGRAM EDITOR , pulse la tecla inicio (para ir a la línea de comando) y escriba la orden: FILE '[ Nombre del archivo.PRG]', luego oprima Enter. En lo posible el nombre del archivo debe describir el trabajo que se está realizando. Esta orden también sirve para grabar los programas en un disquete así: FILE ' Nombre de la unidad : Nombre del archivo.PRG' .
Archivos que contienen los resultados : Es decir la información ya procesada; para grabar dichos resultados, el cursor debe estar ubicado en la pantalla OUTPUT , luego se pulsa la tecla inicio y se escribe la orden anterior, solo que en ésta se sugiere la extensión .RES y luego oprimir Enter. Así .RES hace referencia a los resultados. Al igual que en el caso anterior usted puede grabar dichos resultados en el disquete, empleando la misma orden.
grabar el diccionario ALMACENADO en IDAMS, junto con el DATA conservando cada uno su Extensión. De aquí en adelante se trabajarán todos los programas de SAS para procesar la información desde este directorio. Se
puede
guardar
el
archivo
que
contiene los resultados sin necesidad de grabar previamente el archivo con los programas. Si usted desea recuperar un programa, la información ya procesada o una base de datos, primero debe ubicar el cursor en la ventana PROGRAM EDITOR , después oprimir la tecla inicio para ir a la línea de comando (command) y luego utilizar la orden: INC '
e :Nombre del archivo.Extensión ,
y luego Enter. Si se desea salir temporalmente del SAS para ejecutar algún otro programa, el cursor
debe
estar
en
la
ventana
PROGRAM EDITOR, en la línea de comando se escribe la letra X y después se
pulsa
Ente r.
Si
se
salió
temporalmente del SAS y se desea regresar se escribe la palabra EXIT y luego se oprime Enter.
Crear un directorio de archivos : Es recomendable crear dentro de SAS un Archivos, que directorio llamado contendrá los archivos de datos y los programas que contienen las instrucciones a ejecutar en el procesamiento de la información. Dentro de este directorio conviene entonces
Toda tarea de SAS está formada por declaraciones; las declaraciones le piden a SAS que ejecute algunas actividades. La primera palabra de una declaración le indica a SAS cuál
actividad se está
interesado en ejecutar (por ejemplo crear U.P.T.C. Duitama 1997
23
Procesamiento de la Información
un archivo de datos SAS, imprimir una linea de datos), en el resto de la declaración se da más información sobre la forma como se desea que la actividad
efe
se ejecute (qué nombre darle al archivo de datos, cómo ordenar la línea que desea imprimir). Cada declaración se finaliza con PUNTO Y COMA. El primer paso a seguir en cualquier tarea de SAS es la creación de un archivo de datos , el cual se entiende como una colección de datos formada de varias observaciones, cada una incluyendo muchas variables, también se le conoce como conjuntos de datos. Para esto se dispone de las siguientes declaraciones:
efe DATA:
Esta declaración comienza con la palabra DATA, le indica a SAS que origine un nuevo archivo de datos; después se escribe el nombre que se ha escogido para el archivo que se está creando ; puede seleccionar el nombre que desee para su archivo mientras que este SEA MÁXIMO DE OCHO CARACTERES, además debe empezar con una letra; es más fácil de entender si selecciona un nombre que describa el archivo de datos . Esta declaración tiene la forma: DATA Nombre del archivo ;
Después
de
ésta
y
todas
INPUT : Usualmente sigue a la declaración DATA, le indica a SAS cómo están ordenados los valores de los datos y cuáles son los nombres de las variables. Se escribe primero INPUT y luego se eligen los nombres de las variables, las cuales deben iniciar con letras y NO DEBEN tener más de ocho caracteres y tampoco incluir puntos, comas o guiones. Si los valores contiene letras , la variable es alfabética y se escribe el signo pesos ($) después del nombre de la variable (por ejemplo el nombre de las personas, o una letra que puede significar el género al que pertenece una persona como F o M). Escriba los nombres de las variables dejando un espacio entre ellas, y al final el símbolo arroba (@), este símbolo permite al usuario determinar el tamaño de cada variable cuando esté introduciendo los valores de dichas variables . La forma de esta declaración es: INPUT Nombre de las variables ;
efe
CAROS : Esta es la última declaración en el procedimiento de creación de un archivo, indica que los datos siguen inmediatamente. Los datos tienen un máximo de longitud de 80 columnas. Solamente una declaración CAROS puede ser usada con una declaración DATA. La forma que tiene es:
las
declaraciones al final de línea SIEMPRE SE ESCRIBE PUNTO Y COMA.
CAROS; Línea de datos
U.P.T.C. Duitama 1997
24
Procesamiento de la Información
Con estas declaraciones ya se está listo para crear el archivo de datos. A las declaraciones DATA , INPUT Y CAROS
se
les
conoce
con
el
nombre de paso DATA. Para lograr observar los valores de los datos, el nombre de las variables y en general cuántas observaciones se tienen, se utiliza la declaración PROC PRINT y posteriormente la declaración RUN .
PROCEDIMIENTOS EN SAS
Gráfico 6.2 ELEMENTOS QUE CONFORMAN UN PASO PROC.
Una vez se haya creado un archivo de datos , estará listo para usar los procedim ientos que analizan o procesan los archivos. Los procedimientos son programas que leen el archivo de datos, ejecutan varias operaciones e imprimen sus resultados. Las declaraciones que le indican a SAS que procese un archivo de
Los procedimientos que se van a utilizar en este manual son :
+
El primer paso a seguir después de colocar los datos PROC PRINT :
datos forman un paso PROC .
en un archivo de SAS es su impresión. De esta manera se puede
Los pasos DATA y PROC toman su nombre de las declaraciones DATA y PROC (la forma abreviada de escribir PROCEDURE = PROCEDIMIENTO), las cuales inician los pasos.
verificar si los datos fueron leídos
El paso PROC siempre comienza con la declaración PROC , indicando el nombre del
procedimiento
a
ejecutar.
correctamente y a la vez chequear si hay
errores .
SAS
imprime
los
resultados a manera de un informe. Esta declaración permite la reorganización de los valores de los datos, cuando no requiera una prueba estadística.
Los
elementos que lo conforman son: el
Después de usar un paso DATA para
nombre del procedimiento, las opciones y
colocar sus valores dentro de un archivo
finalmente las utilidades si se requieren.
de datos, puede imprimir los valores de los datos en una forma fácil de leer con
Estos elementos se pueden observar en
la declaración
la ventana de ayuda, así: PROC PRINT; . U.P.T.C. Duitama 1997
25
Procesamiento de la Información
El uso de la declaración escrita del modo
orden, para lo cual se trabaja con la
anterior, imprime el archivo de datos
utilidad VAR del modo siguiente:
creado recientemente. Cada
procedimiento
tiene
múltiples
opciones y utilidades.
A manera de
ejemplo,
las
obsérvense
continuación
se
PROC PRINT; VAR Nombre de las variables ;
que
a
con
el
presentan
Esta declaración se puede combinar con otros procedimientos como se ilustrará más adelante.
procedimiento PRINT :
+ Si desea imprimir otro archivo de datos, se puede emplear la opción DATA= y a continuación el nombre del archivo, así:
PROC PRINT DATA=Nombre del archivo ; Esta declaración tiene la utilidad de colocar hasta 10 títulos en las páginas de su informe. Por ejemplo:
PROC PRINT ; TITLE ' Título del informe • ; También se pueden usar varios títulos aplicando el siguiente formato:
PROC PRINT; TITLE ' primer título • ; TITLE5 ' tercer título ' ; el
formato
aparecerán
anterior
los
respectivamente
Clasificar es reordenar las observaciones en el archivo de datos en una forma determinada. Para clasificar los datos, se utiliza la declaración PROC SORT seguida de la utilidad BY que indique las variables a ser clasificadas, como se muestra en el formato:
PROC SORT DATA=Nombre del archivo ; BY Variables a clasificar ;
TITLE3 ' segundo título • ;
Con
PROC SORT : El orden de las observaciones de datos no es tan importante para ciertos procedimientos estadísticos, como es el caso del promedio. Sin embargo, en algunas ocasiones se desea clasificar las observaciones en un orden específico, por ejemplo, para el estudio de edad - peso, obtener primero la información de las mujeres y luego la información sobre los hombres.
títulos en
la
Con ello SAS reorganiza el archivo en el orden de las variables indicadas en la
primera, tercera y quinta línea.
utilidad
Hasta el momento, con esta declaración
reorganizado en el mismo lugar y con el
se han impreso las variables en el mismo
mismo nombre de donde fue leído.
orden en que estaban originalmente en el
versión
archivo de datos ;
pero se pueden
BY ,
no
y
escribe
clasificada
el
del
archivo La
archivo
desaparece.
seleccionar para que aparezcan en cierto U.P.T.C. Duitama 1997
26
Procesamiento de 18 Información
Para no alterar la versión original no clasificada, se acude a la opción
OUT=
en la declaración PROC SORT , creando de esta manera un archivo con la versión clasificada. De la siguiente forma:
Usted también puede obtener la frecuencia para las variables que sean de su mayor interés . Para esto indique los nombres de las variables después de la utilidad TABLES, si por ejemplo se tienen las variables V1, V2 y V3 la orden queda de la siguiente manera:
PROC SORT DATA= Nombre del archivo de datos original OUT=Nom bre del nuevo archivo ; BY Variables a clasificar ; PROC SORT no imprime ningún procedimiento de salida, aunque imprime un informe en el registro permanente de SAS, indicando cuánta memoria y tiempo es usado y cuántas observaciones contiene el archivo de datos clasificado.
+
PROC FREQ : Esta declaración se emplea para obtener las frecuencias de las variables . Las tablas de frecuencias muestran la distribución de los valores de una variable; se puede apreciar cuántas observaciones
PROC FREQ; TABLES V1 V3 ; Se pueden separar los datos aún más con tablas de tabulación cruzada, las cuales muestran la distribución de los valores para dos o más variables ; para obtener una tabla de tabulación cruzada , se emplea la declaración PROC FREQ seguida de la utilidad TABLES, se indica primero la variable que desea en el lado inferior de la tabla, luego un asterisco (*) y después la variables que desea en la parte superior, por ejemplo si se quiere una tabla con las variables V1 y V2 la orden se escribe : PROC FREQ; TABLES V1*V2 ;
en el archivo de datos contienen un valor asignado . Para obtener tablas de frecuencias para todas las variables en el archivo de datos de más reciente creación, se usa simplemente una declaración así:
Puede pedir tantas tablas como desee en una sola utilidad TABLES , si usted tiene las variables V1, V2, V3, V4, V5 y V6 puede escribir PROC FREQ; TABLES V1*V4 V2*V5 V3*V6 ;
PROC FREQ; Si desea usar otro archivo de datos, use la opción
DATA=
en la declaración
PROC FREQ de la siguiente forma PROC FREQ DATA= Nom bre del archivo de datos;
para producir de esta manera tres tablas de tabulación cruzada. Para
tabular
cruzada mente
tres
variables , se conectan los tres nombres de las variables con asteriscos :
U.P.T.C. Duitama 1997
27
Procesamiento de la Información
PROC FREQ; TABLES V1*V4*V5 ;
previamente clasificados; por lo tanto usted necesitará usar antes PROC SORT :
Significa que se elabora una tabla de dos entradas: de la segunda y tercera variable, para cada categoría de la primera variable.
PROC SORT DATA= Nom bre del archivo de datos ; BY Nombre de la variable a clasificar; PROC MEANS; BY nuevamente el nombre de la variable a clasificar ; VAR Nombre de otra variable a comparar ;
4ft PROC
MEANS: Se utiliza para computar la media ó promedio, incluyendo el número de observaciones, el mínimo y el máximo, la media y la desviación estándar. Para obtener estadísticas para todas las variables en el último archivo de datos creado, se usa: PROC MEANS;
Si lo que se quiere es obtener estadísticas para otro archivo de datos, se emplea la opción DATA= como sigue:
Se puede separar los subgrupos aún más usando dos o más variables en la declaración BY, habiéndolas ordenado todas en esa misma forma.
.y. RUN:
Con esta declaración se corre el programa para que aparezcan los datos en la ventana OUTPUT.
PROC MEANS DATA= Nom bre del archivo de datos ; De igual forma permite obtener los promedios de algunas variables específicas dependiendo de la necesidad del usuario, para esto se emplea la utilidad VAR y enseguida el nombre de las variables a las cuales usted desea hallar el promedio, por ejemplo si se tienen las variables V1, V2 y V3 entonces la orden será:
PROC MEANS; VAR V2 V3 ; Si se desea procesar los datos en subconjuntos, se recurre a la utilidad BY , siempre y cuando los datos estén
Una forma de crear un archivo permanente en SAS es utilizando la declaración L1BNAME. Veamos en que consiste:
4ft
L1BNAME: La declaración L1BNAME define un camino, que contiene usualmente un directorio para ser usado en SAS . Si usted quiere crear un archivo permanente en SAS, debe definir el camino para ser utilizado en una declaración L1BNAME.
La declaración L1BNAME evita que en la pantalla PROGRAM EDITOR aparezcan U.P.T.C. Duitama 1997
28
Procesamiento de la Información
todos los datos en la ejecución del programa. Es de gran utilidad porque en la mayoría de los casos el volumen de datos es muy grande. El uso de la declaración L1BNAME junto con un procedimiento DATA, crea archivos de datos en SAS .
Tales archivos los guarda automáticamente el SAS en el directorio que se definió, con extensión SSO. Con esta declaración no hay necesidad de guardar las instrucciones para crear el archivo de datos con la orden FILE.
U.P.T.C. Duitama 1997
29
Procesamiento de la Información
De aquí en adelante se emplearán colores diferentes para las ventanas del 5A5. Si usted desea cambiar el color a alas ventanas, vea (Página 31).
CURIOSIDADES 1
ocurrió presentando mensajes subrayados y en otro color. Una vez culminado correctamente el programa, puede verificar en la ventana OUTPUT el total de datos de su archivo dataset elaborado en IDAM5. La pantalla mostrará
Ahora vamos a dar las instrucciones para procesar la información. Lo primero que debe realizarse en cualquier tarea del 5A5 es llevar a cabo la ejecución del programa que origina un nuevo archivo de datos, para la creación de este archivo se emplea el paso DATA .
2'13 1l"M
~
2.71
211
R?'1
al
2 282 21 %1
Para esto entre a 5A5, luego oprima Enter para ir a la primera línea y después digite el siguiente programa:
Gráfico 6.4 RESULTADOS QUE PERMITEN OBSERVAR LAS VARIABLES Y SUS DATOS.
j'kOGRAtl h1JI fOR
Después de CAROS. se escribe en la líne a com ando la orden INC' '. Con esto se recu peran los datos almacenados para su procesamiento. 221!l1 1 2 01 1 2 01
0b 08
121 1 3 1 1 2 1
2 2
12 12
1 1
~ ~
1 2
nM~
12 12
~
2 4
i
En este caso los datos estan recortados, para lograr ver la parte final del programa.
1 1
Gráfico 6.3 PROGRAMA PARA CREAR UN ARCHIVO DE DATOS.
Oprima la tecla F10 para correr el programa. Ahora pulse la tecla F3 para ir a la ventana LOG y F7 para ampliarla; al revisar su contenido usted puede chequear si se cometió algún error durante la ejecución del programa.
En este caso aparece una columna para enumerar las observaciones y en las columnas restantes el nombre para cada variable junto con los datos. En PROGRAM EDITOR pulse inicio y grabe el programa con extensión .PRG; como se recomendó en un
comienzo .
IIIL...
r-pROGRAM EDITOR:========== 11 FILE'C:\SAS\ARCHIUOS\TOTAL.PRG'
El programa le indicará qué tipo de error Gráfico 6.5 GRABAR UN PROGRAMA EN SAS.
U.P.T.C. Duitama 1997
30
Procesamiento de la Información
Con el fin de ahorrar tiempo se puede ,n'
evitar seguir la ruta indicada en el gráfico, trabajando directamente en el directorio
Archivos
de
la
siguiente
manera:
lU I
0001 lIBHAME PAZ 'C:\SAS\ARCHIUOS\'; 0002 0003 PRIC SORT DATA=PAZ.EHCUESTA OUT=PAZ.ClASE; ¡ 000,. BY SEXO; , 0005 I ; 0006 PROC PRIHT DATA=PAZ.ClASE; ! 0007 BY SEXO; ' 00000
,:
l ií ÍJ o o ~ RUH;
En PROGRAM EDITOR pulse inicio,
W!lI"
~
Escriba X y salga temporalmente, Entre al directorio Archivos,
Gráfico 6.6
Con EXIT retorne a SAS.
PROGRAMA PARA CLASIFICAR VARIABLES.
escribir
el
En la ventana OUTPUT los resultados
grabar
y
muestran la clasificación de las variables,
recuperar. Optaremos por emplear este
teniendo en cuenta primero a las mujeres
mecanismo en lo que resta del trabajo.
y luego a los hombres, así:
Así
en
nombre
adelante del
bastará
archivo
para
Como el archivo de datos incluye varios grupos diferentes, usted puede imprimir un listado por separado para cada grupo. Por ejemplo imprimir primero los datos para las mujeres y luego
para
los
hombres, empleando la orden: PROC PRINT; BY SEXO; Recuerde que antes de poder usar la utilidad
BY
(con
PROC
o
cualquier otro procedimiento SAS ), el archivo de datos debe estar previamente clasificado de acuerdo con las variables especificadas en la utilidad BY (es decir, separar las categorías que conforman la variable).
Para
esto
necesita
I
una
declaración PROC SORT antes de la
Gráfico 6.7 RESULTADOS DE LA CLASIFICACiÓN DE VARIABLES
declaración PROC PRINT; puede así ejecutar éste programa:
U.P.T.C. Duitama 1997
31
Procesamiento de la InformacIón
CURIOSIDADES 1
• •
Para modificar los colores en cada una de las ventanas, el usuario puede basarse en las siguientes instrucciones, para esto debe ubicar el cursor en la línea de comando y escribir:
•
TITLE: Títulos en OUTPUT . SOURCE: Números y declaraciones en LOG. NUMBERS:
Números
en
PROGRAM EDITOR.
Estos son los colores disponibles del programa :
COLOR Área Color Las áreas que permiten cambiar el color en todas las ventanas:
•
BACKGROUND: ventana.
•
BANNER: comando .
•
BORDER: La línea de borde y nombre de la ventana.
•
Fondo
de
la
Encabezado y línea de
COMMAND: Línea donde se graban y recuperan programas .
BLACK, -BLUE , BROWN - -CYAN , GRAY GREEN , MAGENTA, RED, , WHITE. Al elegir el color se escribirá la letra que aparece resaltada. Para que los colores elegidos permanezcan en SAS , ubique el cursor en la línea comando de cada ventana, escriba WSAVE y pulse Enter.
• MESSAGE: Línea de mensaje .
Las áreas que permiten cambiar el color en una ventana específica:
• DATA: Líneas de los datos en
OUTPUT . •
•
FOOTNOTES : Notas de pie de página en OUTPUT. HEADER:
Encabezados en
OUTPUT . •
TEXT:
Áreas de texto en
PROGRAM EDITOR.
Gráfico 6.8 PANTALLAS DE DIFERENTE COLOR PARA SAS.
U.P.T.C. Duitama 1997
32
Procesamiento de la Información
Existe una declaración que permite hallar este y otros procedimientos de una forma más breve, sin necesidad de traer siempre a la ventana PROGRAM EDITOR el archivo de datos.
na vez se tiene el DATA en este caso ENCUESTA, se puede hallar la frecuencia de cada variable . Para esto se adiciona al programa anterior la declaración PROC FREO , ésta puede escribirse después de PROC PRINT; como se indica en la ventana
U
Para esto se emplea la declaración L1BNAME, con la cual se crea un archivo de datos permanente en SAS y para esto hay que definir antes el directorio que va a ser usado con esta declaración. Como se indicó en un comienzo , el directorio con el cual se va a trabajar se llama Archivos; el programa que usted debe utilizar es :
o OB1 LIBHAME PAZ 'C:\SAS\ARCHIUOS\';
DI 12
1
Gráfico 7.1 PROGRAMA PARA OBTENER FRECUENCIAS PARA CADA VARIABLE .
Pulse F10 para correr el programa y obtener los resultados así:
01013 08 14 000 5 080 6 01 17 00 18 00019 0001 00011 00012 00013 002'0 00291 00292 002n 00294 00295 00296
DATA PAZ.ENCUESTA; INPUT CIUDAB GRADO SEXO PIEFER1 PREFER2 IEDICl DEDIC2 OUTPUT; CARIS; 1 2 2 1 1 2 1 1 2 1 1 1 1 2 1 1 1 2 1 2 1 1 2 2 ;
Bl 11 11 al 11 al 12 12
06 06 08 16 16 05 12 12
1 1 1 1 1 2 1 1
2 3 2 3 3 3 2 4
EL p~ rME ~ ?ROGR....-i1A DEBE 1.NCLU1.J? TODOS 05 OA7"OS. PA~A QUE' 5",5 LOS UA~D E ,""UTOMÁT 1.a-MEN T E CON E )(.T ~N5rÓN
.550 .
PRDC PRINT; RUN;
Gráfico 7.3 PROGRAMA PARA CREAR UN ARCHIVO DE DATOS PERMANENTE CON EL USO DE LA DECLARACiÓN L1BNAME.
En la primera línea se escribe la declaración L1BNAME seguida de un nombre para asociarlo con el directorio y la ruta donde se encontrará el archivo de datos . La segunda línea del programa contiene DATA TAREA.ENCUESTA; el DATA está conformado por dos partes, TAREA (llamado nombre de primer nivel) Gráfico 7.2 RESULTADOS DE LAS FRECUENCIAS PARA CADA VARIABLE.
U.P.T.C. Duitama 1997
33
Procesamiento de la Información
que hace referencia a la librería y ENCUESTA (nombre de segundo nivel) que identifica el archivo de datos.
programa que contiene todos los datos (gráfico 7.1).
También se escriben las declaraciones que acompañan a un paso DATA , como son: DATA , INPUT, CARDS , y las declaraciones PROC PRINT y RUN que permiten la aparición de los datos con sus respectivas variables en la ventana OUTPUT .
CURIOSIDADES 2 PROGRAI1 EDI OH=. and === 00001
p~
CUIlS~
AQ.V\
o!J
Como el archivo contiene todas las variables junto con los datos, al oprimir F10, SAS guarda automáticamente el archivo de datos ENCUESTA, colocándole extensión .SSO, sin necesidad de emplear la orden FILE para guardarlo. Si usted sale temporalmente de SAS puede verificar la extensión del archivo de datos.
FRECUENCIAS Y MEDIAS, FORMA CORTA De igual forma, se pueden hallar las frecuencias y las medias para cada variable utilizando la declaración L1BNAME. Solo necesitará el siguiente programa :
00006
Gráfico 7.5 AYUDA.
En la ventana de PROGRAM EDITOR ubicando el cursor sobre los números,
usted puede emplear cualquiera de las órdenes siguientes:
.(f 1#: Inserta el número de lineas que el usuario requiera , para esto en el símbolo # anote el valor específico y Enter.
.(f lA: 0901 LIBNA"E TAREA 'C='SAS'ARCHIUOS"; PROC FREQ DATA=TAREA.ENCUESTA;
Permite insertar una línea después de otra. Colocar lA y luego Enter. También puede emplear IA#.
B91!l2 8'1903
0004 '1985 8liI86
PROC "ERNS DRTA=TARER.ENCUESTA;
001rl
0908 RUN;
.(f lB: Insertar una línea antes de otra. Colocar la orden lB y luego Enter. De igual forma se puede emplear IB#.
.(f DD: Gráfico 7.4 PROGRAMA PARA OBTENER LA MEDIA Y LA FRECUENCIA EMPLEANDO LA DECLARACiÓN L1BNAME.
Se emplea para borrar un bloque. Escribe DD al comienzo y al final del bloque; luego Enter.
.(f Los resultados que obtiene para el programa de encontrar las frecuencias, son iguales a aquellos donde se utilizó el
CC: Sirve para copiar un bloque,
para esto escriba CC al comienzo y al final del bloque; luego se ubica el cursor en el lugar donde se desea
U.P.T.C. Duitama 1997
34
Procesamiento de la Información
copiar, se escribe la letra 8 y después Enter.
,(f
MM:
bloque,
Se utiliza para mover un para esto escriba
MM al
comienzo y al final del bloque. Ubique cursor sobre la línea de números que desee desplazarse y escriba la letra O, luego Enter.
1, lA o 18 y Enter. Esta instrucción se conserva activa mientras no finalice su 8A8 . Si desea sesión de desactivarla, escriba nuevamente sobre la línea de números MA8K y Enter, así le aparecerá el contenido, luego presione FIN. Tenga presente que cuando quiera desactivar esta orden , no se encuentre otro MA8K en la pantalla, de lo contrario no permitirá desactivarla.
,(f RR: Cuando se está interesado no en mover un bloque sino en repetirlo, escriba al inicio del bloque RR y al final del bloque RR# ; en el símbolo # anote el número de veces que desea repetir el bloque, después Enter.
,(f MA8K: En algunas ocasiones hay líneas que se repiten con frecuencia,
Las órdenes anteriores deben estar contenidas en su totalidad dentro de los números . Otras órdenes que le pueden ser útiles al oprimir las teclas siguientes :
<?
INICIO: El cursor se ubica en la línea de comando (Command) .
como es el caso de :
,(f FIN: Borra todo el contenido de la L1BNAME TAREA
-c :\SAS\ARCHIVOS\' ;
para evitar escribir siempre esta línea, usted escriba
puede guardarla , para esto MA8K sobre
la línea de
línea a la derecha donde se encuentre el cursor.
<?
ENTER: Al estar en cualquier ventana, permite desplazarse línea por línea hacia abajo.
números, Enter y luego el contenido: Existen órdenes que puede emplear en cualquier ventana en la línea de comando :
<? TOP : Se emplea para ubicar el cursor en la primera línea. Gráfico 7.6 USO DE LA ORDEN MASK.
Para que aparezca dicho contenido , cada vez que lo necesite , puede escribir cualquiera de estas opciones
<? 80T:
Se emplea para ubicar el cursor en la última línea del programa.
<?
END: Se emplea para cerrar las ventanas que estén abiertas.
U.P.T.C. Duitama 1997
35
Procesamiento de la Información
La forma en que se muestran los resultados, es de acuerdo al orden en que se almacenaron las variables y sus respectivas categorías en el IDAMS , pero se pueden ordenar las frecuencias, los porcentajes y las medias de manera descendente. Así solo necesitará emplear este programa:
COMPARACiÓN DE VARIABLES Muchas veces surge la necesidad de comparar las variables que se tienen en la encuesta y conocer a la vez el porcentaje. Para esto el SAS ofrece las declaraciones siguientes: PROC SORT , PROC FREQ y la utilidad TABLES. Se puede pensar que el usuario está interesado en conocer el porcentaje más alto de las personas que desean estudiar en la jornada diurna, cuál carrera tiene mayor preferencia, teniendo en cuenta el sexo y el último grado aprobado. Para esto utilice el siguiente programa:
80081 LIBNA"E TAREA 'C:'SAS'ARCHIUOS"; 88992 9i13
80001 PROC SORT
Gráfico 7.7 PROGRAMA PARA OBTENER VARIABLES ORDENÁNDOLAS POR SU FRECUENCIA
Los resultados que muestra SAS permiten identificar más rápidamente la variable que tiene el valor más alto, por ejemplo:
005 BY DE»1 ci ; 99096
DATA~TAREA.ENCUESTA
OUT~TAREA.ORDEN;
liI90li1? PROC FREQ DATA=TAREA.ORDEN; 9BO TABLES SEKO GRADO PREFER1; 80989 BY DED 1ci ; 80019 08011 RUN; 00012
Gráfico 7.9 PROGRAMA PARA COMPARAR TODAS LAS CATEGORIAS DE LAS VARIABLES.
Con el programa anterior usted puede comparar todas las categorías de la variable DEDIC1 (Diurno, Nocturno, Semipresencial, Sin Información) con las variables SEXO, ÚLTIMO GRADO Y PREFERENC~
APROBADO UNO, cada una de ellas con sus respectivas categorías.
Gráfico7.8 RESULTADOS DE FRECUENCIAS ORDENADAS.
Además debe recordar que el programa anterior solo puede ejecutarse una vez se ha grabado el archivos de datos DATA ; para el ejemplo este corresponde a TAREA.ENCUESTA. La ventana OUTPUT mostrará los resultados de la siguiente forma U.P. T.e. Duitama 1997
36
Procesamiento de la Información
00081 00002 000113 00004 00085 00006 00007 00008 00089 00018 00011
LIBNAHE TAREA 'C:'SAS'ARCHIUOS"; PROC SORT DATA ~TAREA.ENCUESTA OUT =TAREA.ORDEN; BY DEDIC1; PROC FREQ DATA =TAREA.ORDEN ORDER=FREQ; TABLES SEXO GRADO PREFER1; BY DEDIC1; RUN;
Gráfico 7.11 PROGRAMA PARA COMPARAR TODA S LAS CATEGORiAS DE LAS VARIABLE S ORDENANDÓLAS EN FORMA DESCENDENT E.
Gráfico 7.10 RESULTADO S DE COMPARACiÓN DE VARIABLES .
Los resultados indican que en la jornada diurna desean estudiar 144 hombres, es decir el 72%; el 28% restante corresponde a mujeres. Del grado décimo 161 estudiantes que equivalen al 80.5% y 33 estudiantes del grado undécimo que representan un 16.5%. La carrera que tiene más aceptación como primera opción es TECNOLOGíA EN INFORMÁTICA DIGITAL con el 25.5%; le siguen en su orden TECNOLOGíA EN SISTEMAS con 49 personas, lo cual equivale al 24.5% después TECNOLOGíA EN CONSTRUCCIONES CIVILES con el 11.5%.
Si usted desea realizar más comparaciones, emplee las mismas declaraciones con las variables que le interesan . Debe tener presente que el DATA que acompaña a la declaración PROC SORT es aquel que contiene todos los datos, éste es fijo.
Esta declaración ORDER=FREQ , siempre se escribe en la línea donde esté ubicada la declaración PROC FREQ . Los resultados del programa mencionado antes se observarán de la siguiente manera
_10 l!XO
2 I
2
3
t
y
144 "6
ES MAs
FAaL ENCONTRAR a PORCENTAJE y LA FRECUENCIAMAs ALTA. SI SE PRESENTAN DE ESTA FORMA LOS RESULTADOS.
Gráfico 7.12 RESULTADOS ORDENADOS DE MAYOR A MENOR DE LA COMPARACiÓN DE VARIABLE S
Una forma más cómoda para leer los resultados anteriores , se logra con la declaración ORDER=FREQ, la cual presenta las variables ordenadas por su frecuencias, así:
En los gráficos de los resultados solo se muestra la frecuencia y el porcentaje, pero también aparecen otras dos columnas, la de Frecuencia Acumulada y Porcentaje Acumulado .
U.P.T.e. Duitama 1997
72.8 28.8
37
Procesamiento de la Información
Usted puede emplear una tabla de tabulación cruzada con tres variables o más , dando los nombres de las variables separados por asteriscos, así:
Otra forma fácil de encontrar las frecuencias en un archivo de datos es utilizar una tabla de tabulación cruzada. Para esto puede ayudarse del programa como sigue:
08a 1
LIBNA~E TAREA 'C:'SAS'ARCHIUOS"; 08802 08803 PROC PREQ DATA=TAREA.ENCUESTA ORDER~PREQ; 0890 4 TABLES SEKO*PREFER1*CICLO; 08905
0800 6
09907 RUN; 00008
Gráfico7.15 PROGRAMA PARA OBTENER TABLA DE TABULACiÓN CRUZADA CON TRES VARIABLES
Gráfico 7.13 PROGRAMA PARA OBTENER LAS TABLAS DE TABULACiÓN CRUZADA, EMPLEANDO LA DECLARACiÓN LlBNAME
y la información se observará así: De nuevo emplee la declaración PROC FREQ , después el nombre del archivo y de igual forma que en los programas anteriores, se pueden ordenar las variables por su frecuencia, haciendo uso de la opción ORDER=FREQ. En seguida se escribe la utilidad TABLES, indicando primero la variable que desea en el lado inferior de la tabla, luego (*) y la variable que desea en la parte superior. Después de correr el programa los resultados se muestran así:
elc o
p
4:
- -- - - - - -<. -...' - -+ - - - - \ . . . - - - -+
To
1
45
:
22.73
1
- - - -+-----;,.----..- - -+
Total
(Continued>
!===-=..--
-
198
00.
-
-
-
PORCENTAJE
----:= ACUMULADO l
- - - - - -..1
Gráfico 7.16 RESULTADOS DE UNA TABLADE TABULACiÓN CRUZADA.
SA
s o
I'R
Prequency r Pe n Ro .. P t
Ca
: :
Pct
21, 1
"15 :
1
----+ Tot (Con
nu d)
1 5.as 1 64 ..29: 22.73 : - ..- - -
198
69 .72
También puede emplear otras instrucciones para la tabulación cruzada, estas son: TABLEs a....(b....c); es equivalente aTABLES a"'b a....e: TABLES (a b)....(c d); es equivalente a TA8I..ES a c b c a"'d b....d; TABLES (a b c)....d; es equivalente a TA8I..ES a d b d c....d; TABLES a--c; es equivalente a TABlES a b c; TABLES (a--c)*d; es equivalente aTABLES a....d b....d c....d;
Gráfico7 .14 RESULTADOS DE LAS TABLAS DE TABULACiÓN CRUZADA EMPLEANDO LA DECLARACiÓN LlBNAME .
U.P.T.C. Duitama 1997
38
Procesamiento de la Información
En el gráfico anterior las letras a, b, e y d corresponden a las variables que se estén utilizando, usted puede reemplazar cualquiera de las declaraciones anteriores en el programa según la necesidad .
que puede presentar una encuesta , para esto tomaremos el ejemplo que se da en la página 17. Lo primero que se debe realizar es la creación del archivo de datos permanente, usted puede guiarse con las instrucciones de la página 32, gráfico 7.3.
CURIOSIDADES 3
Una vez se tenga el archivo de datos, para el ejemplo se guardó como MUESTRA.SSD; éste se puede clasificar de acuerdo a las variables en las que el usuario esté interesado, digamos SEXO y PESO. El programa a ejecutar es :
En el uso de la declaración L1BNAME , el nombre de la librería que se dió al programa que contiene el archivo de datos, no necesariamente tiene que utilizarse en el resto de los programas; usted puede cambiarlo , debe tener presente que éste debe coincidir cuando escriba el DATA .
I"".... snd
EDITOR
0i1981 • 00082 LIBNAME EJEMPLO 'C:\SAS\ARCHIUOS\';
1 0i1083
l
0i1984 PROC SORT DATA=EJEMPLO.MUESTRA OUT =EJEMPLO. ORDEN; • 00005 BY SEXO PESO; 0i1006
0080? PROC PRINT DATA=EJEMPLO.ORDEN; 00088 BY SEXO PESO; 00009 RUN;
1 LIBNAME TRABAJO' C:'SAS\ARCHIUOS\'; ll0OO5
rABLES SEXO*PREFER1*DEDIC1;
08llII6
00007 RUN;
Gráfico 7.18
El ~MBRE DE LALI BRERÍA
PRO G RAMA PARA CLAS IFICAR VARIA BLES
~ J\ElESARIA~ TI EI\E QJE SER
El NJ.SMO PARALAEJEOJa ÓN DE TODOS LOSPRQ;RAMAS r--
-
11
Una vez se pulse F10, se obtienen
99081 LIBNAME GUIA' C:\SAS\ARCHIUOS\'; 99082 09093 PROC FREQ DATA =GUIA.ENCUEsrA ORDER=FREQ; 0004 09995 TABLES GRADO*PREFER1MCICLO: Il9l196 0llOO7 RUN;
los resultados como se aprecia en el gráfico siguiente:
Gráfico 7.17 USO DE LA DECLARACi ÓN L1BNAME CON DIFERENTE NOMBRE
1lIT.
ilUlUWl
PROCESAMIE NTO PARA EL SEGUNDO TIPO DE PREGUNTAS
. 6~
14
1 .74
rALLIIPIII
TILIoACII
C111.D11O
IIlllB
tl
31
19
JlLIollClIIl
--
lIlll
22
S
11 -
Ahora mostraremos la manera de procesar el segundo tipo de preguntas
13
,.
CIILDlIO
U
TllJ.LllJ'llll
12
LDIO J:Z
-
-
-
--
-
.1
aa -
"-
Gráfico 7.19 RESULTADOS DE LA CLAS IFICAC iÓN DE VARIABLES
U.P.T.C. Duitama 1997
39
Procesamiento de la Información
En el programa anterior se aplicó el procedimiento PROC SORT, en la misma línea de esta declaración se utilizó la opción OUT= . Ahora bien, cuando no se usa esta opción, los datos del archivo original se pierden y se clasifican de acuerdo a las variables que se escribieron en la utilidad BY ; en este caso en OUT= se crea un nuevo archivo llamado ORDEN .SSD y clasifica las observaciones de acuerdo a las variables SEXO y PESO. Si usted desea ver este nuevo archivo utilice el programa:
r
-- - - --
PROGRAI1 EDITOR le
--
-
00001 00002 LIBNAME EJEMPLO 'C:'SAS'ARCHIUOS"; 00003 00004 PROC PRINT DATA=EJEMPLO.ORDEN; 00005 RUN;
-
-
-
- ---
-
-;;;;;."
Gráfico 7.20 PROGRAMA PARA IMPRIMIR UN ARCHIVO DE DATOS
Al correr el programa los resultados aparecen en forma ordenada por peso y clasificando primero a mujeres y luego hombres:
De la misma forma que para la encuesta anterior se emplearon diferentes procesos, el usuario tiene la posibilidad de volver a hacer uso de ellos en este nuevo archivo de datos; puede ejecutar los programas para hallar la frecuencia, siguiendo las indicaciones del capítulo 7, gráficos 7.7, 7.9 que se describieron en la página 35 y el gráfico 7.13 de la página 37. También se puede obtener en las respectivas variables la media, empleando ahora la declaración PROC MEANS . El usuario puede escribir la declaración anterior después de PROC FREQ o de PROC PRINT .
-
-
. nuunnl'
. lU JI
-
-
-
00287 002 8 002 9 00290 00291 00292 00293 00294 00295 00296
1 1 1 1 1 1.
2 2 2 2 2 2
1 1 2 2 1 2
12 12 12 12 12 12
11 12 01 01 12 12
1 1 1 2 1 1
3 1 1 2 1 1 2 1 lJ 1 lJ
,.
•
PROC MEANS; RUN;
Gráfico 7.22 PROGRAMA PARA OBTENER LA MEDIA DE CADA VARIABLE.
Luego oprime F10 Y en la ventana OUTPUT aparecen los resultados
Gráfico 7.21 RESULTADOS QUE SE PRESENTAN AL IMPRIMIR UN ARCHIVO DE DATOS
Gráfico 7.23 RESULTADOS DE LA MEDIA PARA CADA VARIABLE
U.P. T.C. Duitama 1997
40
Procesamiento de fa fnformación
Usted puede observar que con esta declaración también aparece el mínimo, el máximo, la media y la desviación estándar. Asimismo se puede emplear la declaración L1BNAME, para simplificar el trabajo; el programa a ejecutar es el siguiente:
,,'
Gráfico 7.26 RESULTADOS DE LA MEDIA PARA VARIABLES ESPECíFICAS
LIBNAME EJEMPLO 'C='SAS'ARCHIUOS"; PROC MEANS DAIA~EJEMPLO.MUESTRA; RUH;
Para procesar los datos por subconjuntos, se clasifican los datos por variables, después se hallan los promedios:
Gráfico 7.24 PROGRAMA PARA OBTENER LA MEDIA DE CADA VARIABLE USANDO LA DECLARACiÓN L1BNAME
LIBNRME TRREA 'C:\SAS\ARCHIUOS\';
Los resultados que se obtienen al ejecutar el programa anterior son iguales a los que aparecen en el gráfico 7.23 Si se desea obtener los promedios para ciertas variables, se emplea como ya se mencionó la utilidad VAR. El programa a ejecutar es el siguiente:
o 003 OOOO~ o 005 o 006
PROC SORT DATA=TAREA.MUESTRA; BY PESO EDAD;
PROC MEANS; BY PESO EDAD; OOOOB UAR ESTATURA TALLRPRN CRLlADO; 00009 RUN: 00007
Gráfico 7.27 PROGRAMA PARA OBTENER LA MEDIA POR SUBCONJUNTOS
Los resultados se muestran del siguiente modo:
1:01
t
00001 LIBNBME TBREB 'C:\SBS\BRCHIUOS\'; 00002 00003 PROC MEBNS DBTB=TBREB.MUESTRB; OOOO~ UBR PESO ESTBTURB EDBD; 00005 00006 RUN;
Gráfico 7.25 PROGRAMA PARA OBTENER LA MEDIA DE VARIABLES ESPECiFICAS
Los resultados en la ventana OUTPUT se observan así:
Gráfico 7.28 RESULTADOS DE LA MEDIA POR SUBCONJUNTOS
U.P.T.C. Duitama 1997
41
Procesamiento de la Información
CURIOSIDADES 4 Una vez se tenga la información ya procesada , se pueden imprimir dichos resultados en el SAS . Para esto se debe ubicar el cursor en la ventana PROGRAM EDITOR ; se pulsa la tecla inicio y en la línea comando se utiliza la orden para recuperar el archivo que contiene los resultados. A manera de ejemplo se recuperó el archivo que contiene los resultados de las frecuencias de todas las variables. En la pantalla se observa :
como se puede apreciar en el gráfico 7.29 ésta aparece separando las Tablas de frecuencia para cada variable ; dicha línea también se presenta al recuperar el archivo con las observaciones, o si se ejecutó el programa para obtener Tablas de Tabulación Cruzada, separando cada una de ellas. Para imprimir los resultados , lo primero que se lleva a cabo es el arreglo del informe por páginas, de la manera como se indica a continuación:
Se borran todas las líneas como la que se muestra en el gráfico 7.30, excepto una. Como en SAS cada página la conforman 60 líneas, iniciando desde la línea 0001 cada vez que cuente ésta cantidad , se copia la línea que aparece en el gráfico 7.30 para iniciar otra página. La información se distribuye en cada página de acuerdo a como lo considere conveniente el usuario.
IHe'FIEC.tU' SU
&IU080
Frequenc, 28~
GRADO
Frequenc,
':52 Sotor••"
Perceat
C....... t iee
CII.... htiue
Frellllllellc,
'ercellt
111.1 Percent
Fe....., 2
1•••• tlllflMl1ati.e freq.enc,
C."'lIIhti.e
'Irc:e.t
44 232
,
Cuando el informe se haya arreglado, en la Gráfico 7.29 RESULTADOS QUE SE RECUPERAN EN LA VENTANA PROGRAM EDITOR. línea comando se escribe la orden FILE'PRN' y se pulsa Enter para comenzar a imprimir En ésta ventana los resultados muestran la siguiente línea,
SAS
10:02
Satu~day~ Feb~ua~y 2~
1
Gráfico 7.30 LINEA QUE SE EMPLEA PARA SEPARAR PÁGINAS EN SAS
U.P. T.e. Dultama 1997
43
Presentación de fos resultados
n la presentación de los resultados se puede emplear un ~ procesador de texto para organizar y elaborar un informe que describa su interpretación, incluyendo gráficos adecuados. Si el archivo que contiene los resultados no se imprime en SAS , éste se puede recuperar en una hoja electrónica como EXCEL por ejemplo. A continuación se muestra un gráfico, que contiene las frecuencias para cada variable, del archivo recuperado en EXCEL:
.. . ~c:livo Edición Ver
~~ A~~m= ~ o
10
p
20
3040
Henanierl..
eo
60
70
80
No.Enalostas
~Tg~1
. !Ir Insertif Formato
Barras y columnas en dos y tres dimensiones, diagrama de anillos, de dispersión, y diagramas circulares también en dos y tres dimensiones. Al realizar los diagramas de barras y circulares en tres dimensiones se pueden ver así:
PRESENCIAl.
Datos Venlana
DIURNO
?
D151"ii11 ~ ~r~ I ifJ,I~I~~..1~r~*IHl ill.!L .
1
.
B 2 3
e
H
Cumulative Cumula tivl!'
Frequency Peleen'
5 •• - .---
""6 F ~M '""8 '"""9
---------- 12 8
f-¡Q
1.4 1.5 1.56 1.57
Frequenes
Per cent
60.0 100.0
Cumulative Cumulative Frequency
Percent
---- --- -------- -----------------------
~ '·I·'I\MU[ ~T RA I
NOCTURNO ''5
Gráfico 8.2
15:1O F.ida" Februer 22, 1991 2
f requenoy Petcent
1 2 2 1
PRESENCIAL
60 12 4020
5A5
'it ~E5TATURA f-11- --- ---17
G
F
I
~5EXO
~ ~ ~
E
D
5 1 103 105 56
5.0 15.0 25.0 30.0
l·'
DIAGRAMAS DE BARRAS Y CIRCULARES EN TRES DIMENSIONES .
Estos gráficos se pueden copiar en un procesador de texto como WORD . Allí se procede a escribir la interpretación de los resultados, y para que el informe sea completo se puede complementar con la presentación de tablas .
Gráfico 8.1 ARCHIVO QUE CONT IENE LOS RESULTADOS. UNA VEZ RECUPERADO EN EXCEL.
este paquete se puede utilizar para la elaboración de diagramas que ilustren de una forma más agradable, vistosa y clara la interpretación de los resultados. Los más usuales para presentar en cualquier informe son:
En esta parte se pone en juego la creatividad del usuario, para obtener un informe de fácil interpretación pero a su vez muy completo; una alternativa que este manual ofrece es presentar los resultados como sigue:
U.P.T.e. Duftama 1997
44
Presentación de los resultados
posteriormente se hace la interpretación de los resultados bajo cada diagrama , la presentación de este formato se puede observar del siguiente modo:
Elaboración de diagramas circulares en tres dimensiones indicando el porcentaje junto a cada sector y el nombre de la variable en un cuadro de convenciones ,
y
RESU LTADOS DE LA ENCUESTA APLICADA EN LA CIU DAD DE DUITAMA PREFERENCIA PARA PRIMERA OPCIÓN
1:1 TECNOlOG
A EN ' NFORl.IATICA DIGITAl. • TECNOlOGIA EN SISTEMAS
28%
e TECNOlOGIA EN CONSTRUCCIONES CMlES
Gra fico 1.
TECNOLOG íA COMO PREFERENC IA PARA PRIMERA OPCiÓN
Según la Encuesta aplicada a las 284 personas, en la ciudad de DUITAMA, se puede obse rvar que el 37% tiene preferenc ia para primera opción la TECNOLOGíA EN INFORMÁTICA DIGITAL con 70 encuestados, le siguen en su orden TECNOLOGíA EN SISTEMAS c on el 35% y finalmente 1ECNOLOGíA EN CONSTRUCCIONES CIVILES con 31 pe rsonas, es dec ir el 28%. JORNADA EN LA CUAL LE GUSTARÍA ESTUDIAR DIURNO
70%
SEMIPRESENCIAL 9% Gráfico 2.
RESULTADOS DEL TI PO DE JORNADA
¿ CURSARlA OTRO CICLO? 1% 5%
•
eSI
@
• SIN INFORMACION 94%
Gráfico 3
PORCENTAJES PARA CURSAR OTRO en.o
De estos enc uestados el 70% tiene gran acep tación por es tud iar en la jornada DIURNA, el 20% en la jornada NOCTURNA y tan solo el 9% en SEMIPRESENClAL, además 266 personas o sea el 94% estaría dispuesto a c ursar otro c iclo pa ra ob tener el título de profes ional
Gráfico 8.3 PRESENTACION CON DIAGRAMAS CIRCULARES Y LA RESPECTIVA DESCRIPCION
U.P.T.C. Dultama 1997
45
Presentación de los resultados
Para visualizar mejor los valores que la conforman , se realiza un diagrama circular, y luego se lleva a cabo la interpretación de los resultados. Por ejemplo:
Cuando se incluyen tablas en ellas se pueden presentar los porcentajes y si se desea se especifican las frecuencias.
RESULTADOS DE LA ENCUESTA APLICADA EN LA CIUDAD DE DUITAMA
PORCENTAJE
TECNOLOGíA
No. DE PERSONAS
PREFERENCIA UNO " ~?r'~ATl C A D SlSTEMAS
INFORMÁ nCA DIGITAL. SISTEMAS CONSTRUCCIONES CIVIL S SOLDADURA Y FUNDICI N MECÁNIC A
70 67 31 22 19
31% 29% 20% 9% 6%
"
COHSTR UCQ
OtE:S QVf~
e
SOLDADLRA
YFUH:lIClON
29%
•
MECÁNCA
Gráfico 1. Por sectores para Tecnología.
Tabla1 . Tecno logía para primera opción
Según la encuesta aplicada a las 284 personas, en la ciudad de DU/TAMA se puede observar que el 31% tiene como preferencia para primera opción la Tecnología en Informática Digital, le siguen en su orden Tecnología en Sistemas con el 29%, Tecnología en Construcciones Civiles con el 20%, Tecnología en Soldadura y Fundición con un 9% y finalmente Tecnología en Mecánica con 19 personas, es decir el 8%, PORCENTAJE
JORNADA DIURNO NOCTURNO SEMIPRESENCIAL. SIN INF ORMACiÓN
TIPO DE JORNADA
No. DE PERSONAS
9% 1%
266 56 26 2
7 0%
20% 9% 1%
Tabla 2. TIpo de Jornada
•
NOC TURNO
D
SEMI PRES E ~IAL
70%
Grafico 1. Por sectores para tipo Jornada .
De estos encuestados 0170%tiene gran aceptación por estudiar en la jornada DIURNA con 266 personas, el 20% en la jornada NOCTURNA lo que equivale a 56 personas y tan solo el 9%en SEMIPRESENCIAL.
CICLO
PORCENTAJE
~ o. DE PERSONAS
:>1
lIJ .7 0%
266
NO
5% 1.40%
13 4
¡SIN INFORMACIÓ ~
Tabla 2. Porcentajes para cursar otro ciclo.
¿ CURSAR íA OTRO CICLO?
.... 1 l .'"
c:J SI
5% 93 .7%
..
NO
<::1
SIN I~ORMAC1ÓN
Grafico 2. Por sectores para c urs ar otro c iclo.
Además 266 personas o sea el 93,7% estaría dispuesto a cursar otro CICLO para obtener el título de profesional, tan solo un 5% no tomaría el otro ciclo lo cual es equivalente a 13 personas.
Gráfico 8.4 PRESENTACiÓN CON TABLAS , DIAGRAMAS CIRCULARES Y LA RESPE CTIVA DESCRIPCiÓN.
U.P. t.c. Oultama 1997
46
Presentación de los resultados
Podemos presentar entonces, algunos de los resultados correspondientes a la primera encuesta presentada en este manual, mediante una tabla y un diagrama de barras:
La atracción del usuario por cada aspecto en el que esté interesado, determina el diseño y presentación del informe final.
TABLA DE TABULACiÓN CRUZADA PARA PREFERENCIA COMO PRIMERA OPCiÓN
TECNOLOGíA
HOMBRES
MUJERES
INI- U R M A II~A DI G IT A L
15.85% 12.32% 8.80% 6.34% 6.34% 5.63%
8 .8 0% 1 1.27% 19.3 5 % 1.41% 0 .3 5 % 0 .3 5 %
SI STE M A S CO N STR U C C IO N E S CIVIL E S SO LDA D U R A Y F U ND ICiÓN MEC Á NIC A EL E C TRI C IDAD
TABLA DE TABULACiÓN CRUZADA Clasificando los resultados por sexo.
Los resultados anteriores corresponden a una TABLA DE TABULACiÓN CRUZADA , donde se muestra el porcentaje de Hombres y Mujeres que prefieren como primera opción las siguientes tecnologías: La Tecnología de mayor aceptación para los hombres es INFORMÁTICA DIGITAL con el 15.85%, le siguen en su orden Tec. en SISTEMAS con el 12.32%; Tec. en CONSTRUCCIONES CIVILES con 8.80% después Tec. en MECÁNICA con el 6.34%. La Tecnología de mayor preferencia entre las mujeres es CONSTRUCCIONES CIVILES con el 19.35%, después se encuentra Tec. SISTEMAS con 11.27% , le sigue Tec. en INFORMÁTICA DIGITAL con 8 .80%, y las dos tecnologías con menor porcentaje lo ocupan Tec., MECÁNICA y Tec. en ELECTRICIDAD , ambas con el 0.35%.
en en el en
Los resultados se pueden apreciar mejor en el siguiente diagrama:
PREFERENCIA PARA PRIMERA OPCiÓN CLASIFICÁNDOLA POR SEXO
n
20.00% 15.00% 10.00% 5.00% 0.00%
o
M B
'" •
INFORMÁTICA DOGITAL SISTEMAS
'" CONSTRUCCIONES CIVILES '" SOLDADURA Y FUNDICION • MECÁNICA '" ELECTRICIDAD
0::3
a: W
~ ~
s
DIAGRAMA DE BARRAS PREFERENCIA PARA PRIMERA OPCiÓN
Gráfico 8.4 PRESENTACiÓN CON TABLAS, LA DESCRIPCiÓN Y FINALMENE EL DIAGRAMA DE BARRAS.
U.P.T.C. Duitama 1997
/
BIBLIOGRAFIA CURSO PASO A PASO WINDOWS 95 y LOS 13 PROGRAMAS LIDERES. s.l: s.n, s.f. Fasclculos 2, 3, Y 4. p. 123-129, 130-140, 143-148, 150-160, 177180. /
/
IDAMS, Manual del usuario. s.l: s.n, s.f. p. 3-8, 3136, 349-352. REVISTA Pe. COMPUTING EN ESPAテ前L. Aテアo 12, Nツー 08. Los 1001 tips para Windows 95. s.l: s.n, Agosto de 1995. p .58-62. /
GUIA INTRODUCTORIA AL SAS. s.l: s.n, s.f. p. 2-6. SAS INSTITUTE. 0049(6221)474830. HTTP://VWIW.sAS.COM. SAS LANGUAGE GUIDE. s.l: Release 6.03 Edition, s.f p. 136-139, 320-327, 337-338, 344-354, 494-495. SAS PROCEDURE GUIDE. S.I: Edition, s.f. P. 219-222, 234-236.
Release 6.03
Unesco. Division Of The General Information Programme Idams. 1 Rue Millois. 75732 Parテュs Cedex 15 Francia.
NIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE COLOM FACULTAD SECCIONAL DU ITAMA I
I
ESCUELA DE MATEMATICA y ESTADISTICA
1997