UNIVERSIDAD DE PUERTO RICO EN CAYEY INSTITUTO DE INVESTIGACIONES INTERDISCIPLINARIAS CENTRO DE INFORMACIÓN CENSAL
Introducción al DataFerrett Dr. José G. Caraballo-Cueto, Director Centro de Información Censal
Objetivos Conocer la estructura de los Datos del Censo y del DataFerrett usando el Censo de Población y Vivienda, el American Community Survey y el County Business Patterns. Seleccionar los bancos de datos de forma informada y consciente. Construir tablas sencillas y de múltiples variables, según el interés del usuario. Seleccionar las variables y editarlas correctamente. Seleccionar las zonas geográficas pertinentes al interés del usuario.
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
2
¿Qué es el DataFerrett? Es una herramienta de extracción y análisis de
datos Es una aplicación gratuita del Negociado del Censo de los Estados Unidos Permite al usuario construir tablas, gráficos y mapas para visualizar los resultados del análisis Generalmente se utiliza cuando no se encuentra la tabla de interés en American FactFinder (AFF) por el nivel de especificidad del estudio
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
3
Principales Bancos de Datos disponibles para Puerto Rico en DataFerrett American Community Survey & Puerto Rico Community Survey & PUMS
• Estima y describe características de la población • Reporte 2005 al 2014 (demográficos y socioeconómicos) • Publica datos de ACS con estimados de 1, 3 y 5 años • PUMS: Muestras de 1%, 3% y 5% de la población
Decennial Population and Housing Census & PUMS
• Cuenta la población y unidades de vivienda • Publica datos de los compendios censales SF1 y SF2 (2000) • Publica datos de los compendios censales SF1, SF2, SF3 y SF4 • PUMS: Muestras de 1%, 5% y 10% de la población
County Business Patterns
• Provee datos económicos anuales por industria (NAICS, SIC) • Estudia actividad económica de pequeñas áreas y analiza cambios económicos durante el tiempo • Variables: número de establecimientos, cantidad de personas empleadas por industria y nómina
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
4
Estructura de los Datos del Censo Decenal Censo Poblacional 1980, 1990 y 2000
Trabaja con variables que no son económicas. Las encuestas son de toda la población.
Trabaja variables económicas. Para las encuestas se toma una muestra.
Marzo 2016
Censo Poblacional 2010
Forma corta Redistricting Data SF SF1 100% Data SF2 100% Data
Forma corta Redistricting Data SF SF1 100% Data SF2 100% Data
Forma larga
Forma larga Sustituida por el “American Community Survey” (ACS) ACS 1-year estimates ACS 3-year estimates ACS 5-year estimates
SF3 Sample Data SF4 Sample Data
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
5
“American Community Survey (ACS)” PUMS (Public Use Microdata Sample) ACS-PUMS Content: Housing American Community Survey (ACS)
• Muestra:
Es una encuesta nacional que permite obtener estimados de población, en especial de características sociales y económicas
EU- 3 millones de direcciones anuales PR- 36,000 direcciones anuales
• Estimados: • 1 año – comunidades de 65,000 habitantes o más • 3 años- comunidades de 20,000 habitantes o más • 5 años- todas las comunidades
ACS-PUMS
Marzo 2016
Es una muestra de la población y de las unidades de viviendas reportadas en el ACS
Age of Householder House Heating Fuel Household Size Kitchen Facilities Occupancy and Vacancy Owner Statistics Plumbing Facilities Race of Householder Renter Statistics
Rooms and Bedrooms Telephone Service Tenure Units in Structure Value of Home Vehicles Available Year Householder Moved Into Unit Year Structure Build
ACS-PUMS Content: Population Social Ancestry Citizenship & Year of Entry Disability Status Educational Attainment Field of Degree Health Insurance Grandparents Fertility Language Marital Status & History Place of Birth Migration
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
Relationship School Enrollment Veteran Status Economic Employment & Work Status Income & Earnings Industry & Occupation Class of Worker Commuting Poverty Status SNAP Receipt Demographic Age & Sex & Race & Hispanic Origin 6
Comparando los ACS ACS – Estimados de 5 años 2014 → 2010 – 2014 ACS 2013 → 2009 – 2013 ACS 2012 → 2008 – 2012 ACS
ACS – Estimados de 3 años 2013 → 2011 – 2013 ACS 2012 → 2010 – 2012 ACS 2011 → 2009 – 2011 ACS 2010 → 2008 – 2010 ACS
2011 → 2007 – 2011 ACS 2010 → 2006 – 2010 ACS 2009 → 2005 – 2009 ACS
Marzo 2016
2009 → 2007 – 2009 ACS
2008 → 2006 – 2008 ACS 2007 → 2005 – 2007 ACS
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
7
División Geográfica de Puerto Rico
Puerto Rico [State]
Municipios [County] (78)
Sub-divisiones de Municipios [County Subdivisions] (Barrios) (902)
DIVISIÓN GEOGRÁFICA DE LOS PUMS ↓ Nación ↓ Todos los estados, incluyendo a Washington DC y a Puerto Rico ↓ Public Use Microdata Area (PUMAs) → lugares con más de 100,000 personas
Sub-barrios [Subminor Civil Division 067] (145)
Sectores Censales (945)
Grupos de bloques (2,594)
Bloques (77,189)
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
8
Guía de Usuario de DataFerrett
Para conseguir la Guía de Usuario de DataFerrett puede acceder a http://dataferrett.census.gov/UserResources/ DataFerrett_UserGuide.pdf
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
9
Accediendo a DataFerrett Requisitos para trabajar con DataFerrett en el computador:
Enlace directo: http://dataferrett.census.gov/
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
10
Para entrar al programado de DataFerrett, deberรก escribir un correo electrรณnico en la pรกgina principal.
Marzo 2016
DR. JOSร G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
11
Pantalla principal
Icono
Descripción Para abrir un trabajo existente de DataFerrett Para guardar las variables que se están utilizando en el trabajo Para volver a la pantalla principal Para seleccionar el banco de datos y las variables a investigar Para modificar las variables a investigar y construir la tabla deseada Para acceder a la Guía de Usuario de DataFerrett Para acceder directamente a “Step1: Select Dataset & Variable”
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
12
Pantalla: “Step1: Select Dataset & Variable”
Para seleccionar el tipo de data
Buscador de variables
Para ver la definición de las variables y seleccionarlas Base datos disponibles en DataFerrett
Para ver el contenido de cada base de datos.
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
13
Pantalla: “Step2: DataBasket / Download / Make A Table”
Eliminar el trabajo completo
Visualización de las variables seleccionadas en el Step1
Icono
Descripción
Icono
Current Query Variables:
Descripción
Recode Variable
Para modificar la variable (ej. Fijar grupos de edad)
Delete Variable(s)
Para eliminar la(s) variable(s)
Name
Nombre de la variable, según el Negociado del Censo
Variable Label
“Label” de la variable, según el Negociado del Censo
View/Modify Variable(s)
Para ver y modificar la variable en su estado original
Availability
Los periodos para los que está disponible la variable
Para añadir la variable de tiempo (ej. 2010, 2011…)
Download
Para descargar las variables trabajadas en otros formatos (ej. SPSS, SAS, etc.)
Add Time/Series Time Save Selected Variable(s) CodeBook
Para guardar las variables trabajadas en el computador
Make A Table
Para construir la tabla deseada
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
14
Pantalla: “Ferrett Tabulation”
Hoja de trabajo (espacio para construir la tabla)
Variables listas para desplegar en la hoja de trabajo
Referencias
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
15
Funciones de la pantalla: “Ferrett Tabulation”
Editar tamaño, tipo y estilo de letra del contenido de la hoja de trabajo
Editar el contenido de la hoja de trabajo: copiar, pegar, recortar, seleccionar todo, ocultar una fila/columna, borrar, insertar, sortear de forma ascendente o descendente, entre otros
Visualización de la variable de pesaje, establecer si se desea que el programado dé los porcientos, entre otras opciones
Añadir otra hoja de trabajo, abrir una hoja existente, guardar en el dispositivo en cuestión, imprimir toda o parte del contenido de la hoja, convertir en PDF, editar gráficas, mapas, y salir de la pantalla Comando para traer los datos Para crear gráficos y mapas a la hoja de trabajo
Marzo 2016
Tipo de visualización del contenido de la hoja de trabajo
Para eliminar todo el contenido de la hoja de trabajo
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
Para fijar los porcientos
16
Ejemplo #1 Encuesta sobre la Comunidad de Puerto Rico (PUMS) – Estimado de un año
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
17
Creando una tabla sencilla en DataFerrett Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP
Para seleccionar los tópicos de interés, hacer click izquierdo sobre el recuadro.
Geographical Zone: → Puerto Rico
Click izquierdo para ver las variables disponibles para ese año. Se está trabajando con el año que está sombreado.
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
Luego de seleccionar el tópico, hacer click izquierdo sobre “Search Variables” para ver todas las variables disponibles para el/los tópico/s seleccionado/s.
18
Creando una tabla sencilla en DataFerrett-Continuación
Variables encontradas
Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP
Para escoger los periodos de estudio, hacer doble click izquierdo sobre uno de los años y luego, presionando shift + ↓, seleccionar los años restantes. Finalmente, hacer click izquierdo al lado de los periodos.
Geographical Zone: → Puerto Rico
Seleccionar las variables de interés una a una, haciendo click izquierdo sobre cada variable.
Listado de variables encontradas
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
19
Creando una tabla sencilla en DataFerrett-Continuación ¡Recomendación!
Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014
Para garantizar la confiabilidad de la búsqueda, se recomienda buscar el libro de definiciones que provee el Negociado del Censo de los Estados Unidos para cada base de datos. En él, encontrará un desglose del contenido de cada variable, lo que le ayudará a guiar su búsqueda en DataFerrett mucho más rápido.
Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico
Entrar a http://census.gov/
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
20
Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
21
Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
22
Creando una tabla sencilla en DataFerrett-Continuación
http://www.census.gov/programs-surveys/acs/technicaldocumentation/pums/documentation.html
Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico
“PUMS Data Dictionary”
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
23
Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014
Cantidad de variables guardadas
Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico Resumen: → Seleccionar variable, haciendo click izquierdo sobre ella → Hacer click izquierdo en “ ” → En la pantalla “Browse/Select Variables & Values, marcar la alternativa de “Select” → Hacer click izquierdo en “OK” → En la pantalla de “Confirmation”, hacer click izquierdo en “OK”
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
24
Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014
En la pantalla
Hacer click izquierdo para construir la tabla deseada
Variables: → Sex: SEX → Weight variable: PWGTP
Herramientas para trabajar con las variables seleccionadas
Geographical Zone: → Puerto Rico
Las variables seleccionadas para preparar la tabla final
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
25
Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014
Herramientas
Listado de variables seleccionadas
Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico
Espacio para construir la tabla
Para borrar la tabla construida Para construir una gráfica con la tabla creada
Referencias
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
26
Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014
Para generar los datos de la tabla
Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico Arrastrar la variable “SEX” , sin soltar el click izquierdo hasta el recuadro deseado Finalmente, puede sombrear la tabla y pegarla en el programado de su preferencia (ej. Excel)
Arrastrar la variable “Instances”, sin soltar el click izquierdo, hasta el recuadro deseado
Para copiar las referencias, sombrear todo y presionar Ctrl + c
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
27
Ejemplo #2 Censo Decenal de Población y Vivienda – 2000 – Puerto Rico
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
28
Realizando cruce de variables y “recode” de variables en DataFerrett Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
Para seleccionar los tópicos de interés, hacer click izquierdo sobre el recuadro. Seleccionar “Selectable Geographies” porque no es una base de datos de Puerto Rico, por tanto se debe seleccionar
En la pantalla
Click izquierdo para ver las variables disponibles para ese año. Se está trabajando con el año que está sombreado.
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
Luego de seleccionar el tópico, hacer click izquierdo sobre “Search Variables” para ver todas las variables disponibles para el/los tópico/s seleccionado/s.
29
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
En la pantalla
Hacer doble click izquierdo para seleccionar la Zona Geográfica. Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
30
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
En la pantalla
Hacer click izquierdo para seleccionar la Zona Geográfica.
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
31
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
En la pantalla
En el buscador, escribir la Zona Geográfica deseada.
Marzo 2016
Hacer click izquierdo para comenzar la búsqueda.
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
32
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
Arrastrar la Zona Geográfica deseada , sin soltar el click izquierdo, hasta el recuadro “Selected Geographic Areas”
En la pantalla
Finalmente, hacer click izquierdo para finalizar la búsqueda.
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
33
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT
Continuar con la selección de variables
Geographical Zone: → Puerto Rico Resumen: → Seleccionar variable, haciendo click izquierdo sobre ella → Hacer click izquierdo en “ ” → En la pantalla “Browse/Select Variables & Values, marcar la alternativa de “Select” → Hacer click izquierdo en “OK” → En la pantalla de “Confirmation”, hacer click izquierdo en “OK”
En la pantalla Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
34
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
Las variables seleccionadas para preparar la tabla final
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
35
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT
Hacer click izquierdo para editar la variable “Age” (25 años o más)
Geographical Zone: → Puerto Rico
En la pantalla
Hacer click izquierdo para activar el icono “Recode Variable” para comenzar a editar la variable “Age” (25 años o más)
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
36
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
En la pantalla
Hacer click izquierdo para editar el “label” de la variable a crear
Hacer click izquierdo para ir limitando la variable (ej. Escribir 24 para referirse a las personas de 1 a 24 años)
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
Hacer doble click izquierdo para editar el “label” de las categorías creadas de la variable en cuestión (Age)
37
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
Hacer click izquierdo para editar el “label” de la variable a crear Hacer doble click izquierdo para editar el “label” de las categorías creadas de la variable en cuestión (EDUC)
Hacer click izquierdo en una de las categorías. Luego, seleccionar todas las que constituirán un grupo (ej. 13 a 16 = bachillerato o más), presionando Shift + . Finalmente, presionar “recode”. –Volver a hacer este proceso hasta finalizar con las categorías deseadas.-
En la pantalla Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
38
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000
Hacer click izquierdo para construir la tabla deseada
Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
39
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000
Hacer click izquierdo para generar los datos de la tabla
Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT
Arrastrar la variable “GEOG”, sin soltar el click izquierdo, hasta la celda “C2-R1”
Geographical Zone: → Puerto Rico
Arrastrar la variable “SEX”, sin soltar el click izquierdo, hasta la celda “C2-R1” Arrastrar la variable “AGE (recode)”, sin soltar el click izquierdo, hasta la celda “C1-R2” Arrastrar la variable “BACH OR MORE (recode)”, sin soltar el click izquierdo, hasta la celda “C1-R2”
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
40
Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Finalmente, puede sombrear la tabla y pegarla en el programado de su preferencia (ej. Excel)
Geographical Zone: → Puerto Rico
C
Para copiar las referencias, sombrear todo y presionar Ctrl + c Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
C 41
Ejemplo #3 County Business Patterns – Puerto Rico y municipios de la Región de la Universidad de Puerto Rico en Cayey
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
42
Realizando uniones de base de datos en DataFerrett Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population
Para seleccionar los tópicos de interés, hacer click izquierdo sobre el recuadro. Seleccionar “Selectable Geographies” porque no es una base de datos de Puerto Rico, por tanto se debe seleccionar
Geographical Zone: → Florida, EU → Florida Counties Click izquierdo para ver las variables disponibles para ese año. Se está trabajando con el año que está sombreado.
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
Luego de seleccionar el tópico, hacer click izquierdo sobre “Search Variables” para ver todas las variables disponibles para el/los tópico/s seleccionado/s.
43
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population
Hacer doble click izquierdo para seleccionar la Zona Geográfica.
Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
44
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Hacer click izquierdo para seleccionar la Zona Geográfica.
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
45
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
En el buscador, escribir la Zona Geográfica deseada.
Marzo 2016
Hacer click izquierdo para comenzar la búsqueda.
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
46
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties Sombrear los municipios de Florida, US, presionando Shift + . Arrastrar los municipios seleccionados, haciendo click izquierdo, sin soltar, hasta el recuadro “Selected Geographic Areas”
En la pantalla
Finalmente, hacer click izquierdo para finalizar la búsqueda. Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
47
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
Hacer doble click izquierdo seleccionar el NAICS Code a utilizarse
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
48
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
49
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Escribir el NAICS Code a utilizarse
Luego de sombrear el NAICS Code a utilizarse, hacer click izquierdo en “Select” Marzo 2016
Finalmente, hacer click izquierdo para finalizar la selección
Hacr click izquierdo para iniciar la búsqueda del NAICS Code a utilizarse
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
50
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population
c
Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Hacer doble click izquierdo para seleccionar la variable
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
51
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
52
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties Hacer click izquierdo para seleccionar la base de datos a unirse En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
53
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
54
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Hacer doble click izquierdo para añadir la tabla de la base de datos: SF3 Deccennial Census
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
55
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000
c
Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
56
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000
Hacer click izquierdo para construir la tabla
Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
57
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
En la pantalla
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
58
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population
c
Geographical Zone: → Florida, EU → Florida Counties
Arrastrar la variable “MERGED-200 Three-digit FIPS County…”, sin soltar el click izquierdo, hasta la celda “C1-R2”. Luego, arrastrar la variable “est” hasta la celda “C2-R1”. Finalmente, arrastrar la variable “P001001” hasta la celda “C3-R2”
En la pantalla
Hacer doble click izquierdo sobre la celda “C2” para sombrear la columna
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
Luego hacer click izquierdo en “FORM” para insertar una fórmula en la columna “C2”. Para que divida la cantidad de establecimientos por la cantidad de personas, con el propósito de obtener cuántos establecimientos hay por personas 59
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000
Hacer click izquierdo para generar los datos de la tabla
Hacer click izquierdo en la celda “C4” para cambiar el título de la columna
Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
60
Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population
Hacer click izquierdo sobre “Map” para generar un mapa de los resultados
Sombrear, presionando Shift + para generar un mapa con esos datos
Geographical Zone: → Florida, EU → Florida Counties
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
61
EjERCICIO #1 Encuesta sobre la Comunidad de Puerto Rico (PUMS) – Estimado de cinco años
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
62
INSTRUCCIONES-EJERCICIO 1: Buscar la cantidad de personas empleadas por edad y por clase de trabajador para el periodo 2010-2014 Guía:
Posible solución:
Datasets: → Puerto Rico PUMS → 2010-2014 ACS-5 YEARS
→ Entrar a DataFerrett
Variables:** → Person Weight: PWTGP → Age: AGEP → Class of worker: COW → Employment Status Recode: ESR Geographical Zone: → Puerto Rico
Marzo 2016
→ Seleccionar la base datos → Abrir la ventana de “American Community Survey” → Abrir la venta de “5-Year Estimates – Puerto Rico PUMS” → Seleccionar el periodo “2010-2014” → Seleccionar las variables (realizar este procedimiento con cada variable)** → Seleccionar los tópicos de “Population” y “Replicate Weights” → Click izquierdo en “Search Variables” → Click izquierdo sobre las variables de interés (una a una) e inmediatamente, hacer click izquierdo sobre “Browse/Select Highlighted” → Aparecerá la pantalla: “Browse/Select Variables & Values” → Click izquierdo en “Select” → Click izquierdo en “OK” → Aparecerá la pantalla: “Confirmation” → Click izquierdo en “OK”
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
63
INSTRUCCIONES-EJERCICIO 1: (continuación) Buscar la cantidad de personas empleadas por edad y por clase de trabajador para el periodo 2010-2014 Guía:
Posible solución: (continuación)
Datasets: → Puerto Rico PUMS → 2010-2014 ACS-5 YEARS
→ Modificar las variables (Pantalla: “DataBasket/Download/Make A Table”) → AGEP (Age) → Click izquierdo sobre la variable “AGEP” → Click izquierdo en “Recode Variable”. → Aparecerá la pantalla “Recode/Regroup Variables” → Cambiar el nombre de la variable al de su preferencia para identificar el “recode” en el recuadro que está a la izquierda de “is label for the Variable Recode of AGEP” → Con Shift + ↓ sombrear las edades que formarán la primera categoría** → Click izquierdo en “Recode” → Realizar el mismo proceso para cada categoría de edad sugerida → Al finalizar, hacer click izquierdo sobre “OK”
Variables: → Person Weight: PWTGP → Age: AGEP → Class of worker: COW → Employment Status Recode: ESR Geographical Zone: → Puerto Rico
Categorías AGEP:** AGEP: → 16 a 24 años → 25 a 32 años → 33 a 40 años → 41 a 48 años → 49 a 56 años → 57 a 64 años
Marzo 2016
→ Crear la tabla de interés → Click izquierdo en “Make A Table” → Aparecerá la pantalla “Ferrett Tab Message”. Click izquierdo en “OK” → Aparecerá la pantalla “Ferrett Tabulation”. En ella comenzará a trasladar las variables, que aparecen en el lado derecho, a los recuadros de la hoja de trabajo → RECODE1 (AGEP Categories): a la C1, R2 → COW: a la C1, R2 → ESR: a la C2, R1 → Click izquierdo en “ GO Get Data” DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
64
EjERCICIO #2 Encuesta sobre la Comunidad de Puerto Rico (PUMS) – Estimado de un año
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
65
INSTRUCCIONES-EJERCICIO 2: Buscar la cantidad de personas que no tienen plan médico por edad, sexo y estado civil para los periodos 2012, 2013 y 2014 Guía:
Posible solución:
Datasets: → Puerto Rico Public Use Microdata Sample → 2012, 2013, 2014
→ Entrar a DataFerrett
Variables:** → Person Weight: PWTGP → Age: AGEP → Sex: SEX → Health Insurance Coverage Recode: HICOV → Recoded detailed race code: RAC1P → Married, spouse present/spouse absent: MSP Geographical Zone: → Puerto Rico
Marzo 2016
→ Seleccionar la base datos → Abrir la ventana de “American Community Survey” → Abrir la venta de “Puerto Rico Public Use Microdata Sample” → Seleccionar los periodos “2014, 2013 y 2012”, haciendo doble click izquierdo sobre el “2014”, click izquierdo fuera de los periodos, sombrear los otros periodos con Shift + ↓, y click izquierdo fuera de los periodos → Seleccionar las variables (realizar este procedimiento con cada variable)** → Seleccionar los tópicos de “Population” y “Replicate Weights” → Click izquierdo en “Search Variables” → Click izquierdo sobre las variables de interés (una a una) e inmediatamente, hacer click izquierdo sobre “Browse/Select Highlighted” → Aparecerá la pantalla: “Browse/Select Variables & Values” → Click izquierdo en “Select” → Click izquierdo en “OK” → Aparecerá la pantalla: “Confirmation” → Click izquierdo en “OK”
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
66
INSTRUCCIONES-EJERCICIO 2: (continuación) Buscar la cantidad de personas que no tienen plan médico por edad, sexo y estado civil para los periodos 2012, 2013 y 2014
Posible solución: (continuación)
Guía: Datasets: → Puerto Rico Public Use Microdata Sample → 2012, 2013, 2014 Variables:** → Person Weight: PWTGP → Age: AGEP → Sex: SEX → Health Insurance Coverage Recode: HICOV → Recoded detailed race code: RAC1P → Married, spouse present/spouse absent: MSP Geographical Zone: → Puerto Rico
Categorías:** AGEP: → Under 1 year → Between 1 and 14 → Between 15 and 24 → Between 25 and 45 → Between 46 and 64 → Between 65 and 99
Marzo 2016
RAC1P: → White alone → Black or African American alone
→ Modificar las variables (Pantalla: “DataBasket/Download/Make A Table”) → AGEP (Age) → Click izquierdo sobre la variable “AGEP” → Click izquierdo en “Recode Variable”. → Aparecerá la pantalla “Recode/Regroup Variables” → Cambiar el nombre de la variable al de su preferencia para identificar el “recode” en el recuadro que está a la izquierda de “is label for the Variable Recode of AGEP” → Click izquierdo sobre “Under 1 year”, luego click izquierdo en “Recode” → Crear las categorías de las edades, escribiendo la edad en el recuadro “Within the range from 1 through”, luego click izquierdo en “Recode”. → Realizar el mismo proceso para cada categoría de edad sugerida** → Al finalizar, hacer click izquierdo sobre “OK” → RAC1P (Recoded detailed race code) → Click izquierdo sobre la variable “RAC1P” → Click izquierdo en “Recode Variable”. → Aparecerá la pantalla “Recode/Regroup Variables” → Cambiar el nombre de la variable al de su preferencia para identificar el “recode” en el recuadro que está a la izquierda de “is label for the Variable Recode of AGEP” → Clikc izquierdo sobre cada categoría sugerida, luego click izquierdo sobre “Recode”. Cerrar la pantalla, haciendo click izquierdo en “OK” DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
67
INSTRUCCIONES-EJERCICIO 2: (continuación) Buscar la cantidad de personas que no tienen plan médico por edad, sexo y estado civil para los periodos 2012, 2013 y 2014 Guía:
Posible solución: (continuación)
Datasets: → Puerto Rico Public Use Microdata Sample → 2012, 2013, 2014
→ Crear la tabla de interés → Click izquierdo en “Make A Table” → Aparecerá la pantalla “Ferrett Tab Message”. Click izquierdo en “OK” → Aparecerá la pantalla “Ferrett Tabulation”. En ella comenzará a trasladar las variables, que aparecen en el lado derecho, a los recuadros de la hoja de trabajo → RECODE2 (Race Categories): a la C1, R2 → RECODE1 (Age Categories): a la C1, R2 → MSP: a la C1, R3 → Instances (periods per year): a la C2, R1 → SEX: a la C2, R1 → HICOV: a la C2, R1 → Click izquierdo en “ GO Get Data”
Variables:** → Person Weight: PWTGP → Age: AGEP → Sex: SEX → Health Insurance Coverage Recode: HICOV → Recoded detailed race code: RAC1P → Married, spouse present/spouse absent: MSP Geographical Zone: → Puerto Rico
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
68
Contacto del CIC: Dr. José G. Caraballo-Cueto, Director Teléfono: (787) 738-2161, extensions 2615, 2763 Internet: www.cayey.upr.edu/iii/cic Correo electrónico: cic.upr@upr.edu Localización: Residencia I-21, frente a la cancha de tenis, al lado del Programa de Estudios de Honor
Marzo 2016
DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY
69