Universidad Nacional Hermilio Valdizán de Huánuco
Maestría en Gestión Pública para el Desarrollo Social Dr. MSc. Aland Bravo Vecorena
Sistemas Informáticos de Gestión Pública
Acerca del Curso 1. 2.
3.
4.
Fundamentos de las TICs y de la Sociedad de la Información. Sistemas Informáticos de Gestión Pública. Modelado de Bases de Datos, Data Warehouse, Datamining y Cloud Computing. Integración de Web Services y BPM.
Agenda de Trabajo Retos del Gobierno Regional Hu谩nuco
Modelado Data Warehouse y Data Mining Arquitecturas de Computaci贸n en Nube Fundamentos de Labview - Diadem Laboratorio Guiado Labview - Diadem
Retos del Gobierno Regional Huรกnuco
ยกConvertir a la Regiรณn Huรกnuco al 2021,
como Lider mundial en Desarrollo Tecnolรณgico Multisectorial!
Retos del Gobierno Regional Huánuco
¡Reducir la Pobreza en la Región Huánuco al 2021,
del 64.5 % hasta menos del 14.5 % mediante generación de trabajo vía APP – Pro Inversión!
Retos del Gobierno Regional Huánuco Servicios al Ciudadano Portal del Ciudadano
Perfil de Empresa
Multicanal
Ciudadano
Representante
Empresa
Sistema de Atención al Ciudadano
Servicios de Administración Electrónica Catálogo de Trámites Motor de Tramitación Administración y Soporte
Identificación Administrativa Digital Valija Electrónica Expediente Digital
Archivo Electrónico Apoyo en la Toma de Decisiones Apoyo en la Toma de Decisiones Gestión de Representantes Legales Registro Electrónico de Licitadores
Elementos Habilitantes - Firma Electrónica - Notificaciones Telemáticas - Sello Temporal -Pasarela de Pago - Registro Telemático
Escritorio del Empleado Público Inter Operatividad Administrativa
Escritorio de Tramitación Web
Escritorio de Tramitación Móvil
Back Office
¡Mejorar la Atención Ciudadana en la Región Huánuco al 2021,
Realizando los trámites TUPA, TUSNE y MAPRO por Internet las 24 horas al día los 365 días del año!
Retos del Gobierno Regional Huรกnuco
ยกReducir las Brechas de Infraestructura en la Regiรณn Huรกnuco al 2021,
Lograr atraer Inversiรณn Privada Cofinanciada en Modalidad APP por $ 20,000 Millones USD!
Promoción de la Inversión Privada
Mega Proyecto 1: Programa de Empoderamiento Urbano y Rural de Servicios Básicos del Ciudadano Huanuqueño (Agua, Desagüe, Salud, Educación, Telecomunicaciones). Mega Proyecto 2: Clusters Hidro Energético de la Región Huánuco. Mega Proyecto 3: Hub Logístico de Transportes de la Región Norte Centro Oriental. Mega Proyecto 4: Cluster Turístico Inter Planetario del Chinchaysuyo – La Capital Logística del Imperio Inca. Mega Proyecto 5: Clusters de Parques Científicos Tecnológicos Industriales Región Huánuco.
Actores Clave de una Asociaci贸n P煤blico Privada
Comit茅s de Conducci贸n de Procesos APP
Conducción de una Iniciativa Pública en Modalidad APP vía Cofinanciamiento
Conducci贸n de una Iniciativa Privada
Flujograma Inversión Privada Cofinanciada
- DGPI: DIRECCIÓN GENERAL DE POLÍTICA DE INVERSIONES - DI: DECLARATORIA DE INTERÉS - IP: INICIATIVA PRIVADA - MEF: MINISTERIO DE ECONOMÍA Y FINANZAS - UF: UNIDAD FORMULADORA
Estrategia Regional PRO INVERSION Mega Proyectos Cofinanciados
Iniciativa Privada en Modalidad APP Cofinanciada
Proyectos Cofinanciados
Iniciativa PĂşblica en Modalidad APP Cofinanciada
Proyectos Financiados
Iniciativa PĂşblica en Modalidad APP Financiada
SNIP - MEF
Agenda de Trabajo Retos del Gobierno Regional Hu谩nuco
Modelado Data Warehouse y Data Mining Arquitecturas de Computaci贸n en Nube Fundamentos de Labview - Diadem Laboratorio Guiado Labview - Diadem
Desarrollo de un Data Warehouse Multi-Tier Data Warehouse
Distributed Data Marts
Data Mart
Data Mart
Model refinement
Enterprise Data Warehouse
Model refinement
Define a high-level corporate data model
Arquitectura Data Warehouse Otras fuentes
Operational DBs
Metadata
Extract Transform Load Refresh
Monitor & Integrator
Data Warehouse
OLAP Server
Serve
Analysis Query Reports Data mining
Data Marts
Data Sources
Data Storage
OLAP Engine
Front-End Tools
CaracterĂsticas Importantes de la Data Estructurada
Proceso de Descubrimiento del Conocimiento Data de Entrada
Pre Procesamiento de Data
Integración de Data Normalización Selección de Característica Reducción de Dimension
Minería de Data
PostProcesamiento
Descubrimiento del Patrón Asociación & correlación Clasificación Clustering Análisis Outlier
Evaluación del Patrón Selección del Patrón Interpretación del Patrón Visualización del Patrón
Tipos de Conjuntos de Datos coach
ball
score
game
win
lost
timeout
season
3
0
5
0
2
6
0
2
0
2
Document 2
0
7
0
2
1
0
0
3
0
0
Document 3
0
1
0
0
1
2
2
0
3
0
play
team
Document 1
TID
Items
1
Bread, Coke, Milk
2 3 4 5
Beer, Bread Beer, Coke, Diaper, Milk Beer, Bread, Diaper, Milk Coke, Diaper, Milk
Registro ◦ Registro relacional ◦ Data Matricial, e.g., matriz numérica, crosstabs ◦ Data Documental: documento de texto: vector frecuencia ◦ Data de Transacción Gráfico y red ◦ World Wide Web ◦ Redes Sociales o de información ◦ Estructuras Moleculares Ordenadas ◦ Data de Video: sequencia de imágenes ◦ Data Temporal : series de tiempo ◦ Data Sequencial: secuencias transaccionales ◦ Data de secuencia Genética Espacial, imagenes y multimedia: ◦ Data espacial : mapas ◦ Data de Imágenes: ◦ Data de Video:
Análisis Boxplot
Five-number summary of a distribution ◦ Minimum, Q1, Median, Q3, Maximum
Boxplot ◦ Data is represented with a box ◦ The ends of the box are at the first and third quartiles, i.e., the height of the box is IQR ◦ The median is marked by a line within the box ◦ Whiskers: two lines outside the box extended to Minimum and Maximum
◦ Outliers: points beyond a specified outlier threshold, plotted individually
Visualizaci贸n de la Dispersi贸n de Data 3D-Boxplot
Desde las Tablas y Registros hacia los Cubos de Datos
A data warehouse is based on a multidimensional data model which views data in the form of a data cube
A data cube, such as sales, allows data to be modeled and viewed in multiple dimensions ◦ Dimension tables, such as item (item_name, brand, type), or time(day, week, month, quarter, year) ◦ Fact table contains measures (such as dollars_sold) and keys to each of the related dimension tables
In data warehousing literature, an n-D base cube is called a base cuboid. The top most 0-D cuboid, which holds the highest-level of summarization, is called the apex cuboid. The lattice of cuboids forms a data cube.
Cubo: Una escalera de Cuboides all
time
item
time,location time,item
0-D (apex) cuboid
location
item,location
time,supplier
supplier
1-D cuboids
location,supplier
2-D cuboids item,supplier
time,location,supplier
3-D cuboids time,item,location
time,item,supplier
item,location,supplier
4-D (base) cuboid time, item, location, supplier
Modelamiento Conceptual de Data Warehouses
Modeling data warehouses: dimensions & measures
◦ Star schema: A fact table in the middle connected to a set of dimension tables ◦ Snowflake schema: A refinement of star schema where
some dimensional hierarchy is normalized into a set of smaller dimension tables, forming a shape similar to snowflake
◦ Fact constellations: Multiple fact tables share dimension tables, viewed as a collection of stars, therefore called galaxy schema or fact constellation
Ejemplo de Esquema Estrella time
item
time_key day day_of_the_week month quarter year
Sales Fact Table
time_key item_key branch_key
branch
location_key
branch_key branch_name branch_type
units_sold dollars_sold avg_sales
Measures
item_key item_name brand type supplier_type
location location_key street city state_or_province country
Ejemplo de Esquema Snowflake time time_key day day_of_the_week month quarter year
item Sales Fact Table time_key item_key branch_key
branch
location_key
branch_key branch_name branch_type
units_sold
dollars_sold avg_sales
Measures
item_key item_name brand type supplier_key
supplier supplier_key supplier_type
location location_key street city_key
city city_key city state_or_province country
Ejemplo de Fact Constellation time time_key day day_of_the_week month quarter year
item Sales Fact Table time_key
item_key item_name brand type supplier_type
item_key
location_key
branch_key branch_name branch_type
units_sold dollars_sold avg_sales
Measures
time_key
item_key shipper_key from_location
branch_key branch
Shipping Fact Table
location
to_location
location_key street city province_or_state country
dollars_cost units_shipped shipper shipper_key shipper_name location_key shipper_type 28
Data Multidimensional Sales volume as a function of product, month, and region Dimensions: Product, Location, Time Hierarchical summarization paths Industry Region
Year
Category Country Quarter Product
ď‚—
Product
City Office
Month
Month Week Day
Un Ejemplo de un Cubo de Dato TV PC VCR sum
1Qtr
2Qtr
3Qtr
4Qtr
sum
Total annual sales of TVs in U.S.A.
U.S.A Canada Mexico sum
Country
Date
Arreglo Multidimensional para ComputaciĂłn del Cubo (3D a 2D)
ď‚—
The best order is the one that minimizes the memory requirement and reduced I/Os
Agenda de Trabajo Retos del Gobierno Regional Hu谩nuco
Modelado Data Warehouse y Data Mining Arquitecturas de Computaci贸n en Nube Fundamentos de Labview - Diadem Laboratorio Guiado Labview - Diadem
¿Qué es la Computación en Nube? ► Capacidad de proveer recursos de IT bajo demanda sobre Internet. ► Plataforma de cómputo dinámica. ► Outsourced de recursos de tecnología. ► Existen nubes privadas y públicas. El Cloud Computing se puede comparar con los servicios de: – –
Electricidad, gas natural, agua, telefóno donde se paga por el uso. Estos servicios pueden ser requeridos y discontinuados bajo necesidad.
La Computación en Nube, un Camino para la Próxima Generación de Centros de Datos Next Generation Data Center Cloud
Modelo de Utilidad
Flexibilidad
Computing Hosting Virtual
Automatización
Virtualización
Modelo Compartido Hosting Dedicado
Consolidación
Estandarización
Modelo Dedicado
+ Confiabilidad + Flexibilidad + Time to market + Menores Costos
Solución Tradicional versus Nueva Generación de Centros de Datos Solución Tradicional
NGDC Adquisición de Servicios
Adquisición de Recursos y construcción de la arquitectura técnica
Poca flexibilidad y grandes tiempos de Respuesta
Esquema de escalabilidad simple en función del crecimiento de su negocio
Soluciones Flexibles y menor tiempo de respuesta
Ambientes complejos y costos
Facilidades en la administración y menor costo
Infraestructura No Compartida y estática
Infraestructura escalable, Elástica, dinámica
Modelo de Computaci贸n en Nube (Cloud Computing)
Tendencias de la Computaci贸n en Nube
Traducci贸n Tiempo Real Geolocalizaci贸n
Voz a Texto
Arquitectura Distribuida Virtualizada
Servidores Almacenamiento
Red
Flexible Dinรกmico Rรกpido
Estrategia de Virtualización Desarrollar
Estandarizar
´Todo virtualizado’
Plataformas de Misión Crítica BENEFICIOS
Explorar
Plataformas de Negocio
Servidores Baja Criticidad
Tiempo Reducción de Capex y Opex Mejorar niveles de servicio Mejorar las respuestas a los requerimientos de negocio
Pila de Servicios de la Computaci贸n en Nube
Software as a Service SaaS
Plataforma as a Service PaaS
Infraestructura as a Service IaaS
Aplicaciones
Servidores de Aplicaci贸n
Host - Hypervisor
Tipos de Computación en Nube
Nube Híbrida
vApp vApp
vApp
API
Nube Privada
API
vApp
vApp
Nube Pública
Seguridad – Portabilidad – Administración unificada
Ejemplo de la Administraciรณn de una Aplicaciรณn en Nube
ADMINISTRACION
Aplicaciones
App Ocurre vuelve un al estado incidente normal
Administraciรณn dinamicamente asigna mรกs recursos
Servidor de Aplicaciones
Host - Hypervisor
Administraciรณn monitorea los recursos
Ventajas y Beneficios de los Servicios en Nube - IaaS
Agenda de Trabajo Retos del Gobierno Regional Hu谩nuco
Modelado Data Warehouse y Data Mining Arquitecturas de Computaci贸n en Nube Fundamentos de Labview - Diadem Laboratorio Guiado Labview - Diadem
Motivaci贸n de Labview-Diadem
Tipos de Formatos de Informaci贸n
Complejidad
Flexible
Databases
Custom Binary & XML Files
F谩cil
TDM Files Simple ASCII Files
LVM Files Usuario Final
Principiante
Intermedio
Avanzado
Vi’s LabVIEW de Almacenamiento de Data
Formatos de Archivos TDM XML Header (*.TDM) Root •Description •Title •Author •etc
Binary (*.TDX) Group •Name •Description •etc.
Channel •Name •Comment •Unit •Max & Min •etc
Channels Groups
Los Vi’s Labview de Almacenamiento escriben Archivos TDM Combining the flexibility and structuring of XML together with the compactness that Binary files offer
Capable of storing: •Analog waveforms •1D arrays of numeric values, strings, time stamps •DAQmx waveform attributes •Additional user defined properties
Ejemplo de Almacenamiento VI’s Read data
Acquire & Write data
TDM file
LabVIEW Data Viewer
Minería de Datos con Diadem Almacenamiento
Minería
Análisis
f(x)
Enfoque Labview y Diadem
Encontrar todos los análisis …..
“Data Mining”
Agenda de Trabajo Retos del Gobierno Regional Hu谩nuco
Modelado Data Warehouse y Data Mining Arquitecturas de Computaci贸n en Nube Fundamentos de Labview - Diadem Laboratorio Guiado Labview - Diadem
Diadem - Labview Labview: Laboratory Virtual Instrument Engineering Workbench Es un entorno de desarrollo gráfico de 4ta Generación, orientado para la Medición Control y Automatización. Diadem es una Herramienta de software que permite ubicar, cargar, visualizar, analizar y reportar los datos desde diversas fuentes.
Ejercicios Guiados de Diadem Ejercicio 1: Escribiendo un Archivo TDMS en Labview. Ejercicio 2: Utilitario DataFinding y generación automática de Reportes. Ejercicio 3: Minería de Datos y generación interactiva de Reportes. Ejercicio 4: Creación Automatizada de Análisis y Reportes. Ejercicio 5: Análisis Interactivo y Plug In ASCII
Universidad Nacional Hermilio Valdizán de Huánuco
Maestría en Gestión Pública para el Desarrollo Social Dr. MSc. Aland Bravo Vecorena
Sistemas Informáticos de Gestión Pública