Business Intelligence 3Edi.pdf
C
M
Y
CM
MY
CY
CMY
K
1
13/09/17
16:01
Edição FCA – Editora de Informática, Lda.
EDIÇÃOAv. Praia da Vitória, 14 A – 1000-247 Lisboa Tel: +351de 213Informática, 511 448 FCA – Editora Lda. fca@fca.pt Av. Praia da Vitória, 14 A – 1000-247 Lisboa www.fca.pt Tel: +351 213 511 448 fca@fca.pt www.fca.pt Distribuição Lidel – Edições Técnicas, Lda. DISTRIBUIÇÃO D. Estefânia, 183, R/C Dto. – 1049-057 Lisboa Lidel – Rua Edições Técnicas, Lda. Tel: +351 213 511 448 Rua D. Estefânia, 183, R/C Dto. – 1049-057 LISBOA lidel@lidel.pt Tel: +351 213 511 448 www.lidel.pt lidel@lidel.pt www.lidel.pt
Livraria LIVRARIA Av. Praia da Vitória, 14 A – 1000-247 Lisboa Av. Praia da Vitória, 14 – 1000-247 LISBOA Tel: +351 213 511 448 * Fax: +351 213 522 684 Tel: +351 213 511 448 * Fax: +351 213 173 259 livraria@lidel.pt livraria@lidel.pt Copyright © abril 2016, FCA – Editora de Informática, Lda. Copyright © 2017, FCA – Editora de Informática, Lda. ISBN: 978-972-722-830-0 ISBN edição impressa: 978-972-722-880-5 1.ª edição impressa: abrilsetembro 2016 de 2017 1.ª edição impressa: Paginação: Alice Simões Impressão e acabamento: A definir Paginação: Carlos Mendes Depósito Legal N.º Aguardar Impressão e acabamento: Cafilesa -– Soluções Gráficas, Lda. – Venda do Pinheiro Capa: José Manuel Reis Depósito Legal n.º 431502/17 Ilustração daJosé capa: Capa: M.Miguel Ferrão –Montenegro Look-Ahead Marcas Registadas de FCA – Editora de Informática,
Marcas registadas de FCA – Editora de Informática, Lda. –
FCA®
Todos os nossos livros passam por um rigoroso controlo de qualidade, no entanto, aconselhamos a consulta periódica do nosso site (www.fca.pt) para fazer o download de eventuais correções.
Todos os nossos livros passam por um rigoroso controlo de qualidade, no entanto aconselhamos a consulta periódica do nosso site (www.fca.pt) para fazer o download de eventuais correções.
Não nos responsabilizamos por desatualizações das hiperligações presentes nesta obra, que foram verificadas à data de da mesma.por desatualizações das hiperligações presentes nesta obra, que foram verificadas à data de Nãopublicação nos responsabilizamos publicação da mesma.
Os nomes comerciais referenciados neste livro têm patente registada. Os nomes comerciais referenciados neste livro têm patente registada. Reservados todos os direitos. Esta publicação não pode ser reproduzida, nem transmitida, no todo ou em parte, por qualquer processo eletrónico, gravação, sistema de armazenamento e disponibilização de Reservados todos osmecânico, direitos. Estafotocópia, publicaçãodigitalização, não pode ser reproduzida, nem transmitida, no todo ou em parte, por qualquer processo eletrónico,sítio mecânico, gravação, sistema de armazenamento e disponibilização de informação, Web, blogue informação, Web, fotocópia, blogue oudigitalização, outros, sem prévia autorização escrita da Editora, exceto o permitido pelo sítio CDADC, em ou outros, semprivada prévia autorização escrita da Editora, para exceto o permitido pelo CDADC, termosdo depagamento cópia privada AGECOP – termos de cópia pela AGECOP – Associação a Gestão da Cópia Privada,em através daspela respetivas – Associação para a Gestão da Cópia Privada, através do pagamento das respetivas taxas. taxas.
ÍNDICE As Autoras
XIII
Agradecimentos XV Prefácio XVII Lista de Acrónimos e Siglas
1. Introdução
XXI 1
1.1. Motivação 2 1.2. Estrutura do Livro 4
2. Da Informação ao Conhecimento 2.1. 2.2. 2.3. 2.4.
Introdução 8 Várias Perspetivas sobre Informação e Conhecimento
8
Tipos de Conhecimento
14
Processo de Construção de Conhecimento Organizacional
15
2.4.1. Contexto Histórico e Sociocultural do Conhecimento
17
3. Conhecimento Organizacional
© FCA
7
21
3.1. Introdução 22 3.2. Realidades Socialmente Construídas 23 3.3. Identidade Organizacional 24 3.3.1. Quatro Perspetivas sobre as Organizações 25 3.3.1.1. Perspetiva Estrutural 27 3.3.1.2. Perspetiva Social 29 3.3.1.3. Perspetiva Política 30 3.3.1.4. Perspetiva Simbólica 32
VI
Business Intelligence – Da Informação ao Conhecimento
3.4. Memória Organizacional 3.5. Aprendizagem Organizacional 3.6. Criatividade e Inovação: Aprendizagem e Adaptação 3.6.1. Riscos Associados à Mudança Organizacional 3.6.2. Mudança e Cultura Organizacional 3.6.3. Inovação e TI 3.6.4. Dimensões Simbólica e Política da Mudança Organizacional
4. Gestão de Conhecimento Organizacional
34 36 39 39 41 43 45 47
4.1. Introdução 48 4.2. Processo de Gestão de Conhecimento Organizacional 48 4.2.1. Abordagem Sociológica à Gestão de Conhecimento 51 4.2.2. Abordagem Económica à Gestão de Conhecimento 53 4.2.3 Abordagem Tecnológica à Gestão de Conhecimento 54 4.3. Sistemas Informáticos na Gestão de Conhecimento 55 4.4. Gestão da Atenção Organizacional 56 4.5. Gestão de Conhecimento na Eficiência Organizacional 61 4.6. Medição do Capital Intelectual: Indicadores 63 4.7. Medição do Capital Intelectual: Modelos 69 4.7.1. Modelo de Monitorização dos Ativos Intangíveis 70 4.7.2. Diagrama de Valor de Skandia 71 4.7.3. Balanced Scorecard 72 4.8. Business Intelligence em Organizações Inteligentes 73
5. Business Intelligence
77
5.1. Introdução 78 5.2. Conceito 78 5.3. Data Warehousing 79 5.3.1. Caraterísticas de um Data Warehouse 80 5.3.2. Metodologia de Desenvolvimento 82 5.3.3. Modelação Multidimensional 84 5.3.3.1. Esquema em Estrela 85 5.3.3.2. Esquema em Floco de Neve 87 5.3.3.3. Esquema em Constelação 89 5.3.3.4. Etapas na Modelação Multidimensional 90 5.3.3.5. Extensibilidade dos Modelos 97 5.3.4. Tabelas de Factos 97
Índice
5.3.4.1. 5.3.4.2. 5.3.4.3. 5.3.4.4.
Factos Aditivos
99
Factos Semiaditivos
102
Factos Não Aditivos
105
Tabelas de Factos Sem Factos
105
5.3.5. Tabelas de Dimensão 107 5.3.5.1. Chaves e Hierarquias 107 5.3.5.2. Alterações Possíveis às Dimensões 111 5.3.5.3. Casos Particulares 120 5.3.6. Carregamento e Refrescamento de um Data Warehouse 125 5.4. On-Line Analytical Processing 131 5.4.1. Tipos de Servidores 131 5.4.2. Operações sobre os Cubos 132 5.5. Infraestrutura Tecnológica de Suporte ao Business Intelligence 137
© FCA
6. Descoberta de Conhecimento em Bases de Dados
143
6.1. Introdução 144 6.2. Princípios 144 6.3. Fases do Processo 145 6.3.1. Seleção dos Dados 146 6.3.2. Tratamento dos Dados 146 6.3.3. Pré-processamento dos Dados 146 6.3.4. Data Mining 147 6.3.5. Interpretação de Resultados 147 6.4. Metodologia CRISP-DM 149 6.4.1. Compreensão do Negócio 151 6.4.1.1. Identificar Objetivos do Negócio 151 6.4.1.2. Descrever o Contexto 152 6.4.1.3. Identificar os Objetivos do Data Mining 153 6.4.1.4. Produzir Plano do Projeto 153 6.4.2. Compreensão dos Dados 154 6.4.2.1. Recolher os Dados 154 6.4.2.2. Descrever os Dados 155 6.4.2.3. Explorar os Dados 155 6.4.2.4. Verificar a Qualidade dos Dados 155 6.4.3. Preparação dos Dados 156 6.4.3.1. Selecionar Dados 157
VII
VIII
Business Intelligence – Da Informação ao Conhecimento
6.4.3.2. 6.4.3.3. 6.4.3.4. 6.4.3.5.
Limpar Dados
157
Construir Dados
157
Integrar Dados
158
Formatar Dados
158
6.4.4. Modelação 158 6.4.4.1. Selecionar Técnicas de Modelação 159 6.4.4.2. Definir Mecanismos de Teste 160 6.4.4.3. Construir Modelos 160 6.4.4.4. Analisar Modelos 160 6.4.5. Avaliação 161 6.4.5.1. Avaliar Resultados 161 6.4.5.2. Rever Processo 162 6.4.5.3. Identificar os Próximos Passos 162 6.4.6. Desenvolvimento 162 6.4.6.1. Planear o Desenvolvimento 163 6.4.6.2. Planear a Monitorização e Manutenção 163 6.4.6.3. Produzir Relatório Final 164 6.4.6.4. Rever o Projeto 164 6.5. Processo SEMMA 164 6.5.1. Amostragem 165 6.5.2. Exploração 165 6.5.3. Modificação 165 6.5.4. Modelação 166 6.5.5. Avaliação 166
7. Data Mining
167
7.1. Introdução 168 7.2. Tarefas de Data Mining 168 7.2.1. Classificação 168 7.2.2. Segmentação 170 7.2.3. Sumariação 172 7.2.4. Modelação de Dependências 172 7.3. Técnicas de Data Mining 172 7.3.1. Árvores de Decisão 173 7.3.2. Regras de Associação 175 7.3.3. Regressão Linear 176
Índice
7.3.4. Redes Neuronais Artificiais 7.3.5. Algoritmos Genéticos 7.3.6. Vizinhos Mais Próximos
8. Análise de Dados com Ferramentas OLAP
178 182 183 187
8.1. Introdução 188 8.2. Área da Banca 188 8.2.1. Arquitetura do Data Mart 189 8.2.2. Análise do Data Mart 191 8.2.2.1. Cliente e Tipo de Bem Financiado 192 8.2.2.2. Cliente, Tipo de Bem Financiado e Tipo de Situação 195
8.2.2.3. Tipo de Bem Financiado, Tipo de Pagamento e Tipo de Situação
197
8.2.2.4. Tipo de Bem Financiado, Tipo de Contrato e Tipo de Situação
198
8.2.2.5. Tipo de Bem Financiado, Tipo de Duração e Tipo de Situação
8.2.2.6. Tipo de Situação e Rendimento Bruto
199 203
8.3. Área do Retalho 204 8.3.1. Arquitetura do Data Mart 205 8.3.2. Análise do Data Mart 208 8.3.2.1. Classe de Produto e Classe de Custo do Produto 208
8.3.2.2. Classe de Produto e Classe de Custo da Promoção 210
8.3.2.3. Classe de Produto, Classe de Custo do Produto e Classe de Custo da Promoção
© FCA
8.3.2.4. Análise dos Valores das Vendas
210 211
8.4. Área do Marketing 214 8.4.1. Arquitetura do Data Mart 216 8.4.2. Análise do Data Mart 218 8.4.2.1. Distribuição Global dos Clientes 219 8.4.2.2. Classe de Idade e Classe de Vencimento 219 8.4.2.3. Número de Filhos, Sexo e Classe de Vencimento 220 8.4.2.4. Classe de Idade, Sexo e Casado 221 8.4.2.5. Região e Classe de Vencimento 222
IX
Business Intelligence – Da Informação ao Conhecimento
X
8.4.2.6 Conta à Ordem, Conta a Prazo e Crédito à Habitação
8.4.2.7. Carro e Número de Filhos
9. Análise de Dados com Técnicas de Data Mining
223 223 225
9.1. Introdução 226 9.2. Área da Banca 226 9.2.1. Compreensão do Negócio e dos Dados 226 9.2.1.1. O Negócio 226 9.2.1.2. Os Dados 228 9.2.2. A Descoberta de Conhecimento 234 9.2.2.1. Seleção e Tratamento dos Dados 234 9.2.2.2. Pré-processamento dos Dados 236 9.2.2.3. Data Mining 243 9.2.2.4. Interpretação de Resultados 254 9.3. Área do Retalho 256 9.3.1. Compreensão do Negócio e dos Dados 256 9.3.1.1. O Negócio 256 9.3.1.2. Os Dados 256 9.3.2. A Descoberta de Conhecimento 261 9.3.2.1. Seleção, Tratamento e Pré-processamento dos Dados
261
9.3.2.2. Data Mining 264 9.3.2.3. Interpretação de Resultados 268 9.4. Área do Marketing 271 9.4.1. Compreensão do Negócio e dos Dados 271 9.4.1.1. O Negócio 272 9.4.1.2. Os Dados 272 9.4.2. A Descoberta de Conhecimento 277 9.4.2.1. Seleção, Tratamento e Pré-processamento dos Dados
277
9.4.2.2. Data Mining 279 9.4.2.3 Interpretação de Resultados 283
10. Construção Social do Conhecimento: Análise de Dados Organizacionais
293
10.1. Introdução 294
Índice
10.2. Data Mining e Construção de Conhecimento Organizacional 10.2.1. Data Mining e Construção Individual de Conhecimento 10.2.2. Data Mining e Construção Social de Conhecimento 10.3. Orientações Práticas para Facilitar a Partilha do Conhecimento
294 297 299
Criado 301
10.4. Casos de Utilização das Ferramentas de Data Mining 303 10.4.1. Setor de Retalho 304 10.4.2. Setor Financeiro 305 10.4.3. Setor Automóvel 308 10.4.4. Setor das Telecomunicações 309
© FCA
11. Conclusões
311
Referências Bibliográficas
315
Índice de Figuras
325
Índice de Tabelas
333
Índice de Quadros
333
Índice Remissivo
335
XI
© FCA
AS AUTORAS Maribel Yasmina Santos
Professora Associada com Agregação do Departamento de Sistemas de Informação da Universidade do Minho. Doutorada em Tecnologias e Sistemas de Informação (2001), lidera diversos projetos de investigação na área de Business Intelligence and Analytics, Big Data Analytics e Big Data Warehousing. Investigadora Sénior do Centro ALGORITMI e coautora de mais de 120 publicações internacionais, incluindo livros, capítulos de livros e artigos publicados em revistas ou em atas de conferências.
Isabel Ramos
Professora Associada com Agregação no Departamento de Sistemas de Informação da Universidade do Minho. Doutorada em Tecnologias e Sistemas de Informação, lidera vários projetos nas áreas de Gestão de Conhecimento e Inovação (Centro ALGORITMI), alguns financiados pelos programas Horizon2020 e ERASMUS+. Colabora regularmente com a Association for Information Systems e International Federation for Information Processing, tendo recebido os prémios IFIP, Oustanding Service Award e Silver Core Award.
PREFÁCIO Ao prepararem a 3.ª edição do seu livro – a segunda atualização desde a 1.ª edição do livro em 2006 – a Maribel e a Isabel perguntam-me se quero aproveitar a oportunidade para rever o Prefácio que na altura escrevi. Releio o Prefácio e concluo que continua adequado. A questão central que na altura invoquei – a importância de perspetivar as tecnologias da informação no contexto empresarial em que são usadas – continua válida. Diria até que ganha nova acuidade, pois o fascínio da sofisticação das tecnologias desvia a atenção do essencial – o bem-estar das empresas – para a “esperteza” da tecnologia e dos seus feitos.
© FCA
Aproveito a ocasião para ficar a saber que novidades vão ser introduzidas no livro. Algumas das atualizações resultam, naturalmente, da experiência acumulada na utilização do livro. Por exemplo, novos casos e exemplificações que procuram melhorar a ilustração dos conceitos abordados no livro. Mas outras atualizações merecem ser salientadas na medida em que refletem o dinamismo da área focada no livro, dinamismo esse que justifica que a editora enquadre o novo livro numa coleção, entretanto criada, dedicada à Data Science. Os meus destaques vão para: apresentação do modelo do processo de definição e instalação de um Data Warehouse de Kimball e Ross; extensões aos conceitos de Data Warehousing, modelação multidimensional e das suas particularidades para a adequada representação da realidade organizacional; a utilização de ferramentas de processamento analítico e de Data Mining, reconhecidas pela forte posição que têm no mercado; inclusão de uma secção sobre gestão
XVIII
Business Intelligence – Da Informação ao Conhecimento
da atenção organizacional, reforçando os conceitos associados à memória organizacional. A existência de modelos do processo de conceção e instalação de uma tecnologia indicia um amadurecimento dessa tecnologia e da sua exploração, na medida em que revelam que já houve oportunidade de refletir sobre o que se faz e como se faz. Embora seja imprudente anunciar o amadurecimento das tecnologias de Business Intelligence, percebe-se que os contornos destas tecnologias começam a estabilizar. Por outro lado, a evolução das tecnologias relacionadas com o Business Intelligence justificam uma revisão e extensão dos conceitos relacionados com a modelação da empresa no que respeita ao seu desempenho e ao atingir das suas ambições no mundo dos negócios. A modelação dos indicadores de gestão da empresa e dos repositórios que vão permitir a produção dinâmica desses indicadores – Data Warehouses – é um dos aspetos mais enriquecidos na nova edição do livro. Numa área tão sujeita ao aparecimento de novas ferramentas e a uma grande dinâmica na sua utilização, não é fácil assegurar que as ferramentas usadas nas exemplificações têm larga aceitação e utilização nas empresas. Mas o historial das ferramentas escolhidas é um forte argumento a ser invocado para justificar a sua escolha. Não tenho dúvidas que as tecnologias de Business Intelligence vieram trazer grandes desafios ao tema da memória organizacional. As extensões introduzidas nas secções que abordam este tema refletem o seu evoluir face aos desenvolvimentos daquelas tecnologias. Releva aqui o destaque introduzido à atenção organizacional. Numa altura em que a tecnologia disponível permite aumentar dramaticamente a capacidade de processar automaticamente registos das perceções organizacionais e de analisar esses registos, bem como as tendências da sua evolução, as organizações confrontam-se com novas questões – A que devem prestar atenção? Que acontecimentos devem detetar e registar? Que indicadores devem ser considerados como fundamentais? Que tendências são relevantes? Que competências
Prefácio
são necessárias nos novos trabalhadores do conhecimento? Não tenho dúvidas que a gestão da atenção organizacional é uma área que precisa de ser desenvolvida e trazida para as práticas organizações relacionadas com a capacidade de adaptação das empresas. Felicito as autoras por darem continuidade a esta obra que ilustra bem o espírito da área científica de Tecnologias e Sistemas de Informação.
Universidade do Minho, 4 de agosto de 2017
© FCA
João Álvaro Carvalho Professor Catedrático no Departamento de Sistemas de Informação da Escola de Engenharia da Universidade do Minho
XIX
1
INTRODUÇÃO
2
Business Intelligence – Da Informação ao Conhecimento
1.1. MOTIVAÇÃO As Tecnologias da Informação (TI) têm tido, desde há já vários anos, um papel extremamente importante nas organizações. Se a sua adoção se iniciou com o propósito de automatizar os processos operacionais da organização, aqueles que suportam as atividades do dia a dia, a verdade é que o papel das TI nas organizações tem evoluído consideravelmente. Aplicações de suporte à gestão dos recursos humanos, gestão financeira e contabilística, gestão de stocks, gestão da produção, gestão de projetos, gestão logística, gestão de clientes e fornecedores, gestão da qualidade, entre outras, encontram-se perfeitamente enraizadas nas empresas. Além do suporte aos processos operacionais, estas aplicações geram uma quantidade avultada de informação, que deve ser utilizada pela organização para aumentar o conhecimento: • Sobre si própria − Quais os produtos e serviços que disponibilizamos e como essa disponibilização é feita? Quais os problemas que temos vindo a enfrentar e como os solucionamos? Quais as competências que temos? De que forma podemos usar essas competências para atingir as metas que definimos? Qual a probabilidade de sucesso da alteração do modelo de negócio atualmente implementado? • Sobre as entidades externas cuja colaboração é essencial para o sucesso do negócio − Quais são os nossos melhores clientes? Quais foram os produtos mais vendidos no mês passado? Quais os nossos fornecedores? Quais os fornecedores que, por norma, cumprem os prazos de entrega? Que organizações competem connosco? Que alterações políticas ou ambientais podem afetar o nosso negócio? • Sobre a sua capacidade para influenciar o ambiente externo em benefício próprio − Qual será o impacto, nas vendas, da diminuição do preço do artigo “xpto”? Que segmento de clientes deve ser visado pela campanha de marketing “20% de desconto em grandes marcas”? Qual a probabilidade de sucesso de um novo produto ou serviço? Como podemos vencer a concorrência? Ao permitirem obter uma resposta para as questões anteriormente indicadas, e muitas outras que não é possível aqui detalhar, as aplicações informáticas usadas pela organização são elementos essenciais da construção e partilha de conhecimento sobre si própria, o negócio que realiza, o seu exterior e a sua possibilidade de interação com as entidades externas relevantes para o negócio. Todo este conhecimento é fundamental para apoiar o processo de tomada de decisão. A informação gerada pelas aplicações informáticas disponibiliza aos gestores um conjunto de indicadores sobre o negócio, que lhes dão indicações do que aconteceu no passado e lhes permitem traçar cenários para o futuro.
2
DA INFORMAÇÃO AO CONHECIMENTO
8
Business Intelligence – Da Informação ao Conhecimento
2.1. INTRODUÇÃO Nas últimas décadas, tem sido dada uma crescente atenção à importância da informação e do conhecimento nas organizações, nomeadamente para a implementação de estratégias de sucesso, satisfação de clientes, melhoria contínua dos processos, inovação dos produtos e medição do desempenho organizacional. A gestão de informação e de conhecimento têm vindo a ser apontadas como duas atividades de gestão essenciais para que a organização possa tirar partido das competências que integra. Desta forma, os gestores ajudam a desenvolver as capacidades coletivas para inovar os produtos e processos, tornando a organização mais competitiva e flexível, qualidades essenciais para o sucesso da organização na nova economia. No entanto, as definições de informação e conhecimento são muitas e variadas, e poucos autores apresentam uma distinção clara entre estes dois conceitos. Se os gestores não forem capazes de adotar uma definição clara de informação e conhecimento, como serão capazes de os gerir e contabilizar os benefícios obtidos desta gestão? Nas secções 2.2 e 2.3 deste capítulo são apresentadas e discutidas as definições mais divulgadas na literatura académica e de negócios, ligando-as a formas específicas de gerir informação e conhecimento. Na secção 2.4 é indicada a definição de conhecimento adotada e que serve de base às discussões teóricas, apresentações de tecnologia e descrições da utilização da tecnologia contidas neste livro. Finalmente, ainda na secção 2.4, é descrito com algum detalhe o processo de construção de conhecimento. Esta visão do processo de construção de conhecimento fornece o contexto organizacional para a análise da tecnologia normalmente associada à inteligência do negócio, e que é apresentada nos Capítulos 5, 6 e 7 deste livro.
2.2. VÁRIAS PERSPETIVAS SOBRE INFORMAÇÃO E CONHECIMENTO A informação é muitas vezes apresentada como o resultado da interpretação ou do processamento de dados (Alavi e Leidner, 2001; Davenport, Harris et al., 2001; Maier, 2002). Nesta definição de informação, os dados são factos essenciais, números e outros itens elementares que não têm associado um significado específico. A informação é o resultado da agregação e composição desses dados elementares, realizada de acordo com determinados objetivos. É a informação que fornece sentido aos dados, de forma a obter descrições de acontecimentos, objetos ou situações. O conhecimento é apresentado no nível seguinte de complexidade, sendo definido como informação personalizada, ou seja, informação que as pessoas usam para dar significado aos acontecimentos, objetos
3
CONHECIMENTO ORGANIZACIONAL
22
Business Intelligence – Da Informação ao Conhecimento
3.1. INTRODUÇÃO Este capítulo apresenta o conhecimento organizacional como uma construção social em contínua reformulação e patente em todos os momentos da vida da organização. O conhecimento organizacional dá forma à identidade da organização, estrutura a sua memória, e evolui pela aprendizagem organizacional. O conhecimento organizacional encontra-se distribuído por toda a organização, nas mentes dos seus membros. Desta forma, este conhecimento influencia todas as atividades diárias da organização, desde as mais complexas às mais simples. Em cada momento, o conhecimento organizacional assume uma natureza individual e partilhada, na medida em que para decidir, agir e interagir, os membros da organização são condicionados pelos seus entendimentos subjetivos e partilhados sobre: (i) si próprios; (ii) as suas atividades; (iii) a organização como um todo; e (iv) o ambiente organizacional. A evolução e reformulação do conhecimento organizacional acontece de forma mais ou menos acentuada em todos os momentos de ação e interação dos membros da organização, quer internamente quer com o exterior desta. As TI são atualmente um elemento prevalecente desta ação e interação, apoiando-a, expandindo-a ou condicionando-a. A informação que estas tecnologias capturam e disponibilizam aos membros da organização é a base a partir da qual o conhecimento organizacional se reformula nos momentos de ação e interação. Nas próximas secções, estas ideias são exploradas em pormenor. Na secção 3.2 é apresentado o conceito de realidade socialmente construída e as implicações deste conceito na compreensão das organizações. Na secção 3.3 debruçamo-nos sobre a noção de identidade organizacional e sobre as dimensões estrutural, social, política e simbólica desta identidade. Nesta secção, argumenta-se que o conhecimento organizacional é o suporte intangível desta identidade, o qual pode ser tornado tangível pela abstração dos aspetos estruturais, sociais, políticos e simbólicos da organização. Na secção 3.4 é focado o conceito de memória organizacional, apresentada como estando distribuída por toda a organização. Esta memória encontra-se implantada nos cérebros humanos e em dispositivos manuais e automáticos. Na secção 3.5, é visto o conceito de aprendizagem organizacional como a capacidade da organização para reformular a sua identidade, a sua perceção do exterior e as suas reações a estímulos externos. Nesta secção, a mudança organizacional é analisada com algum detalhe, nomeadamente em relação aos riscos a ela associados e aos condicionamentos impostos pela cultura, política e simbolismo organizacional. Finalmente, na secção 3.6 a aprendizagem organizacional é apresentada como a base da inovação, a qual implica mudanças estruturais, operacionais e/ou culturais.
4
GESTÃO DE CONHECIMENTO ORGANIZACIONAL
48
Business Intelligence – Da Informação ao Conhecimento
4.1. INTRODUÇÃO Nos Capítulos 2 e 3 foram descritos os conceitos de conhecimento e conhecimento organizacional, apresentando-os como alicerce essencial da ação, aprendizagem e inteligência dos indivíduos e organizações. Neste capítulo é introduzido o processo de gestão de conhecimento organizacional e o seu contributo para a eficiência das organizações. Na secção 4.2 são apresentadas as principais atividades do processo de gestão de conhecimento e referidas as grandes abordagens à implementação formal deste processo nas organizações. Na secção 4.3 são enumeradas as aplicações das TI usualmente designadas por sistemas informáticos de apoio à gestão de conhecimento. No final desta secção, é proposto que todas as aplicações das TI influenciam direta ou indiretamente a gestão de conhecimento, pelo que a sua adoção deveria incluir também objetivos de apoio àquela gestão. Na secção 4.4 é apresentado o conceito atenção organizacional de acordo com a teoria desenvolvida por William Ocasio (1997), Attention-Based View of the Firm. A atenção organizacional é a base da decisão, pelo que se torna relevante fazer a avaliação da sua qualidade. Segundo Claus Rerup (2009), esta qualidade pode ser avaliada em três dimensões, estabilidade, nitidez e coerência. Na secção 4.5 é referido o contributo que a gestão de conhecimento pode ter no aumento da eficiência organizacional, a qual se traduzirá numa maior capacidade para escolher entre alternativas de ação, resolver os problemas e inovar serviços e produtos, isto é, melhorar a inteligência de negócio. Na secção 4.6, o conhecimento é referido como capital intelectual da empresa e são apresentados os fundamentos da sua gestão. Finalmente, na secção 4.7 são mostradas algumas abordagens à medição do capital intelectual das organizações.
4.2. PROCESSO DE GESTÃO DE CONHECIMENTO ORGANIZACIONAL O processo de gestão de conhecimento é uma função de gestão que tem por objetivo a criação, seleção, retenção, aplicação, reformulação, partilha e transferência de conhecimento, como forma de melhorar continuamente o desempenho da organização (Maier, 2002). É da responsabilidade desta função de gestão facilitar o fluxo de conhecimento, permitindo à organização, no seu todo, reagir a estímulos externos, adaptar-se a mudanças internas e externas, e intervir no seu ambiente, de forma a criar as condições necessárias ao seu bem-estar financeiro e social.
5
BUSINESS INTELLIGENCE
Business Intelligence – Da Informação ao Conhecimento
78
5.1. INTRODUÇÃO Os gestores, ou os agentes responsáveis pela tomada de decisão nas organizações, sabem que a informação atempada e precisa permite melhorar o desempenho do negócio1 e, como tal, o desempenho da organização. Duas áreas têm sido identificadas como essenciais na melhoria da quantidade e qualidade da informação disponível para a tomada de decisão: gestão de conhecimento e Business Intelligence. Nos capítulos anteriores, o conceito de gestão de conhecimento foi apresentado e explorado, dedicando-se este capítulo ao conceito de Business Intelligence, introduzindo-o (secção 5.2), descrevendo uma arquitetura genérica de uma infraestrutura tecnológica de apoio ao Business Intelligence e caraterizando duas das tecnologias que estão integradas nesta arquitetura: Data Warehousing (secção 5.3) e On-Line Analytical Processing (OLAP) (secção 5.4). A arquitetura é apresentada apenas no final deste capítulo (secção 5.5), após a familiarização do leitor com os conceitos utilizados na caraterização da mesma, de forma a facilitar a sua compreensão.
5.2. CONCEITO Os sistemas de Business Intelligence combinam dados com ferramentas analíticas, de forma a disponibilizar informação relevante para a tomada de decisão. O objetivo destes sistemas é melhorar a disponibilidade e qualidade desta informação (Cody, Kreulen et al., 2002). A utilização do termo Business Intelligence tem substituído designações como a de Sistemas de Suporte à Decisão, utilizadas há mais de 40 anos (Alter, 2002). Os Sistemas de Suporte à Decisão integram um conjunto de ferramentas de interrogação e geração de relatórios que permitem aos utilizadores extrair a informação de apoio à tomada de decisão, nos formatos mais apropriados para este fim. Os sistemas de Business Intelligence combinam a recolha de dados, o armazenamento dos mesmos e a gestão de conhecimento com diversas ferramentas de análise que possibilitam a extração de informação útil, a partir dos dados armazenados. As tarefas normalmente associadas ao Business Intelligence são: • Elaborar previsões baseadas em dados históricos, nos desempenhos passados e atuais da organização; • Criar cenários que evidenciem o impacto da alteração de diversas variáveis; 1
O termo negócio é comummente utilizado neste domínio, não devendo contudo ser associado apenas a atividades com fins lucrativos, mas sim às atividades das organizações. É neste contexto que este termo é utilizado neste livro, note-se.
6
DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS
144
Business Intelligence – Da Informação ao Conhecimento
6.1. INTRODUÇÃO Após a introdução dos conceitos de Business Intelligence, Data Warehousing e OLAP, passamos a apresentar (secção 6.2) os princípios subjacentes à Descoberta de Conhecimento em Bases de Dados, processo que permite a aplicação de técnicas de Data Mining para identificar padrões ou tendências nos dados. Neste capítulo são descritas as diversas fases deste processo (secção 6.3), assim como é introduzida a metodologia Cross Industry Standard Process for Data Mining (CRISP-DM), que apresenta as principais fases de um projeto de Data Mining (secção 6.4). Esta metodologia fornece um guião que auxilia o desenrolar do processo, descrevendo as tarefas a executar em cada fase e os resultados esperados pela concretização das mesmas. Este capítulo descreve ainda o processo Sample, Explore, Modify, Model e Assess (SEMMA), processo esse que constitui também um guia para os projetos de Data Mining, dando indicações acerca das etapas a realizar e da sequência entre as mesmas (secção 6.5).
6.2. PRINCÍPIOS Os princípios associados à Descoberta de Conhecimento em Bases de Dados (DCBD) conjugam fundamentos provenientes de diversas áreas, tais como a inteligência artificial, a aprendizagem automática, o reconhecimento de padrões, a estatística, as bases de dados, os sistemas de informação, entre outras. As aplicações de DCBD integram teorias, métodos e algoritmos provenientes destas diferentes áreas, tendo como objetivo a extração de conhecimento a partir de grandes bases de dados (Fayyad, Piatetsky-Shapiro et al., 1996b). Os algoritmos utilizados para procurar padrões nos dados são denominados algoritmos de Data Mining. O processo global de DCBD, que se desenvolve em várias fases, inclui a utilização dos algoritmos de Data Mining e a interpretação dos padrões encontrados pelos mesmos, os quais são posteriormente utilizados no suporte à tomada de decisão. Fayyad et al. (Fayyad, Piatetsky-Shapiro et al., 1996a, p. 6) definem a DCBD como “o processo não trivial de identificação de padrões válidos e potencialmente úteis, percetíveis a partir dos dados”. Nesta definição, um padrão pode ser caraterizado por modelos, relações ou estruturas nos dados, que devem ser percetíveis, se não imediatamente, após determinado período de processamento. Os dados representam um conjunto de factos armazenados na base de dados. Diferentes subconjuntos destes factos são responsáveis pela caraterização de diversos padrões. O termo “processo” está associado à execução de vários passos iterativos, que vão desde a seleção dos dados a analisar até à interpretação de resultados. O processo é assumido como sendo não trivial, uma vez que pode envolver a procura de estruturas, modelos, padrões ou parâmetros.
7
DATA MINING
168
Business Intelligence – Da Informação ao Conhecimento
7.1. INTRODUÇÃO Data Mining é uma das fases do processo de DCBD. Consiste na procura de relacionamentos, padrões ou modelos que estão implícitos nos dados armazenados em grandes bases de dados. Este capítulo apresenta as principais tarefas (secção 7.2) associadas ao Data Mining, assim como as técnicas (secção 7.3) comummente utilizadas na concretização de cada uma das tarefas.
7.2. TAREFAS DE DATA MINING As tarefas associadas ao Data Mining podem ser divididas em dois grupos: descrição ou previsão. A descrição permite identificar regras que caraterizam os dados analisados, enquanto a previsão utiliza determinados atributos da base de dados para prever o valor de uma outra variável. Esta distinção está associada ao objetivo da tarefa de Data Mining, que pode permitir aumentar o conhecimento acerca dos dados, descrição, ou suportar o processo de tomada de decisão, previsão, através da identificação de modelos capazes de prever o valor de uma variável (Berry e Linoff, 2000). Quando falamos de previsão, o melhor modelo é aquele que apresenta a precisão mais elevada, permitindo uma percentagem de acerto superior à percentagem de acerto conseguida por outros modelos (ainda que estes tenham sido mais fáceis de obter e de perceber). O melhor modelo em descrição pode não ser aquele que obtém resultados mais precisos (em termos de confiança do modelo), mas sim o que permite adquirir um conhecimento mais alargado dos dados analisados. As tarefas de Data Mining incluem a classificação, a segmentação, a sumariação e a modelação de dependências (Fayyad, Piatetsky-Shapiro et al., 1996a). Cada uma destas tarefas é, de seguida, descrita, apresentando as suas principais caraterísticas e exemplos de aplicação das mesmas.
7.2.1. Classificação A classificação permite o enquadramento de um conjunto de dados dentro de classes predefinidas, identificando a classe a que cada elemento pertence. A classificação de dados é um processo que passa por duas etapas (Han e Kamber, 2001). Na primeira, é identificado um modelo que integra um conjunto predefinido de classes que dividem os dados. Este modelo é obtido a partir do conjunto de dados de treino, através da análise dos registos contidos no mesmo. Estes registos são atribuídos a classes predefinidas, que constituem o conjunto de valores possíveis para o atributo de saída (atributo em relação ao qual os registos são classificados). A identificação das propriedades comuns
8
ANÁLISE DE DADOS COM FERRAMENTAS OLAP
188
Business Intelligence – Da Informação ao Conhecimento
8.1. INTRODUÇÃO Neste capítulo, é apresentada a análise de bases de dados organizacionais com ferramentas OLAP e dashboards analíticos. Associado ao conceito de sistemas de Data Warehousing, o Capítulo 5 introduziu as ferramentas OLAP como uma técnica de análise da informação armazenada nos repositórios que integram estes sistemas. Os exemplos apresentados neste capítulo são extremamente simples e visam evidenciar a definição das estruturas dos repositórios dos sistemas de Data Warehousing (nestes casos, pequenos Data Marts) para os domínios de aplicação em causa. Pretende-se, ainda, evidenciar o tipo de análises que é possível realizar sobre os dados. As próximas secções apresentam a análise de três conjuntos de dados, da área da Banca (secção 8.2), da área do Retalho (secção 8.3) e da área do Marketing (secção 8.4).
8.2. ÁREA DA BANCA O conjunto de dados, associado à Banca, analisado neste capítulo (e também posteriormente no Capítulo 9) integra 3 031 registos que caraterizam o crédito concedido por uma instituição bancária a um grupo de clientes. Este conjunto de dados é fictício, e a sua análise tem como objetivo exemplificar a exploração de diversos indicadores de negócio e perfis de clientes, sem qualquer restrição de confidencialidade dos dados, problemas que se colocariam na utilização de um conjunto com dados reais. O domínio de aplicação analisado carateriza-se pela atribuição de crédito para a aquisição de diversos tipos de bens. Os clientes solicitam um empréstimo de determinado montante à banca, o qual pode, ou não, ser concedido, dependendo de um determinado conjunto de fatores, atributos que caraterizam os clientes, como sejam a sua idade, o seu vencimento e outros dados pessoais. Os atributos que integram o conjunto de dados para análise são: Identificação, Número Fiscal, Estatuto, Nome, Bem Financiado, Tipo de Contrato, Duração, Rendimento Bruto, Valor do Crédito, Tipo de Pagamento, Crédito à Habitação, Valor da Prestação, Estado Civil, Número de Filhos, Idade e Situação. Numa perspetiva global, refere-se que, além da identificação dos clientes, à qual é associado o número de filhos, é referido o bem financiado, o tipo de pagamento selecionado pelo cliente, o valor da prestação e ainda se o cliente possui, ou não, um outro financiamento para a habitação. O atributo Situação é utilizado para assinalar os clientes que verificaram anomalias no pagamento das respetivas prestações. Para facilitar a compreensão do domínio de aplicação em causa, a Figura 8.1 apresenta o Diagrama Entidades e Relacionamentos (DER) que integra as entidades relevantes no
9
ANÁLISE DE DADOS COM TÉCNICAS DE DATA MINING
226
Business Intelligence – Da Informação ao Conhecimento
9.1. INTRODUÇÃO Neste capítulo, é apresentada a análise de diversas bases de dados organizacionais, seguindo as fases do processo de DCBD descritas no Capítulo 6. A estas fases são ainda incorporadas as etapas de Compreensão do Negócio e Compreensão dos Dados definidas na metodologia CRISP-DM, também apresentada no Capítulo 6. Os resultados obtidos neste processo de exploração de distintas bases de dados e em diferentes áreas de negócio são analisados posteriormente no Capítulo 10, exemplificando a criação de conhecimento organizacional suportado por um processo de DCBD. As próximas secções apresentam a análise de três conjuntos de dados, da área da Banca (secção 9.2), da área do Retalho (secção 9.3) e da área do Marketing (secção 9.4).
9.2. ÁREA DA BANCA 9.2.1. Compreensão do Negócio e dos Dados Seguindo a descrição da metodologia CRISP-DM, apresentada no Capítulo 6, a fase de compreensão do negócio permite identificar os objetivos do projeto e os requisitos do mesmo do ponto de vista do negócio, possibilitando posteriormente a conversão dos objetivos do negócio em objetivos do Data Mining. A fase de compreensão dos dados permite a execução de diversas tarefas de exploração dos dados, com vista à sua compreensão, à identificação de problemas nos mesmos (por exemplo, dados em falta ou dados com ruído) e à identificação de subconjuntos relevantes dos dados, os quais serão posteriormente analisados visando a identificação de padrões ou outros relacionamentos.
9.2.1.1. O Negócio O conjunto de dados analisado nesta subsecção, já apresentado no Capítulo 8, carateriza o crédito concedido aos clientes por uma instituição bancária. Do ponto de vista do negócio, pretende-se minimizar o risco de incumprimento dos clientes, que advém do crédito que lhes é concedido. Para este objetivo do negócio é definido o objetivo do Data Mining, o qual está associado à identificação do perfil dos clientes, de forma a minimizar o risco de investimento da organização. A análise do conjunto de dados da banca é realizada com a ferramenta IBM® SPSS® Modeler v17.1, pelo que as tabelas e figuras evidenciadas neste capítulo apresentam a interface desta aplicação. O IBM® SPSS® Modeler (SPSS, 2016) é uma ferramenta de DCBD que permite executar todas as fases deste processo. É um sistema baseado
10
CONSTRUÇÃO SOCIAL DO CONHECIMENTO: ANÁLISE DE DADOS ORGANIZACIONAIS
294
Business Intelligence – Da Informação ao Conhecimento
10.1. INTRODUÇÃO Neste capítulo são analisados os casos descritos no Capítulo 9 à luz dos conceitos teóricos apresentados nos capítulos iniciais deste livro. Esta análise requer que sejam aqui relembradas algumas das definições avançadas nos primeiros capítulos. Assim, conhecimento foi referido como sendo o entendimento que os indivíduos possuem acerca da realidade circundante e do seu papel nessa realidade. Este entendimento encerra um potencial para a ação e pode ser partilhado por um grupo de pessoas, passando a chamar-se conhecimento partilhado. O conhecimento individual ou do grupo possui uma componente tácita, implícita e explícita (ver a este propósito a secção 2.3). O conhecimento está sujeito a uma permanente evolução e reformulação no contexto da experiência individual e dos grupos. O processo de gestão de conhecimento foi apresentado, na secção 4.2, como sendo um processo complexo e dinâmico, o qual integra um conjunto de atividades realizadas de forma contínua e interdependente. As atividades essenciais deste processo são a criação de conhecimento, a sua retenção e recuperação, a aplicação do conhecimento e a sua partilha e transferência. Estas atividades estão integradas nas práticas organizacionais que orientam a ação dos indivíduos e grupos, a qual é mediada e/ou amplificada pelos sistemas técnicos e tecnológicos. A cultura e política organizacionais oferecem o contexto e definem os contornos finais das atividades do processo de gestão de conhecimento. O Capítulo 9 descreve sumariamente algumas implementações do processo de DCBD, com o objetivo de criar ou aprofundar o conhecimento da organização sobre o negócio que realiza. Esta atividade é apoiada pela análise de bases de dados organizacionais usando a ferramenta IBM® SPSS® Modeler v17.1. O processo e os resultados obtidos são analisados nas secções seguintes. Neste capítulo, a secção 10.2 contém a análise dos exemplos descritos no Capítulo 9. Na secção 10.3, são apresentadas algumas orientações práticas para a partilha do conhecimento criado com o apoio de ferramentas de Data Mining. Finalmente, na secção 10.4, é demonstrada evidência prática da relevância daquelas orientações.
10.2. DATA MINING E CONSTRUÇÃO DE CONHECIMENTO ORGANIZACIONAL Os exemplos de implementação do processo de DCBD em diferentes áreas de negócio, apresentados no Capítulo 9, descrevem a necessidade de gerar conhecimento para: (i) minimizar o risco de incumprimento dos clientes resultante da atribuição de crédito pela
11
CONCLUSÕES
312
Business Intelligence – Da Informação ao Conhecimento
A adoção de sistemas de Business Intelligence pelas organizações pressupõe que as mesmas perceberam o papel que as TI que lhe estão associadas desempenham, e a mais-valia que representa para a organização a informação gerada por estes sistemas. Do ponto de vista tecnológico, há que realçar que o investimento por parte da organização é considerável, não só ao nível dos recursos materiais necessários, mas, principalmente, ao nível dos recursos humanos. Apesar de estas tecnologias disponibilizarem interfaces extremamente amigáveis e fáceis de utilizar, são necessários conhecimentos técnicos para a sua correta implementação na organização. Olhando para as tecnologias apresentadas neste livro − Data Warehousing, OLAP e Data Mining − apenas a manipulação de informação, recorrendo aos cubos OLAP, é facilmente realizada pelo utilizador final, por exemplo, um analista de informação ou gestor da organização. A implementação de um sistema de Data Warehousing requer a intervenção de um especialista desta área, o qual vai contribuir de uma forma decisiva para o sucesso deste sistema na organização. O mesmo acontece com o processo de DCBD e a aplicação de algoritmos de Data Mining aos dados. Apesar de a metodologia CRISP‑DM definir detalhadamente as tarefas que devem ser realizadas em cada fase, são necessários conhecimentos técnicos para a sua concretização. Assim, para que a adoção das tecnologias associadas aos sistemas de Business Intelligence ocorra de uma forma apropriada e útil para a organização, é necessário que esta perceba as dificuldades que este processo acarreta e, como tal, a importância da constituição da equipa de recursos humanos que vai levar a cabo este projeto. Torna-se ainda necessário entender que a utilização destas tecnologias não é um fim em si, e que se integra num processo mais abrangente e diluído que é o da construção de conhecimento organizacional, o qual decorre de forma contínua e dinâmica em toda a organização. A construção de conhecimento não existe como um processo independente, o que dificulta a sua gestão. Não deixa, no entanto, de ser um dos processos vitais para o sucesso do negócio. Salvaguardada esta questão, parece-nos que os benefícios da utilização dos sistemas de Business Intelligence para a organização são evidentes. Se por um lado esta passa a conhecer melhor o seu negócio, como tem funcionado, onde residem os seus principais problemas, que tipo de melhorias podem ser introduzidas, e outros aspetos, por outro lado, passa a dispor de mecanismos que lhe permitem integrar/consolidar todo este conhecimento na organização. O conhecimento assim adquirido é efetivamente incorporado na organização, e conservado de forma a poder ser facilmente transmitido e partilhado por todos os que dele precisam.
Conclusões
Com este livro pretendemos dar uma visão mais abrangente de Business Intelligence do que aquela que é normalmente apresentada. Para além da utilização das tecnologias Data Warehousing, OLAP e Data Mining, quisemos oferecer uma perspetiva sobre a forma como essa utilização pode contribuir para tornar a organização mais inteligente e criativa. No entanto, aquilo que foi apresentado neste livro sobre construção de conhecimento organizacional, sua partilha e utilização, tem essencialmente um caráter teórico. Esta é uma área ainda em aberto para a investigação e aplicação nas organizações.
© FCA
Tal como foi referido no Capítulo 10, não existem estudos detalhados, quer nacionais quer internacionais, sobre: (i) a dinâmica social em torno da adoção e utilização de sistemas de Business Intelligence; (ii) os efeitos a longo prazo na cultura da organização; (iii) ou os contributos destes sistemas para a gestão do conhecimento organizacional. Num futuro próximo, torna-se necessário realizar projetos de investigação, pela aplicação de inquéritos e pela realização de estudos pontuais ou longitudinais em colaboração com as organizações. Esta investigação permitirá encontrar orientações práticas para os gestores interessados na maximização do contributo que os sistemas de Business Intelligence podem oferecer à capacidade das suas empresas para enfrentarem desafios e aproveitarem oportunidades, bem como tornarem-se empresas criativas e inovadoras. Estas são, afinal, as exigências da chamada sociedade do conhecimento.
313
Business Intelligence 3Edi.pdf
C
M
Y
CM
MY
CY
CMY
K
1
13/09/17
16:01