Frota rewbenio sbai 2005 proposta de uma metodologia nao parametrica

Page 1

PROPOSTA DE UMA METODOLOGIA NÃO-PARAMÉTRICA PARA AVALIAÇÃO DE REDES NEURAIS EM TAREFAS DE DETECÇÃO DE NOVIDADES

Rewbenio A. Frota, Guilherme A. Barreto e João C.M.Mota∗ {rewbenio,guilherme,mota}@deti.ufc.br ∗

Departamento de Engenharia de Teleinformática (DETI), Universidade Federal do Ceará (UFC) Av. Mister Hull S/N, Centro de Tecnologia, Campus do Pici, Fortaleza-CE

ABSTRACT Artificial neural networks have been successfully used in novelty detection applications. Several approaches for almost every network architecture are available what makes it hard to know which neural-based method is the best for a given application or data configuration. Trying to give some introductory steps, we introduce a new systematic methodology to compare the performance of neural methods applied to novelty detection. In order to compute reliable decision thresholds, we generalize the recent application of the bootstrap resampling technique to unsupervised novelty detection to the supervised case. Finally, we evaluate the performance of the neural network methods through simulations on a breast cancer data set, assessing their robustness to outliers and their sensitivity to training parameters, such as number of neurons, training epochs and size of the training set. KEYWORDS: Artificial neural networks, novelty detection, outlier detection, anomaly detection, bootstrap resampling, decision intervals.

RESUMO Redes neurais artificiais têm sido utilizadas com sucesso em aplicações de detecção de novidades. Diversas abordagens estão disponíveis utilizando quase todas as arquiteturas neurais mais conhecidas, tornando difícil saber qual dessas abordagens é melhor para uma dada aplicação. Buscando tornar este cenário menos difuso, este artigo propõe um procedimento sistemático para comparar o desempenho de métodos baseados em redes neurais aplicados à detecção de novidades. A fim de calcular limiares de decisão estatisticamente confiáveis, generaliza-se um método recente de detecção não-supervisionada de novidades para o domínio das redes supervisionadas. Para isto, é utilizado a reamostragem bootstrap. Finalmente, avalia-se o desempenho das diferentes abordagens para a detecção de novidades por meio de simulação usando um conjunto de dados de câncer de mama, avaliando sua robustez a outliers e sua sensibilidade a

VII SBAI / II IEEE LARS. São Luís, setembro de 2005

parâmetros de treinamento, tais como o número de neurônios, épocas de treinamento e tamanho do conjunto de treinamento. PALAVRAS-CHAVE: Redes neurais artificiais, detecção de

novidades, detecção de outliers, detecção de anomalias, reamostragem bootstrap, intervalos de decisão.

1

INTRODUÇÃO

Detecção de novidades é o problema de se reportar a ocorrência de novos eventos ou novas observações a partir de um modelo pré-estabelecido para os dados (Marsland, 2003). Dependendo da aplicação, pode-se encontrar também o termo detecção de observações discrepantes (outlier detection) ou detecção de anomalias (anomaly detection) referindo-se à detecção de novidades. Estas áreas têm experimentado crescente demanda dentro dos campos de aprendizado de máquinas, reconhecimento de padrões e mineração de dados. Isto se dá, em parte, pela necessidade existente em certas aplicações de detectar padrões (observações, eventos, etc.) que não se adequam suficientemente bem ao modelo construído para representar os dados. Dentre estas aplicações podem ser citadas as seguintes: detecção e diagnóstico de falhas em máquinas elétricas (Tanaka et al., 1995), processamento de imagens (Singh e Markou, 2004), aprendizado de trajetória de robôs móveis (Marsland et al., 2002), segurança em redes de computadores (Höglund et al., 2000), monitoramento de falhas em sistemas de telecomunicações (Barreto et al., 2004), entre outras. Em vista do crescente interesse, há um número considerável de estudos no campo de detecção de novidades (Hodge e Austin, 2004), porém poucos trabalhos têm sido propostos explorando plataformas de comparação, nem fornecem resultados claros indicando, por exemplo, qual técnica funciona melhor para qual tipo de dados, ou qual é mais robusta a outliers1 . Em geral, as técnicas atualmente disponíveis variam segundo os 1 Um outlier é uma observação que parece ser inconsistente com o restante daquele conjunto de dados. (Hodge e Austin, 2004)

1


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.