O GT-BIS é um grupo de pesquisa e desenvolvimento apoiado pela Rede Nacional de Pesquisa (RNP) que tem como objetivo o desenvolvimento de um sistema para análise de quantidades massivas de dados heterogêneos capturados em redes de computadores a fim de detectar incidentes de segurança. Serão utilizadas técnicas modernas de Inteligência artificial para correlação de dados e aprendizado de máquina, possibilitando a detecção, imediata e antecipada, de ataques que não seriam detectados com sistemas existentes e o aprendizado automático do sistema com o histórico do tráfego. Como contribuição para a RNP, espera-se que o sistema possa ser comercializado e também que auxilie nos processos internos de segurança da informação. É importante destacar também as contribuições científicas deste trabalho, como a descoberta das melhores técnicas de Inteligência Artificial na detecção de incidentes de segurança.
Com a obtenção de quantidades massivas de dados de tráfego de rede vem a necessidade de métodos mais “inteligentes” para identificar incidentes de segurança, principalmente porque passa a ser possível encontrar informações novas por meio da correlação das informações e também porque uma análise de força-bruta levaria muito tempo para ser finalizada. Neste grupo de trabalho é proposto o desenvolvimento de um sistema para análise de quantidades massivas de dados heterogêneos capturados em redes de computadores, no escopo da infraestrutura de rede da RNP, a fim de possibilitar a detecção, imediata ou antecipada, de ataques que não seriam detectados com sistemas existentes e o aprendizado automático do sistema com o histórico do tráfego.
Os objetivos a serem alcançados são:
Como inovações tecnológicas destacam-se: (i) mecanismo capaz de correlacionar grandes quantidades de dados de diferentes fontes heterogêneas de modo a detectar ataques que não seriam possíveis de serem detectados com dados de uma única fonte, (ii) mecanismo capaz de antecipar ataques com base nos dados coletados de vários sensores e (iii) o protótipo de mecanismo de aprendizado de ataques. O protótipo, ao término da Fase 1, deve ser capaz de realizar a análise de dados massivos que suporte a inclusão de diversas fontes e de gerar visualizações de incidentes de segurança, e a antecipação dos mesmos, utilizando correlação de dados provenientes de diversos pontos de uma rede de computadores bem como de fontes heterogêneas, por exemplo, cabeçalhos de pacotes e logs de aplicações.
Visão geral do processamento de quantidades massivas de dados de segurança de fontes heterogêneas
Email do grupo: : gt-bis@listas.rnp.br
Telefone: +55(11) 3091-0749
Endereço: Rua do Matão, 1010 - CEP 05508-090 - São Paulo - SP
Departamento de Ciência da Computação (DCC)
Instituto de Matemática e Estatística da Universidade de São Paulo (IME-USP)