Dados de negócios são incontestavelmente peças chave para o crescimento de qualquer empresa. Por isso faz tanto sentido a proteção desses ativos quando falamos de Big Data e Análise de Dados em AppSec.
Da mesma forma, faz sentido usarmos dados para entender e melhorar a forma como protegemos esses ativos.
Portanto, estamos vendo a busca cada vez maior por uso desses dados para identificar potenciais falhas. Afinal, essas vulnerabilidades podem fazer com que a segurança dessas informações seja comprometida.
Vamos tratar do assunto abaixo de uma forma que possa ajudar você a buscar o melhor planejamento para validar seus dados.
Nada de novo no cenário de segurança
Mesmo que o assunto de análise de dados esteja em alta, quando o foco é em segurança — principalmente em se tratando de segurança de redes —, não há nada de muito novo no horizonte.
Isso se deve ao uso de dados distribuídos em soluções de SIEM para analisar uma grande quantidade de informação e, dessa forma, apresentar resultados que podem ajudar nas decisões.
O uso de informações de logs e de vários sistemas sempre esteve sendo usada como base para a tomada de decisões. E, neste aspecto, a segurança de redes vem usando Big Data e Análise de Dados há bem mais tempo do que outras áreas.
Ferramentas de análise e correlacionamento de logs têm uso frequente, e fornecer informações que ajudam a determinar uso de novas estruturas de segurança. Isso facilita também o melhor planejamento e distribuição de orçamento.
De forma mais ampla, o uso de dados e informações consolidadas sempre serviu como base para muitas decisões, mesmo antes do termo se tornar hype.
Mas, precisamos ressaltar que mesmo tendo um uso mais antigo, as ferramentas de SIEM são passivas. Portanto, apresentam uma visão apenas a partir de um evento acontecendo ou que tenha acontecido.
Porém, nos dias de hoje, o que temos visto é o uso de dados e informações em outras áreas da segurança, e de outras formas.
Vamos buscar apresentar esta nova forma nos próximos tópicos.
Uso de Big Data e Análise de Dados em AppSec
Temos presenciado a busca crescente das empresas por soluções que possam auxiliar na criação de análises cada vez mais avançadas e preditivas. Essas análises podem ser exploradas com base em estatísticas de dados.
Com este tipo de dados sendo analisados, fica fácil para gestores identificarem quando há um desvio no padrão de comportamento. Dessa forma, é possível buscar soluções por meio de modelos preditivos.
Este tipo de análise pode ser usada para diversas fases da segurança, como por exemplo para comparar com resultados anteriores, em busca de modelos que ofereçam uma melhoria no processo de desenvolvimento.
Modelos preditivos são peças importantes das análises de dados, e podem ajudar a criar um cenário em que os analistas identifiquem as melhores soluções.
No entanto, devemos ter cuidado com quais dados usar, e de que forma eles são aplicados para gerar nossas informações. O uso de dados ou mesmo “perguntas” feitas de forma errada, podem nos levar a conclusões equivocadas. E isso seria pior do que não termos a conclusão.
Em seu artigo “When to Use Big Data Lakes to Manage Security Data”, o Gartner nos apresenta possíveis fontes de dados. No exemplo, essas fontes são usadas para alimentar uma base de análise de uma ferramenta de SIEM.
Neste momento, é bom lembrarmos que quando tratamos de SIEM e suas análises, estamos sempre falando de análises passivas de eventos. Isso é um pouco diferentes de se ter uma análise preditiva, mas serve como ilustração.
Neste caso, o grande segredo é entender que os dados gerados por ferramentas do tipo SIEM nos ajudariam para análise de eventos passados, e o pensamento em soluções e ações para evitar eventos futuros.
Entendendo o modelo preditivo em Big Data e Análise de Dados
De forma geral seria um conceito diferente do que esperamos para uma análise preditiva.
Em um modelo matemático preditivo, o que esperamos criar é um conjunto de dados estatísticos que ajudem a identificar um padrão que possa ser usado como baseline.
Novos modelos preditivos e estatísticos podem ser criado usando um conjunto de dados históricos usando algoritmos de IA e ou mesmo machine learning.
A quantidade de informações necessárias para se ter uma análise efetiva é uma das difíceis questões que devem ser respondidas e tem total impacto no resultado final.
Além do resultado final, temos que pensar na aplicação prática da análise de uma grande quantidade de dados. Isso porque se imaginarmos uma ferramenta realizando o trabalho de análise em tempo real, juntamente com a apresentação de diferentes cenários, isso exigiria um poder de processamento também muito grande.
Um exemplo pode ser dados com os seguintes dados: em uma rede com 20000 equipamentos ligados a ela — entre eles notebooks, servidores, smartphone e outros — a média de tráfego gerado é de 50 Tb de dados a cada 24 horas.
Isso equivale a uma análise de 5Gb de dados a cada segundo. E é esta análise que deveria identificar possíveis ataques e eventos com potencial de danos.
No entanto, tudo que falamos até agora tem muita mais aplicação em segurança de redes, e queremos ter uma visão mais focada em AppSec.
Big Data e Análise de Dados em AppSec: um cenário possível
Quando voltamos nossa atenção para o uso de Big Data e Análise de Dados em AppSec, podemos imaginar a análise de dados sendo feita principalmente em modelos preditivos de vulnerabilidades.
Faz sentido imaginar que poderemos usar Big Data e Análise de Dados para demonstrar quais são as vulnerabilidades mais frequentes, e como elas estão relacionadas com, por exemplo, o nível de maturidade da equipe.
Da mesma forma, também faz sentido imaginarmos que, por meio do uso de análise de dados históricos, podemos agir proativamente para treinamentos e capacitações de equipes.
Portanto, o uso de Big Data e Análise de Dados em AppSec pode ter um campo de aplicação muito vasto, e ainda estamos iniciando nossos primeiros passos neste caminho. O uso de Machine Learning e Big Data entregará às empresas um potencial enorme de combater as ameaças e as vulnerabilidades.
Mas enquanto estes mecanismos de Big Data e Análise de Dados não estão completamente integrados às soluções de AppSec, precisamos desenvolver defesas que possam suportar ataques cada vez mais sofisticados.
Ainda, se colocarmos nessa balança o aumento dos ataques vindos do próprio colaborar e ou de terceiros, vamos entender que podemos alcançar grandes avanços com o uso de Big Data e Análise de Dados em AppSec.
É importante estarmos atentos aos avanços neste campo de pesquisa e contribuir para o seu desenvolvimento: só assim podemos tornar reais os resultados tão esperados.
