Data Mining vs OLAP
A mineração de dados e o OLAP são duas das tecnologias comuns de Business Intelligence (BI). Inteligência de negócios refere-se a métodos baseados em computador para identificar e extrair informações úteis de dados corporativos. A mineração de dados é o campo da ciência da computação que lida com a extração de padrões interessantes de grandes conjuntos de dados. Ele combina muitos métodos de inteligência artificial, estatística e gerenciamento de banco de dados. OLAP (processamento analítico online), como o nome sugere, é uma compilação de maneiras de consultar bancos de dados multidimensionais.
A mineração de dados também é conhecida como Descoberta de conhecimento em dados (KDD). Como mencionado acima, é um campo da ciência da computação, que lida com a extração de informações previamente desconhecidas e interessantes de dados brutos. Devido ao crescimento exponencial de dados, especialmente em áreas como negócios, a mineração de dados se tornou uma ferramenta muito importante para converter essa grande riqueza de dados em inteligência de negócios, pois a extração manual de padrões se tornou aparentemente impossível nas últimas décadas. Por exemplo, atualmente é usado para várias aplicações, como análise de redes sociais, detecção de fraudes e marketing. A mineração de dados geralmente lida com as seguintes quatro tarefas: clustering, classificação, regressão e associação. O clustering identifica grupos semelhantes a partir de dados não estruturados. Classificação é regras de aprendizado que podem ser aplicadas a novos dados e normalmente incluem as seguintes etapas: pré-processamento de dados, design de modelagem, aprendizado / seleção de recursos e avaliação / validação. A regressão é encontrar funções com erro mínimo para modelar dados. E a associação está procurando relacionamentos entre variáveis. A mineração de dados geralmente é usada para responder perguntas como quais são os principais produtos que podem ajudar a obter alto lucro no próximo ano no Wal-Mart.
OLAP é uma classe de sistemas, que fornece respostas para consultas multidimensionais. Normalmente, o OLAP é usado para marketing, orçamento, previsão e aplicativos similares. Escusado será dizer que os bancos de dados usados para OLAP estão configurados para consultas complexas e ad-hoc com um desempenho rápido em mente. Normalmente, uma matriz é usada para exibir a saída de um OLAP. As linhas e colunas são formadas pelas dimensões da consulta. Eles costumam usar métodos de agregação em várias tabelas para obter resumos. Por exemplo, ele pode ser usado para descobrir as vendas deste ano no Wal-Mart em comparação com o ano passado? Qual é a previsão de vendas no próximo trimestre? O que se pode dizer sobre a tendência observando a variação percentual?
Embora seja óbvio que a mineração de dados e o OLAP são semelhantes porque operam com dados para obter inteligência, a principal diferença vem de como eles operam com dados. As ferramentas OLAP fornecem análise de dados multidimensionais e fornecem resumos dos dados, mas, de maneira contrastante, a mineração de dados se concentra em proporções, padrões e influências no conjunto de dados. Esse é um acordo OLAP com agregação, que se resume à operação de dados via "adição", mas a mineração de dados corresponde à "divisão". Outra diferença notável é que, enquanto as ferramentas de mineração de dados modelam dados e retornam regras acionáveis, o OLAP conduzirá técnicas de comparação e contraste ao longo da dimensão comercial em tempo real.