Data mining vs Data Warehousing
Data Mining e Data Warehousing são técnicas muito poderosas e populares para analisar dados. Os usuários que gostam de estatísticas usam o Data Mining. Eles utilizam modelos estatísticos para procurar padrões ocultos nos dados. Os mineradores de dados estão interessados em encontrar relacionamentos úteis entre diferentes elementos de dados, o que é lucrativo para as empresas. Mas, por outro lado, os especialistas em dados que podem analisar as dimensões dos negócios diretamente tendem a usar Data warehouses.
A mineração de dados também é conhecida como Descoberta de conhecimento em dados (KDD). Como mencionado acima, é um campo da ciência da computação, que lida com a extração de informações previamente desconhecidas e interessantes de dados brutos. Devido ao crescimento exponencial de dados, especialmente em áreas como negócios, a mineração de dados se tornou uma ferramenta muito importante para converter essa grande riqueza de dados em inteligência de negócios, pois a extração manual de padrões se tornou aparentemente impossível nas últimas décadas. Por exemplo, atualmente é usado para várias aplicações, como análise de redes sociais, detecção de fraudes e marketing. A mineração de dados geralmente lida com as seguintes quatro tarefas: clustering, classificação, regressão e associação. O clustering identifica grupos semelhantes a partir de dados não estruturados. Classificação é regras de aprendizado que podem ser aplicadas a novos dados e normalmente incluem as seguintes etapas: pré-processamento de dados, design de modelagem, seleção de aprendizado / recurso e Avaliação / validação. A regressão é encontrar funções com erro mínimo para modelar dados. E a associação está procurando relacionamentos entre variáveis. A mineração de dados geralmente é usada para responder perguntas como quais são os principais produtos que podem ajudar a obter alto lucro no próximo ano no Wal-Mart?
Como mencionado acima, o data warehousing também é usado para analisar dados, mas por diferentes conjuntos de usuários e um objetivo ligeiramente diferente em mente. Por exemplo, quando se trata do setor de varejo, os usuários do data warehousing estão mais preocupados com os tipos de compras populares entre os clientes, para que os resultados da análise possam ajudá-lo, melhorando a experiência do cliente. Mas os mineradores de dados primeiro conjeturam uma hipótese, como quais clientes compram um determinado tipo de produto e analisam os dados para testar a hipótese. O armazenamento de dados pode ser realizado por um grande varejista que inicialmente armazena suas lojas com os mesmos tamanhos de produtos para descobrir mais tarde que as lojas de Nova York vendem estoques de tamanho menor muito mais rapidamente do que nas lojas de Chicago. Portanto, olhando para esse resultado, o varejista pode estocar a loja de Nova York com tamanhos menores em comparação com as lojas de Chicago.
Então, como você pode ver claramente, esses dois tipos de análise parecem ser da mesma natureza a olho nu. Ambos se preocupam com o aumento de lucros com base nos dados históricos. Mas é claro que existem diferenças importantes. Em termos simples, o Data Mining e o Data Warehousing são dedicados a fornecer diferentes tipos de análise, mas definitivamente para diferentes tipos de usuários. Em outras palavras, o Data Mining procura correlações, padrões para apoiar uma hipótese estatística. No entanto, o Data Warehousing responde a uma pergunta comparativamente mais ampla e divide e corta dados a partir daí para reconhecer maneiras de melhorar no futuro.