Data Mining vs Data Warehousing
O processo de mineração de dados refere-se a um ramo da ciência da computação que lida com a extração de padrões de grandes conjuntos de dados. Esses conjuntos são então combinados usando métodos estatísticos e de inteligência artificial. A mineração de dados nos negócios modernos é responsável pela transformação de dados brutos em fontes de inteligência artificial. Os dados são manipulados e, portanto, são capazes de fornecer decisões confiáveis que podem ser usadas na tomada de decisões. Isso dá às empresas uma vantagem sobre a concorrência, pois possuem conjuntos de dados que podem ser usados para fornecer inteligência. A mineração de dados também é usada pelas organizações em práticas de criação de perfil, incluindo marketing, vigilância, descoberta científica e detecção de fraude.
Existem outros termos comuns que podem estar associados à mineração de dados, como pesca de dados, dragagem de dados ou até espionagem de dados. Tudo isso aponta para diferentes variações de mineração de dados, empregadas na amostragem de pequenos conjuntos de dados que podem ser muito pequenos para produzir inferências estatísticas. No entanto, elas são cruciais para descrever a validade dos dados em uso e podem ser usadas na criação de uma hipótese, quando se espera alcançar uma determinada população de dados..
Um data warehouse, por outro lado, é um termo que descreve um sistema em uma organização que é usado na coleta de dados. Esses dados coletados por um data warehouse são os fornecidos pelos sistemas transacionais, como fatura, registros de compra ou mesmo registros de empréstimos. Os registros de dados são obtidos dos pontos individuais de criação e reunidos sob o mesmo teto que é o data warehouse. Esses dados são relatados e os relatórios são feitos de maneira agregada para ajudar os usuários das informações comerciais a tomar decisões válidas. O data warehouse para funcionar efetivamente requer a fonte de dados, um banco de dados e uma ferramenta de relatório.
Portanto, pode-se dizer que um data warehouse é um banco de dados usado para fins específicos de geração de relatórios sobre dados que foram analisados. Esses dados são provenientes dos diferentes sistemas que foram apresentados para geração de relatórios.
Para cumprir sua função, o armazém de dados mantém funções em três camadas distintas. Isso inclui preparação, integração e acesso. No processo de preparação, os dados brutos são armazenados pelos desenvolvedores com o único objetivo de análise e suporte. A camada de integração é usada na integração de dados e para ter um nível de abstração dos usuários dos dados. Por fim, a camada de acesso é importante para obter dados de diferentes usuários de dados.
A mineração de dados e o data warehousing podem ser referidos como ferramentas usadas para a coleta de inteligência de negócios. A principal diferença dos dois é a maneira como a inteligência de negócios é coletada. Portanto, pode-se dizer que os dados que foram bem armazenados são bastante fáceis de extrair e, portanto, são utilizados. O data warehouse, portanto, é responsável por facilitar o trabalho de mineração de dados, alojando todos os dados relevantes que precisam ser extraídos em um local central, e não quando a mineração de dados precisa continuar buscando dados em locais diferentes. Isso ajuda a economizar o tempo gasto na mineração de dados e os recursos usados na mineração.
Sumário
A mineração de dados é o processo de extrair dados de grandes conjuntos de dados.
Data warehousing é o processo de reunir todos os dados relevantes.
A mineração de dados e o data warehousing são ferramentas de coleta de inteligência de negócios.
A mineração de dados é específica na coleta de dados.
O data warehousing é uma ferramenta para economizar tempo e melhorar a eficiência, reunindo dados de diferentes locais de diferentes áreas da organização.
O data warehouse possui três camadas, como preparação, integração e acesso.