Diferença entre KDD e mineração de dados

KDD vs Mineração de Dados

O KDD (Knowledge Discovery in Databases) é um campo da ciência da computação, que inclui as ferramentas e teorias para ajudar os humanos a extrair informações úteis e anteriormente desconhecidas (ou seja, conhecimento) de grandes coleções de dados digitalizados. O KDD consiste em várias etapas, e a Mineração de Dados é uma delas. Data Mining é a aplicação de um algoritmo específico para extrair padrões dos dados. No entanto, KDD e Data Mining são usados ​​de forma intercambiável.

O que é o KDD?

Como mencionado acima, o KDD é um campo da ciência da computação, que lida com a extração de informações previamente desconhecidas e interessantes de dados brutos. KDD é todo o processo de tentar entender os dados, desenvolvendo métodos ou técnicas apropriadas. Esse processo lida com o mapeamento de dados de baixo nível para outras formas, que são mais compactas, abstratas e úteis. Isso é alcançado através da criação de relatórios curtos, modelando o processo de geração de dados e desenvolvendo modelos preditivos que podem prever casos futuros. Devido ao crescimento exponencial de dados, especialmente em áreas como negócios, o KDD se tornou um processo muito importante para converter essa grande riqueza de dados em inteligência de negócios, pois a extração manual de padrões se tornou aparentemente impossível nas últimas décadas. Por exemplo, atualmente é usado para várias aplicações, como análise de redes sociais, detecção de fraudes, ciência, investimento, manufatura, telecomunicações, limpeza de dados, esportes, recuperação de informações e principalmente para marketing. O KDD é geralmente usado para responder perguntas como quais são os principais produtos que podem ajudar a obter alto lucro no próximo ano no Wal-Mart ?. Este processo tem várias etapas. Começa com o desenvolvimento de um entendimento do domínio do aplicativo e do objetivo e, em seguida, com a criação de um conjunto de dados de destino. Isto é seguido pela limpeza, pré-processamento, redução e projeção de dados. O próximo passo é usar o Data Mining (explicado abaixo) para identificar o padrão. Finalmente, o conhecimento descoberto é consolidado visualizando e / ou interpretando.

O que é mineração de dados?

Como mencionado acima, a mineração de dados é apenas uma etapa do processo geral do KDD. Existem dois objetivos principais de mineração de dados, conforme definidos pelo objetivo do aplicativo, e são: verificação ou descoberta. A verificação está verificando a hipótese do usuário sobre os dados, enquanto a descoberta encontra automaticamente padrões interessantes. Existem quatro tarefas principais de mineração de dados: clustering, classificação, regressão e associação (resumo). O clustering identifica grupos semelhantes a partir de dados não estruturados. Classificação é aprender regras que podem ser aplicadas a novos dados. A regressão é encontrar funções com erro mínimo para modelar dados. E a associação está procurando relacionamentos entre variáveis. Em seguida, o algoritmo específico de mineração de dados precisa ser selecionado. Dependendo do objetivo, diferentes algoritmos como regressão linear, regressão logística, árvores de decisão e Naïve Bayes podem ser selecionados. Em seguida, são pesquisados ​​padrões de interesse em uma ou mais formas representacionais. Finalmente, os modelos são avaliados usando precisão preditiva ou compreensibilidade.

Qual é a diferença entre KDD e Data mining?

Embora os dois termos KDD e Data Mining sejam amplamente usados ​​de forma intercambiável, eles se referem a dois conceitos relacionados, mas um pouco diferentes. O KDD é o processo geral de extrair conhecimento dos dados, enquanto a Mineração de Dados é uma etapa do processo do KDD, que trata da identificação de padrões nos dados. Em outras palavras, o Data Mining é apenas a aplicação de um algoritmo específico com base no objetivo geral do processo KDD.