Diferença entre aprendizado de máquina supervisionado e não supervisionado

Diferença chave - supervisionada vs Não supervisionado Machine Learning
 

Aprendizado supervisionado e aprendizado não supervisionado são dois conceitos principais do aprendizado de máquina. O aprendizado supervisionado é uma tarefa de aprendizado de máquina de aprender uma função que mapeia uma entrada para uma saída com base nos pares de entrada-saída de exemplo. O aprendizado não supervisionado é a tarefa de aprendizado de máquina de inferir uma função para descrever a estrutura oculta a partir de dados não rotulados. o diferença chave entre aprendizado de máquina supervisionado e não supervisionado é que o aprendizado supervisionado usa dados rotulados enquanto o aprendizado não supervisionado usa dados não rotulados.

O Machine Learning é um campo da Ciência da Computação que permite que um sistema de computador aprenda com dados sem ser explicitamente programado. Permite analisar os dados e prever padrões nos mesmos. Existem muitas aplicações de aprendizado de máquina. Alguns deles são reconhecimento facial, reconhecimento de gestos e reconhecimento de fala. Existem vários algoritmos relacionados ao aprendizado de máquina. Alguns deles são regressão, classificação e agrupamento. As linguagens de programação mais comuns para o desenvolvimento de aplicativos baseados em aprendizado de máquina são R e Python. Outras linguagens como Java, C ++ e Matlab também podem ser usadas.

CONTEÚDO

1. Visão geral e principais diferenças
2. O que é aprendizado supervisionado
3. O que é aprendizado não supervisionado
4. Semelhanças entre aprendizado de máquina supervisionado e não supervisionado
5. Comparação lado a lado - aprendizado de máquina supervisionado versus não supervisionado em forma de tabela
6. Resumo

O que é aprendizado supervisionado?

Em sistemas baseados em aprendizado de máquina, o modelo funciona de acordo com um algoritmo. No aprendizado supervisionado, o modelo é supervisionado. Primeiro, é necessário treinar o modelo. Com o conhecimento adquirido, ele pode prever respostas para instâncias futuras. O modelo é treinado usando um conjunto de dados rotulado. Quando um dado fora da amostra é fornecido ao sistema, ele pode prever o resultado. A seguir, um pequeno extrato do popular conjunto de dados IRIS.

De acordo com a tabela acima, comprimento Sepal, Largura Sepal, Comprimento Patel, Largura Patel e Espécies são chamados de atributos. As colunas são conhecidas como recursos. Uma linha possui dados para todos os atributos. Portanto, uma linha é chamada de observação. Os dados podem ser numéricos ou categóricos. O modelo recebe as observações com o nome da espécie correspondente como entrada. Quando uma nova observação é dada, o modelo deve prever o tipo de espécie a que pertence.

No aprendizado supervisionado, existem algoritmos para classificação e regressão. Classificação é o processo de classificação dos dados rotulados. O modelo criou limites que separavam as categorias de dados. Quando novos dados são fornecidos ao modelo, eles podem ser categorizados com base em onde o ponto existe. O K-Nearest Neighbours (KNN) é um modelo de classificação. Dependendo do valor de k, a categoria é decidida. Por exemplo, quando k é 5, se um ponto de dados específico estiver próximo a oito pontos de dados na categoria A e seis pontos de dados na categoria B, o ponto de dados será classificado como A.

A regressão é o processo de prever a tendência dos dados anteriores para prever o resultado dos novos dados. Na regressão, a saída pode consistir em uma ou mais variáveis ​​contínuas. A previsão é feita usando uma linha que cobre a maioria dos pontos de dados. O modelo de regressão mais simples é uma regressão linear. É rápido e não requer parâmetros de ajuste, como no KNN. Se os dados mostrarem uma tendência parabólica, o modelo de regressão linear não é adequado.

Esses são alguns exemplos de algoritmos de aprendizado supervisionado. Geralmente, os resultados gerados pelos métodos de aprendizado supervisionado são mais precisos e confiáveis, porque os dados de entrada são bem conhecidos e rotulados. Portanto, a máquina precisa analisar apenas os padrões ocultos.

O que é aprendizado não supervisionado?

No aprendizado não supervisionado, o modelo não é supervisionado. O modelo trabalha por conta própria, para prever os resultados. Ele usa algoritmos de aprendizado de máquina para chegar a conclusões sobre dados não rotulados. Geralmente, os algoritmos de aprendizado não supervisionado são mais difíceis do que os algoritmos de aprendizado supervisionado, porque há poucas informações. O agrupamento é um tipo de aprendizado não supervisionado. Pode ser usado para agrupar os dados desconhecidos usando algoritmos. O k-mean e o cluster baseado em densidade são dois algoritmos de cluster.

algoritmo k-mean, coloca o k centróide aleatoriamente para cada cluster. Cada ponto de dados é atribuído ao centróide mais próximo. A distância euclidiana é usada para calcular a distância do ponto de dados ao centróide. Os pontos de dados são classificados em grupos. As posições para k centróides são calculadas novamente. A nova posição do centróide é determinada pela média de todos os pontos no grupo. Novamente, cada ponto de dados é atribuído ao centróide mais próximo. Esse processo se repete até que os centróides não mudem mais. k-mean é um algoritmo rápido de armazenamento em cluster, mas não há inicialização especificada para pontos de armazenamento em cluster. Além disso, há uma alta variação de modelos de clustering com base na inicialização de pontos de cluster.

Outro algoritmo de agrupamento é Cluster baseado em densidade. Também é conhecido como Aplicativos de Cluster Espacial Baseado em Densidade com ruído. Ele funciona definindo um cluster como o conjunto máximo de pontos conectados à densidade. Eles são dois parâmetros usados ​​para cluster baseado em densidade. São Ɛ (epsilon) e pontos mínimos. O Ɛ é o raio máximo da vizinhança. Os pontos mínimos são o número mínimo de pontos na vizinhança to para definir um cluster. Esses são alguns exemplos de agrupamentos que se enquadram no aprendizado não supervisionado.

Geralmente, os resultados gerados a partir de algoritmos de aprendizado não supervisionado não são muito precisos e confiáveis, porque a máquina precisa definir e rotular os dados de entrada antes de determinar os padrões e funções ocultos..

Qual é a semelhança entre aprendizado de máquina supervisionado e não supervisionado?

  • O aprendizado supervisionado e o não supervisionado são tipos de aprendizado de máquina.

Qual é a diferença entre aprendizado de máquina supervisionado e não supervisionado?

Aprendizado de máquina supervisionado versus não supervisionado

Aprendizado supervisionado é a tarefa de aprendizado de máquina de aprender uma função que mapeia uma entrada para uma saída com base em pares de entrada-saída de exemplo. O aprendizado não supervisionado é a tarefa de aprendizado de máquina de inferir uma função para descrever a estrutura oculta a partir de dados não rotulados.
 Funcionalidade principal
No aprendizado supervisionado, o modelo prevê o resultado com base nos dados de entrada rotulados. No aprendizado não supervisionado, o modelo prevê o resultado sem dados rotulados, identificando os padrões por conta própria.
Precisão dos resultados
Os resultados gerados a partir de métodos de aprendizado supervisionados são mais precisos e confiáveis. Os resultados gerados a partir de métodos de aprendizado não supervisionados não são muito precisos e confiáveis.
Algoritmos principais
Existem algoritmos para regressão e classificação na aprendizagem supervisionada. Existem algoritmos para agrupar em aprendizado não supervisionado.

Resumo - Supervisionado vs Não supervisionado Machine Learning

Aprendizado supervisionado e aprendizado não supervisionado são dois tipos de aprendizado de máquina. Aprendizado supervisionado é a tarefa de aprendizado de máquina de aprender uma função que mapeia uma entrada para uma saída com base em exemplos de pares entrada-saída. O aprendizado não supervisionado é a tarefa do Machine Learning de inferir uma função para descrever a estrutura oculta de dados não rotulados. A diferença entre o aprendizado de máquina supervisionado e não supervisionado é que o aprendizado supervisionado usa dados rotulados enquanto a inclinação não supervisionada usa dados não rotulados.

Referência:

1.TheBigDataUniversity. Aprendizado de máquina - aprendizado supervisionado do VS não supervisionado, classe cognitiva, 13 de março de 2017. Disponível aqui 
2. "Aprendizado não supervisionado". Wikipedia, Wikimedia Foundation, 20 de março de 2018. Disponível aqui 
3. "Aprendizado supervisionado". Wikipedia, Wikimedia Foundation, 15 de março de 2018. Disponível aqui

Cortesia da imagem:

1.'2729781 'por GDJ (Domínio Público) via pixabay