Diferença entre RDBMS e Hadoop

o diferença chave entre RDBMS e Hadoop é que o O RDBMS armazena dados estruturados enquanto o Hadoop armazena dados estruturados, semiestruturados e não estruturados.

O RDBMS é um sistema de gerenciamento de banco de dados baseado no modelo relacional. O Hadoop é um software para armazenar dados e executar aplicativos em clusters de hardware comum.

CONTEÚDO

1. Visão geral e principais diferenças
2. O que é RDBMS
3. O que é o Hadoop
4. Comparação lado a lado - RDBMS vs Hadoop em forma de tabela
5. Resumo

O que é RDBMS?

RDBMS significa Sistema de Gerenciamento de Banco de Dados Relacional com base no modelo relacional. No RDBMS, as tabelas são usadas para armazenar dados, e as chaves e os índices ajudam a conectar as tabelas. Uma tabela é uma coleção de elementos de dados e eles são as entidades. Ele contém linhas e colunas. As linhas representam uma única entrada na tabela. As colunas representam os atributos.

Por exemplo, o banco de dados de vendas pode ter entidades de clientes e produtos. O cliente pode ter atributos como customer_id, nome, endereço, phone_no. O item pode ter atributos como id_produto, nome etc. A chave primária da tabela do cliente é customer_id enquanto a chave primária da tabela do produto é product_id. Colocar o product_id na tabela do cliente como uma chave estrangeira conecta essas duas entidades. Da mesma forma, as tabelas também estão relacionadas entre si. Eles fornecem integridade, normalização e muitos outros dados. Poucos RDBMS comuns são MySQL, MSSQL e Oracle. Eles usam SQL para consultar.

O que é o Hadoop?

O Hadoop é uma estrutura de código aberto Apache escrita em Java. Ajuda a armazenar e processar uma grande quantidade de dados em grupos de computadores usando modelos de programação simples. O principal objetivo do Hadoop é armazenar e processar Big Data, que se refere a uma grande quantidade de dados complexos. A taxa de transferência do Hadoop, que é a capacidade de processar um volume de dados dentro de um período específico, é alta.

Existem quatro módulos na arquitetura Hadoop. Eles são comuns do Hadoop, YARN, HDFS (Sistema de Arquivos Distribuídos do Hadoop) e MapReduce do Hadoop. O módulo comum contém as bibliotecas e utilitários Java. Ele também possui os arquivos para iniciar o Hadoop. O Hadoop YARN executa o agendamento de tarefas e o gerenciamento de recursos de cluster.

Além disso, o HDFS (Hadoop Distributed File System) é o sistema de armazenamento Hadoop. Ele usa a arquitetura mestre-escravo. O nó Mestre é o NameNode e gerencia os metadados do sistema de arquivos. Outros computadores são nós escravos ou DataNodes. Eles armazenam os dados reais. Por outro lado, o Hadoop MapReduce faz o cálculo distribuído. Possui os algoritmos para processar os dados. No HDFS, o nó Mestre possui um rastreador de tarefas. Ele executa tarefas de redução de mapa nos nós escravos. Há um Rastreador de tarefas para cada nó escravo para concluir o processamento dos dados e enviar o resultado de volta ao nó principal. No geral, o Hadoop fornece armazenamento massivo de dados com alto poder de processamento.

Qual é a diferença entre RDBMS e Hadoop?

RDBMS vs Hadoop

RDBMS é um software de sistema para criar e gerenciar bancos de dados baseados no modelo relacional. O Hadoop é uma coleção de software de código aberto que conecta muitos computadores para resolver problemas que envolvem uma grande quantidade de dados e computação.
 Variedade de dados
RDBMS armazena dados estruturados. O Hadoop armazena dados estruturados, semiestruturados e não estruturados.
Armazenamento de dados
RDBMS armazena uma quantidade média de dados. O Hadoop armazena uma grande quantidade de dados que o RDBMS.
 Rapidez
No RDBMS, as leituras são rápidas. No Hadoop, as leituras e gravações são rápidas.
Escalabilidade
RDBMS possui escalabilidade vertical. O Hadoop tem escalabilidade horizontal.
Hardware
RDBMS usa servidores high-end. Hadoop usa hardware de commodity.
  Taxa de transferência
O rendimento do RDBMS é maior. O rendimento do Hadoop é menor.

Resumo - RDBMS vs Hadoop

Este artigo discutiu a diferença entre RDBMS e Hadoop. A principal diferença entre o RDBMS e o Hadoop é que o RDBMS armazena dados estruturados enquanto o Hadoop armazena dados estruturados, semiestruturados e não estruturados.

Referência:

Ponto 1.Tutoriais. "Conceitos SQL RDBMS". , Tutorials Point, 8 de janeiro de 2018. Disponível aqui  
Ponto 2.Tutoriais. "Tutorial do Hadoop." , Tutorials Point, 8 de janeiro de 2018. Disponível aqui  

Cortesia da imagem:

1.'8552968000'por Intel Free Press (CC BY-SA 2.0) via Flickr