Data">
Big Data WorkShop
Big Data WorkShop
Big Data WorkShop
Agenda
Hadoop Distributed
File System (HDFS)
https://hadoop.apache.org/docs/r2.10.0/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html
Arquitectura de Big Data
Preguntas y Consultas
Fuentes de Big Data
https://www.upgrad.com/blog/hadoo
p-ecosystem-components/
https://www.analyticsvidhya.com/blo
g/2020/10/introduction-hadoop-
ecosystem/
Los mecanismos representan artefactos tecnológicos que se pueden combinar para crear
arquitecturas tecnológicas de Big Data.
Ecosistema de Hadoop para Big Data
Fuente:
https://images2.programmersought.com/296/09/095063d425c55ba832d1623fd4c667a0.png
Ecosistema de Hadoop para Big Data
Fuente:
https://energie.labs.fhv.at/~repe/bigdata/introduction-to-big-data-projects/hadoop-fundamentals/
Preguntas y Consultas
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Workshop
Comandos HDFS
HDFS (Hadoop Distributed File System ) es el
sistema de archivos de almacenamiento
distribuido de Hadoop.
El HDFS tiene una gran escalabilidad y
disponibilidad para trabajar con grande
volúmenes de datos.
Definiendo…
Sistema de archivos distribuido que
proporciona almacenamiento de datos a
grandes escalas.
Los datos son distribuidos a través de los
datanodes y tienen tolerancia a fallos.
Al distribuir el almacenamiento en muchos
servidores, se optimiza el uso de los recursos
a nivel de CPU, Memoria y Disco
Preguntas y Consultas
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Preguntas y Consultas
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
HDFS divide archivos grandes en bloques también llamados DataBlocks. los cuales se almacenan y propagan a través de
los datanodes del clúster
El NameNode gestiona los metadatos. Los Datanodes gestionan los datos.
Hadoop Distributed File System (HDFS)
Los DataBlocks representan la unidad mínima de almacenamiento del sistema de archivos de Hadoop
Si los datos de un archivo tiene un peso menor al tamaño del datablock, este espacio será desperdiciado y no podrá
ser utilizado por lo datos de otro archivo.
https://hadoop.apache.org/docs/r2.10.0/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)
Hadoop Distributed File System (HDFS)