Mapreduce, una tecnología creada para procesar los grandes datos

Los volúmenes de datos que generan las grandes empresas han sobrepasado las capacidades de procesamiento convencionales. La variedad de formatos: videos, textos, audios, imágenes, y la diversidad de fuentes incluyendo los smartphone y las redes sociales; han hecho que el problema se centre en el almacenaje y procesamiento de la información. Mapreduce es una tecnología que le permite gestionar datos de gran tamaño.

Las grandes empresas cada vez más incorporan el manejo de grandes datos; en un estudio se determinó que los principales departamentos de los grandes datos son marketing, operaciones y TI.

¿Qué es Mapreduce?

Es un modelo de programación utilizado en muchas empresas que se dedican al desarrollo de software en el mundo, entre Yahoo y Google; este modelo es usado para el procesamiento masivo de datos a gran escala de manera paralela.

Características del modelo de programación:

La característica principal es la programación, que permite una escalabilidad masiva a través de servidores paralelos en un clúster. La tradición era mantener un orden secuencial en la ejecución de los algoritmos de programación, incrementar la velocidad de procesamiento debido a que permite el cómputo en paralelo desde miles de servidores.

La importancia del método es que su técnica permite establecer las capacidades necesarias con las que debe contar una estructura para grandes datos; almacenamiento, protocolos de indexación, escalabilidad, distribución de consultas, y rendimiento en ambientes diversos.

Artículos Relacionados

Déjanos un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

SUSCRÍBASE A NUESTRO NEWSLETTER