Big data y analytics, ¿es lo mismo?

Organizaciones de todo el mundo y en diversas industrias están empleando big data con el fin de obtener más información sobre su negocio y mejorar los procesos. Sin embargo, no es raro que muchos ejecutivos se pregunten si manejar grandes datos es lo mismo que analizarlos.

Los dos pueden estar relacionados, pero hay diferencias críticas entre ellos, según Andrew McAfee, investigador principal del Instituto de Tecnología de Massachusetts (MIT) y Erik Brynjolfsson, profesor de Schussel Family en la Sloan School of Management del MIT.

¿Por qué grandes datos no siempre son buenos datos?

En un artículo reciente de la Harvard Business Review, los dos describieron tres puntos clave donde los datos grandes son diferentes de los analíticos:

Volumen – Investigaciones recientes realizadas por la firma de analistas International Data Corp. (IDC) indican que la cantidad global de datos digitales crecerá de 130 exabytes a 40.000 exabytes en 2020.

Por ejemplo, Walmart recopila más de 2.5 petabytes de datos cada hora de las transacciones del cliente por sí solo. Un petabyte es un cuatrillón de byte o aproximadamente el equivalente a 20 millones de gabinetes de texto. Considere que el 90 por ciento de los datos de hoy sólo se creó en los últimos dos años.

Velocidad – La velocidad de los datos es aún más importante que el volumen. El acceso a la información en tiempo real o casi en tiempo real permite a las organizaciones ser más rápidas en la toma de decisiones y ejecutar movimientos que sus competidores.

Por ejemplo, un grupo de investigadores del MIT Media Lab utilizó datos de localización de teléfonos móviles para determinar cuántas personas estaban en el estacionamiento de Macy's el Viernes Negro, el comienzo de las compras navideñas en los Estados Unidos. Esto les permitió estimar las ventas de la empresa minorista ese día incluso antes de que Macy's pudiera registrar sus ventas.

Variedad – Big data viene en muchas formas. Puede venir en forma de imágenes publicadas en Facebook, correo electrónico, mensajes de texto, señales de GPS de teléfonos móviles, tweets y otras actualizaciones de medios sociales.

Estas formas de datos se conocen colectivamente como datos no estructurados. Cada persona hoy en día es potencialmente un generador de datos ambulantes. Eso es, sin embargo, datos que no están organizados en la base de datos.

Las bases de datos estructuradas que almacenan la mayoría de la información corporativa no son adecuadas para almacenar y procesar grandes datos.

Al mismo tiempo, los elementos de la informática como el almacenamiento, la memoria, el procesamiento y el ancho de banda se están volviendo más baratos, lo que hace más económico que las empresas lleven a cabo enfoques de análisis de información caros y que requieren muchos datos.

Los datos grandes pueden ser desestructurados y poco manejables, pero hay una enorme cantidad de señales vitales entre el “ruido” que la acompaña. El valor está esperando ser extraído.

 

Fuente: www.itworldcanada.com

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

* Copy This Password *

* Type Or Paste Password Here *