El proceso de Datificación
Con cada vez mayor asiduidad aparecen términos vinculados con la
tecnología que vienen a denunciar descubrimientos o fenómenos trascendentales para el desarrollo de la vida
futura de la sociedad. En estos últimos años el turno le ha tocado al “Big
Data”, ya habiendo pasado por procesos similares el cloud computing, y otros
tantos conceptos que hoy ya forman parte de nuestra vida cotidiana pero que
aparecen en un primer momento con cierta extrañeza y novedad en nuestras vidas.
¿Qué es el Big Data y qué impacto puede llegar a tener en nuestra vida?
Sin perjuicio que existen
numerosas definiciones sobre lo que puede considerarse Big Data, la más
sencilla es brindada por ……………….. quienes consideran que “Big data es el término que describe
el almacenamiento y análisis de un gran y complejo conjunto de datos a través
de la utilización de una serie de técnicas especiales a tales fines.”
No hay una pauta objetiva para determinar cuántos son
los datos necesarios para que se consideren Big Data, sino que va a
evolucionando junto con la cada vez más increyente capacidad de analizar datos.
Esa gran cantidad de datos que se viene generando
producto de las cada vez más actividades que generan datos, ha llegado a llamar
a este proceso como “datafication”, que en español debería leerse como
“datificación” del mundo. Para tomar
cabal idea del ritmo del crecimiento del volumen de los datos en juego conviene
recordar la comparación que hizo Eric Schmidt, el chairman de Google “Desde el nacimiento de la civilización hasta
2003 la humanidad generó cinco exabytes de datos, para pasar a generar cinco
exabytes en la actualidad cada dos días……, y el ritmo se acelera.”
¿Pero cómo es que se generan tantos datos? Pensemos
en nuestra vida diaria: el teléfono
inteligente cuenta con GPS menciona
nuestra localización todo el tiempo que esté prendido, cada compra que hacemos
en Internet o a través de tarjetas de crédito, el botón de like que utilizamos
en Facebook, implican un mensaje digital adicional que se está agregando en una
botella, y ahora el océano se encuentra prácticamente cubierto con una
infinidad de botellas de ese tipo.
No sólo se trata de gran cantidad sino
también de datos más complejos.
El otro cambio en cuanto a los
datos es que ahora se generan nuevos y más complejos tipos de datos, como por
ejemplo los registros digitales de las conversaciones, imágenes de video y
fotos, conversaciones a través de redes sociales (hastags, etc.).
En este mundo de Big Data algunos
hablan de 4vs que le dan sus principales características:
i)
Volumen:
Por la gran cantidad de datos producidos cada segundo en el mundo.
ii)
Velocidad:
Por la velocidad con que se mueve dicha información como por ejemplo los datos
de las tarjetas de crédito o de los mercados financieros.
iii)
Variedad:
increyente cantidad de diferentes tipos de data (desde datos financieros a
conversaciones en chats pasan por gran variedad de tipos de datos)
iv)
Veracidad:
Por el desorden en que se presenta la información, solamente pensar en los
hashtags y abreviaturas utilizadas en Twitter, los diferentes idiomas, etc.
Sin embargo la
relevante trascendencia que presenta este proceso, es que en la actualidad se
utiliza tecnología, antes inexistente, para juntar la gran cantidad y
diversidad de datos y analizarlos, actividad que antes nunca se había realizado
con este nivel de intensidad. Y que ha llamado a esta nueva actividad como “Big
Data Analytics.”
Para tomar verdadera
dimensión de este fenómeno de Big Data se pueden ejemplificar con algunas situaciones
que se vienen presentando en la actualidad.
• El FBI está combinado
datos de redes sociales, cámaras de circuito cerrado de televisión, llamadas
telefónicas y mensaje de textos para localizar a los delincuentes y predecir el
próximo ataque terrorista.
• Facebook está
utilizando herramientas de reconocimiento facial para comparar las fotos que un
usuario ha subido al sitio con las de los demás para encontrar potenciales
amigos.
• Los políticos están
usando análisis de medios sociales para determinar donde tienen que hacer
campaña y a quien tienen que dirigir su mensaje para ganar las próximas
elecciones.
• Análisis de vídeo y
datos de los sensores de los juegos de béisbol o de fútbol se utiliza para
mejorar el rendimiento de los jugadores y equipos. Por ejemplo, ahora se puede
comprar una pelota de béisbol con más de 200 sensores en lo que le dará
retroalimentación detallada sobre cómo mejorar su juego.
• Los artistas como
Lady Gaga están utilizando datos de nuestras preferencias y las secuencias de
escucha para determinar la lista de reproducción más popular para sus
conciertos en vivo.
• El auto sin conductor de Google está analiza una gigantesca
cantidad de datos procedentes de sensores y cámaras en tiempo real para
permanecer en el camino de manera segura.
• La información de GPS
acerca de donde nuestro teléfono está y qué tan rápido se está moviendo ahora
se utiliza para proporcionar informes del tráfico en tiempo real.
• Las empresas están
utilizando análisis de los posts en Facebook y Twitter para determinar y
predecir el volumen de ventas y el valor de una marca.
• Los supermercados
están combinando sus datos de la tarjeta de fidelización con la información de
los medios sociales para detectar y aprovechar el cambio de los patrones de
compra. Por ejemplo, es fácil para los minoristas para predecir que una mujer
está embarazada, simplemente sobre la base de los patrones de compra cambiantes.
Esto les permite dirigirse a las mujeres embarazadas con promociones de
artículos relacionados con el bebé.
• También se han venido
desarrollado investigaciones de los datos en relación a la salud que permitan identificar
patrones previos a la irrupción de enfermedades permitiendo a través de una intervención
temprana aplicar el tratamiento adecuado.
Igual todo no es color
de rosa puesto que la Datificación puede ser usado con fines loables así como
con objetivos espurios.
Resulta casi inmediata
la asociación del tratamiento de datos con el riesgo al que está sometida la privacidad
de la ciudadanía. Si bien
originariamente los temores surgían frente a la amenaza que significaba el
sector privado (tarjetas de crédito, buscadores de Internet, etc.) desde que
surgieron las revelaciones de Edward Snowden la atención ha cambiado de foco al
detenerse en la forma en que los gobiernos, en este caso la NSA de los Estados
Unidos procede a recopilar y analizar los grandes datos, que incluyen llamadas
telefónicas y la actividad en las redes sociales tanto de personas nacionales
como extranjeras.
En el mundo de los
negocios se avizora que aquellos que sepan interpretar los datos digitales que
dejan sus clientes sin dudas contarán con una ventaja sobre el resto.
La ventaja competitiva
tal vez haya que buscarla en la calidad del análisis y la proximidad con el
tiempo real en que pueda obtenerse el mismo, y no tanto en los insumos cargados
para realizar dicho análisis, los cuales seguramente van a tender a estar
estandarizados.
Esta utilización
intensiva de los datos también va a ser utilizada por el sector público para
poder adoptar mejores políticas públicas a través del procesamiento de aquella
información que le sea provista en una etapa inicial los sensores o cámaras que
se encuentren en el espacio público, para luego proceder a contar con sus
propios procuradores de información.
Tanto en la actualidad
como el futuro próximo no van a existir los suficientes recursos humanos con
capacidad científicas o conocimientos para evaluar todo los datos que se están
generando. Sin embargo algunos pocos ejemplos ya demuestran hacer la diferencia
dándole un valor agregado a la información que han venido juntando y a través
de la misma, mejorar la relación con el cliente.
No obstante la interacción entre el
consumidor y las empresas debe combinarse en su punto justo a través de un
criterio transparente y de cierto control sobre la información con que se
cuenta, generando la pregunta por parte del consumidor a la empresa ¿Qué
servicio me vas a dar con toda la información que tenés de mí?
Frente a los rápidos cambios de
contexto que se vienen produciendo y el valor que han adquirido los datos es
importante comprender la cadena de valor de estos últimos así como el rol que
asumen cada uno de los principales actores de dicha cadena dado el cambio
significativo en los roles y responsabilidades de cada uno en las diferentes
actividades relacionadas con datos (generación, recolección, procesamiento,
agregación, compartimiento, acceso, reuso, distribución, entrega y uso final).
Cambios futuros que se pronostican como consecuencia del proceso de
datificación:
ámbito Empresarial:
i)
El análisis
automatizado de los datos permitirá reducir los tiempos para obtener una
planificación confiable y focalizada que permita rápidamente adaptarse a los
continuos cambios de tendencias que se presentan en el mercado, permitiendo un
desarrollo de una segmentación de mercado.
ii)
Mejorar la
productividad de los trabajadores desde el momento que se podrá obtener datos sobre
los trabajos realizados, el tiempo empleado, las capacidades requeridas para su
realización, y hasta focalizar el procedimiento de selección de personal frente
a las nuevas necesidades que puedan surgir antes las nuevas modalidades de
trabajo que se impongan con motivo de análisis de los datos.
iii)
Aparición de nuevas áreas
o puestos en las empresas que no sólo están representadas por especialistas en
el análisis de datos sino también por operarios en la detección de datos relevantes
para su posterior análisis.
ámbito Informático:
iv)
Surgimiento de discusiones
acerca de la calidad de los datos necesarios para realizar mejores análisis. En
una primera aproximación podemos anticipar que van a resultar muchos más
valiosos los datos integrados que aquellos datos aislados.
v)
Aquellos aplicativos
que permitan el análisis de los datos resultan uno de los elementos más
preciados del mercado.
vi)
La principal fuente de
generación de datos van a ser las máquinas (conocida como la Internet de las
cosas) que crecerán mucho más rápido que cualquier otra fuente de datos destinados
al análisis, incluso aún más que aquellos datos generados por los propios
humanos a través de las redes sociales. Los datos generados por las máquinas
por lo general están estructurados y contienen pequeña información (por ejemplo
ubicación y temperatura de un camión refrigerador, o los miles de sensores de
las diferentes partes de un avión).
vii)
Tendencia a la convergencia
de los procesos de análisis, como ser el análisis predictivo, data discovery, GIS
y otras formas de análisis llevarán a una automatización del análisis mediante el
aleccionamiento de las máquinas, smart ETL y otros procesos automatizados.