“Grandes datos”, el desafío del análisis de cúmulos de información

Universidad Nacional de General Sarmiento - Instituto de Industria

05 de Octubre de 2015 | 5 ′ 46 ′′


“Grandes datos”, el desafío del análisis de cúmulos de información


Con la llegada del mundo digital hubo una explosión en la cantidad de datos no estructurados provenientes del uso de redes sociales, correos electrónicos, informes médicos digitales, compras online, declaraciones de impuestos, sensores y circuitos cerrados de video, entre otros. Trabajar en el almacenamiento, clasificación, análisis y gestión de este gran cúmulo de información es el desafío de big data, o grandes datos.

Día a día crece la cantidad de datos que los seres humanos creamos y almacenamos en la Web. En la Argentina, y en un solo minuto, Google recibe cerca de dos millones y medio de nuevas búsquedas, se suben 3.9 horas de video a Youtube, Facebook recibe más de 55 mil “me gusta”, se generan poco menos de 10 mil twits, y se gastan cerca de 76 mil pesos en comercio electrónico, según los datos facilitados por el Observatorio de internet en Argentina a través de su Web inter.net.ar.

Si guardáramos todos los bits y bytes creados en el último año en CD’s, podríamos construir una torre que llegaría desde la Tierra hasta la Luna, de ida y vuelta, estima el gigante informático IBM. Tradicionalmente, la información se almacenaba en bases de datos pero, con la llegada del mundo digital hubo una explosión en la cantidad de datos no estructurados provenientes del uso de redes sociales, los correos electrónicos, informes médicos digitales, compras online, declaraciones de impuestos, sensores y circuitos cerrados de video, entre otros. Trabajar en el almacenamiento, clasificación, análisis y gestión de este gran cúmulo de información es el desafío de big data, o grandes datos.

A diferencia de los datos estructurados como los que figuran en las bases de datos de la AFIP, los datos no estructurados necesitan ser analizados con nuevas herramientas y enfoques, explica a Argentina Investiga el computador Javier Martínez Viademonte, investigador docente del Instituto de Industria (IDEI) de la Universidad Nacional de General Sarmiento (UNGS). Así, según los especialistas, el big data debe lidiar con las denominadas “tres v”, gestionar un gran volumen de datos, con la mayor velocidad posible y teniendo en cuenta su gran variedad.

“Sin el uso de nuevas técnicas de big data, simplemente hay información que no puede obtenerse de los datos que se generan debido a su volumen y el tiempo que llevaría procesarlo. Quizá podría pensarse que big data es un tema transversal que posibilita o complementa el desarrollo de otras áreas, como la inteligencia artificial o la internet de las cosas, referido a la interconexión digital de objetos cotidianos con internet, por ejemplo”, sostiene Javier Godoy, estudiante de la licenciatura en Informática y becario del IDEI del área de informática.

Campos tan variados como la salud, la genética, el agro, las redes sociales, el marketing y las finanzas utilizan el análisis que proporcionan los grandes datos para la toma de decisiones.

“El enfoque de big data también facilita, entre otras cosas, lo relativo al seguimiento de la información en tiempo real, como por ejemplo las congestiones de tráfico, los ataques a sitios de internet o la inagotable fuente de interés que son las redes sociales. Ahí aparecen innumerables aplicaciones, desde los asistentes como Google Now, hasta la publicidad dirigida”, profundiza Martínez Viademonte.

Tal es la variedad de la información disponible en el ciberespacio que, por ejemplo, se puede saber cuáles son las palabras que más se mencionaron en los últimos diez años en las secciones de economía de los diarios Página/12 y La Nación, y sacar diversas conclusiones. Según el análisis realizado por Godoy, entre los diez términos más mencionados en Página/12 se encuentran “central” y “nacional”, palabras que no forman parte del top ten del diario La Nación, en el que sí aparecen los términos “inflación” y “pasado”.

En la actualidad, en el marco de una beca del Consejo Interuniversitario Nacional de estímulo a las vocaciones científicas, el equipo del IDEI busca predecir la producción de un cultivo a partir de las condiciones del medio. Las máquinas cosechadoras tienen sensores que a su paso miden la humedad del suelo y el rendimiento de las semillas, entre otras variables. “Con esta información, la pregunta que tenemos que responder con big data es ¿qué semilla debemos plantar en determinado suelo para obtener el máximo rendimiento? Y esa es una conclusión que se puede sacar a partir del análisis de todos los datos”, explica Martinez Viademonte, codirector de la beca y coordinador de la Licenciatura en Sistemas de la UNGS.

¿Big data modifica la forma en la que nos relacionamos con la información? “Sí, con big data se puede hacer un análisis más personalizado de los usuarios, y esto permite recomendaciones específicas en base a los patrones de comportamiento de los usuarios. Es más que probable que elegir un producto frente a otro o un destino para viajar muchas veces ya no sea coincidencia, sino una influencia que se logra con el análisis de la información. Algo similar pasa con la música que escuchamos. Empresas como Spotify predicen los gustos musicales de los usuario con big data, por lo que las recomendaciones no son casualidad”, responde Godoy. Y Martínez Viademonte profundiza: “Estamos generando muchísima información pero todavía no logramos resolver los temas asociados como privacidad, derecho o valor económico”.

Comunicación
prensa@ungs.edu.ar
Marcela Bello
Comunicación y Prensa UNGS


Mumuki, el software que programa una educación distinta

Mumuki, el software que programa una educación distinta

La plataforma educativa desarrollada promueve nuevos modos de aprendizaje en el aula. Fue reconocida con el premio Innovar 2016. Se trata de una idea aplicada que habilita nuevos modos de participación, modifica las relaciones docente-alumnos, plantea una dinámica alternativa de aprendizaje y estimula la creatividad y la promoción de valores como la solidaridad.

Sistema para traducir a texto el lenguaje de señas

Sistema para traducir a texto el lenguaje de señas

Un equipo de investigadores trabaja en el desarrollo de un sistema informático capaz de traducir simultáneamente a texto el Lenguaje de Señas Argentino (LSA). La iniciativa servirá para mejorar la comunicación de las personas con discapacidad auditiva.

Estudiantes desarrollan aplicación para la comunicación

Estudiantes desarrollan aplicación para la comunicación

A partir de un estudio sobre los medios que utilizan los estudiantes para informarse en la Universidad Nacional Arturo Jauretche, surgió la iniciativa de crear una aplicación institucional. Junto a estudiantes de la carrera de Ingeniería en Informática, se trabaja sobre un conjunto de herramientas que brinde información sobre la Universidad desde los teléfonos celulares y tabletas electrónicas. El proyecto se encuentra en su etapa de pruebas, esperan contar con la aplicación antes de fin de año.

Tabla ECREP, una herramienta que hace posible medir la creatividad publicitaria

Tabla ECREP, una herramienta que hace posible medir la creatividad publicitaria

Un grupo de investigadores de Mendoza se planteó la necesidad de establecer parámetros que permitan determinar el grado o nivel de creatividad de un soporte de comunicación. Así, surgió el desarrollo de la Tabla ECREP, que combina diversas variables como la originalidad, la conectividad, la lógica, el impacto, la emotividad, la fantasía y el quiebre.

Redes sociales, las más elegidas por los universitarios

Redes sociales, las más elegidas por los universitarios

Según un relevamiento de la Universidad Nacional de La Matanza, tanto Facebook como Twitter son las plataformas sociales más elegidas para intervenir en las programaciones radiofónicas. El trabajo arrojó que en 2009, el principal dispositivo para escuchar la radio era la radio portátil, sin embargo, en 2016 el más usado es el celular. Los resultados se desprenden de una investigación realizada por un docente de la Universidad.

Agua potable, crean un software para el desarrollo de sistemas de abastecimiento

Agua potable, crean un software para el desarrollo de sistemas de abastecimiento

Un equipo del Instituto de Tecnología (INTEC) de la Fundación UADE trabaja en el desarrollo de un software para la generación de un sistema de abastecimiento de agua potable. A diferencia del tradicional concepto de aplicación para ingeniería, que resuelve los aspectos técnicos de forma independiente con poca posibilidad de integración de resultados, el diseño del modelo está basado en la interrelación de sus diferentes aspectos.

Dirección Nacional de Desarrollo Universitario y Voluntariado

Canal de videos 103

Más enviadas