Nota

Universidad Nacional de General Sarmiento - Instituto de Industria

05 de Octubre de 2015 | 5 ′ 46 ′′

“Grandes datos”, el desafío del análisis de cúmulos de información

Con la llegada del mundo digital hubo una explosión en la cantidad de datos no estructurados provenientes del uso de redes sociales, correos electrónicos, informes médicos digitales, compras online, declaraciones de impuestos, sensores y circuitos cerrados de video, entre otros. Trabajar en el almacenamiento, clasificación, análisis y gestión de este gran cúmulo de información es el desafío de Big data, o grandes datos.

En la Argentina facebook recibe más de 55 mil “me gusta” por minuto

Día a día crece la cantidad de datos que los seres humanos creamos y almacenamos en la Web. En la Argentina, y en un solo minuto, Google recibe cerca de dos millones y medio de nuevas búsquedas, se suben 3.9 horas de video a Youtube, Facebook recibe más de 55 mil “me gusta”, se generan poco menos de 10 mil twits, y se gastan cerca de 76 mil pesos en comercio electrónico, según los datos facilitados por el Observatorio de internet en Argentina a través de su Web inter.net.ar.

Si guardáramos todos los bits y bytes creados en el último año en CD’s, podríamos construir una torre que llegaría desde la Tierra hasta la Luna, de ida y vuelta, estima el gigante informático IBM. Tradicionalmente, la información se almacenaba en bases de datos pero, con la llegada del mundo digital hubo una explosión en la cantidad de datos no estructurados provenientes del uso de redes sociales, los correos electrónicos, informes médicos digitales, compras online, declaraciones de impuestos, sensores y circuitos cerrados de video, entre otros. Trabajar en el almacenamiento, clasificación, análisis y gestión de este gran cúmulo de información es el desafío de big data, o grandes datos.

A diferencia de los datos estructurados como los que figuran en las bases de datos de la AFIP, los datos no estructurados necesitan ser analizados con nuevas herramientas y enfoques, explica a Argentina Investiga el computador Javier Martínez Viademonte, investigador docente del Instituto de Industria (IDEI) de la Universidad Nacional de General Sarmiento (UNGS). Así, según los especialistas, el big data debe lidiar con las denominadas “tres v”, gestionar un gran volumen de datos, con la mayor velocidad posible y teniendo en cuenta su gran variedad.

“Sin el uso de nuevas técnicas de big data, simplemente hay información que no puede obtenerse de los datos que se generan debido a su volumen y el tiempo que llevaría procesarlo. Quizá podría pensarse que big data es un tema transversal que posibilita o complementa el desarrollo de otras áreas, como la inteligencia artificial o la internet de las cosas, referido a la interconexión digital de objetos cotidianos con internet, por ejemplo”, sostiene Javier Godoy, estudiante de la licenciatura en informática y becario del IDEI del área de informática.

Campos tan variados como la salud, la genética, el agro, las redes sociales, el marketing y las finanzas utilizan el análisis que proporcionan los grandes datos para la toma de decisiones.

“El enfoque de big data también facilita, entre otras cosas, lo relativo al seguimiento de la información en tiempo real, como por ejemplo las congestiones de tráfico, los ataques a sitios de internet o la inagotable fuente de interés que son las redes sociales. Ahí aparecen innumerables aplicaciones, desde los asistentes como Google Now, hasta la publicidad dirigida”, profundiza Martínez Viademonte.

Tal es la variedad de la información disponible en el ciberespacio que, por ejemplo, se puede saber cuáles son las palabras que más se mencionaron en los últimos diez años en las secciones de economía de los diarios Página/12 y La Nación, y sacar diversas conclusiones. Según el análisis realizado por Godoy, entre los diez términos más mencionados en Página/12 se encuentran “central” y “nacional”, palabras que no forman parte del top ten del diario La Nación, en el que sí aparecen los términos “inflación” y “pasado”.

En la actualidad, en el marco de una beca del Consejo Interuniversitario Nacional de estímulo a las vocaciones científicas, el equipo del IDEI busca predecir la producción de un cultivo a partir de las condiciones del medio. Las máquinas cosechadoras tienen sensores que a su paso miden la humedad del suelo y el rendimiento de las semillas, entre otras variables. “Con esta información, la pregunta que tenemos que responder con big data es ¿qué semilla debemos plantar en determinado suelo para obtener el máximo rendimiento? Y esa es una conclusión que se puede sacar a partir del análisis de todos los datos”, explica Martinez Viademonte, codirector de la beca y coordinador de la Licenciatura en Sistemas de la UNGS.

¿Big data modifica la forma en la que nos relacionamos con la información? “Sí, con big data se puede hacer un análisis más personalizado de los usuarios, y esto permite recomendaciones específicas en base a los patrones de comportamiento de los usuarios. Es más que probable que elegir un producto frente a otro o un destino para viajar muchas veces ya no sea coincidencia, sino una influencia que se logra con el análisis de la información. Algo similar pasa con la música que escuchamos. Empresas como Spotify predicen los gustos musicales de los usuario con big data, por lo que las recomendaciones no son casualidad”, responde Godoy. Y Martínez Viademonte profundiza: “Estamos generando muchísima información pero todavía no logramos resolver los temas asociados como privacidad, derecho o valor económico”.

Gustavo Tapia
Brenda Liener
Marcela Bello
Universidad Nacional de General Sarmiento

Comunicación y Prensa UNGS
prensa@ungs.edu.ar
www.ungs.edu.ar


NOTAS DESTACADAS
Ferroviarios: la historia recuperada de una tarea colectiva
Inteligencia artificial para prevenir fallas en gasoductos
Desarrollan un modelo hidrológico para la cuenca alta de La Picasa
Enología sustentable: buscan emplear los sarmientos de poda en la elaboración de los vinos
La importancia de los censos como herramienta científica y académica
Primer registro de Leishmania braziliensis en un murciélago de Corrientes
NOVEDADES
Diez especies de aves de Río Cuarto se benefician por el manejo orgánico
Crearon un cuero ecológico a base de hongos Reishi
Elaborarán barritas proteicas a partir de lactosuero
Un científico rosarino estudia las estrellas de neutrones
La UNR producirá medicamentos pediátricos críticos
Científicos tucumanos realizan diagnósticos por medio de inteligencia artificial
AGENDA
NOTAS RELACIONADAS
NOTAS MÁS LEÍDAS
La producción de biogás y biofertilizantes a partir de desechos agrícolas es una oportunidad para pymes agropecuarias
Elaborarán barritas proteicas a partir de lactosuero
“Yateí”, la abeja nativa sin aguijón es una excelente opción para diversificar la producción de miel
Jóvenes y el cuidado de su salud: las relaciones de micromachismo a revisar
Kit de riego automatizado que busca promover la soberanía alimentaria
NOTAS ACADÉMICAS
Fray Mamerto Esquiú, beato y defensor de la Constitución de 1853
La UNC forma parte del proyecto astronómico “Salta ventana al universo”
Diseño gráfico: el valor de la profesión y su importancia histórica
La participación política femenina en Córdoba, más allá de la historia escrita en masculino
El cine y la literatura a la luz de las nuevas tecnologías

logo SIU logo CIN logo SPU logo Ministerio de Educación

Argentina Investiga - Todos los derechos reservados