Jueves, 20 de febrero del 2020

Para aprovechar la nube de información

La ciencia de datos es una disciplina que permite manejar cantidades de información gigantescas.

Para aprovechar la nube de información
El profesional podrá utilizar la data para tomar mejores decisiones, automatizar procesos y predecir comportamientos.

Vivimos en un mundo frenético, donde a cada segundo, millones de ciudadanos toman decisiones y generan información sobre diversos aspectos de la vida. Desde los productos que utilizan, las personas con las que se relacionan, los temas de los que hablan, cómo se comportan en sus redes sociales. Todo ello genera una cantidad increíble de información que parece imposible de procesar.

Sin embargo, gracias a avanzados conocimientos en diversas ciencias aplicadas, esos datos pueden ser utilizados por las organizaciones, públicas o privadas para ofrecernos mejores servicios, productos más adecuados para nuestras necesidades, procedimientos más eficientes e, incluso, predecir comportamientos de distintos públicos. Es lo que se llama Ciencia de Datos.

Jaddy Fernández, especialista en transformación digital y catedrática de la Universidad de Lima, explica que el científico de datos tiene un conocimiento estructurado de estadística, matemática, lógica, programación y otras disciplinas que le permiten organizar, tratar y aplicar soluciones, es decir, aprovechar en su máximo esplendor la información de diferentes fuentes.

Fernández añade que, para aplicar la ciencia de datos, el primer paso es tener un propósito con el uso de los mismos. El segundo paso es procesarlos, “porque generalmente están dispersos, no estructurados, en diversos repositorios o bases de datos; también se debe validarlos y estandarizarlos”, precisa. Por último, señala que esta ciencia desarrolla formas de aterrizar estos datos, haciéndolos entendibles, estructurados y bien presentados, de modo tal que permitan darlos a entender claramente para que puedan ser utilizados en la correcta toma de decisiones.


EL USO CORRECTO DE LA INFORMACIÓN

César Beltrán, coordinador del grupo de Inteligencia Artificial de la Pontificia Universidad Católica, afirma que las organizaciones no solo están comenzando a recibir grandes volúmenes de información por parte de sus usuarios, sino que tienen la necesidad de manejar información que ellos no necesariamente generan, pero que están su alrededor proveniente de diversas fuentes como internet, redes sociales, comunicaciones móviles, etc.

Para aprovecharla, explica, se requiere desarrollar aplicaciones que traten de convertir los datos en información útil. “La ciencia de datos tiene varios componentes: la organización de la información, la ingeniería de características, la ingeniería de aprendizaje de máquinas e ingeniería de software”, dice.

Pero no basta con acumular la información, se debe procesar para identificar problemas y plantear respuestas. En ese sentido, Juan Acostupa, científico de datos que trabaja en el sector financiero [Prestamype] agrega que las soluciones que se suelen plantear dependen de la naturaleza particular de cada problema que enfrentan y de las características de los datos con los que se cuenta. “Se deben crear esas soluciones determinadas, que son diferentes cada vez. Es como contar con todas las partes de un carro, pero no puedes viajar en él hasta que lo armas de una manera correcta”, comenta.

MAESTROS DE DATOS

Para Jaddy Fernández, quienes acceden a este tipo de maestrías son tomadores de decisiones, independientemente de las carreras de las que provengan. “Las maestrías son más gerenciales; están orientadas al tema estratégico, más que al técnico. Si bien cuentan con temarios que incluyen machine learning, inteligencia artificial y otras tecnologías asociadas; lo importante es que quienes siguen este tipo de maestrías entiendan para qué sirven, cómo se usan y cuál es la mejor forma de aprovechar esas tecnologías al momento de formular sus estrategias organizacionales”.

Carlos Beltrán, considera que, lo que hace falta para conseguir un mayor progreso en este campo es la formación de profesionales capaces de desarrollar herramientas tecnológicas que faciliten el procesamiento de la información. “Creo que en el país necesitamos formar más profesionales dedicados al desarrollo de tecnología. Por eso en la PUCP tenemos maestrías y diplomados enfocados a la Inteligencia artificial y a la investigación en modelos matemáticos y estadísticos”, puntualiza.

¿QUÉ HACE UN CIENTÍFICO DE DATOS?

El portal InLab Talent & Tech de la facultad de informática de la Universidad Politécnica de Cataluña resume el proceso de los científicos de datos en cinco pasos:

▶Extraer los datos, independientemente de su fuente (webs, csv, logs, apios, etc.) y de su volumen (Big Data o Small Data).

▶Limpiar los datos, para eliminar lo que distorsiona las mismas.

▶Procesar los datos usando diferentes métodos estadísticos (inferencia estadística, modelos de regresión, pruebas de hipótesis, etc.)

▶Diseñar nuevos tests o experimentos en caso necesario.

▶Visualizar y presentar gráficamente los datos.

  • 0
  • 0
  • 0