Comunidad

19 de abril de 2017 | por: Equipo Comunicación | 0 comentarios

El análisis de datos: Lenguajes de programación

Entendiendo el concepto de análisis de datos vemos que una definición corriente sería determinarlo como un proceso de inspeccionar, limpiar y transformar datos con el objetivo de resaltar información útil, lo que sugiere conclusiones, y apoyo a la toma de decisiones.

El análisis de datos tiene múltiples facetas y enfoques que abarca diversas técnicas en una variedad de nombres en diferentes negocios y distintos sectores. Los datos se coleccionan y se analizan para dar respuesta a preguntas, probar hipótesis y conjeturas o probar la invalidez de ciertas teorías.

En los últimos años la legislación de ciertos sectores se ha endurecido notablemente, sumado a la competitividad en un mercado globalizado ha llevado a la necesidad por parte de las distintas empresas y organizaciones de realizar una gestión óptima y una toma de decisiones en base a la información disponible. Para ello, es sumamente importante el poder sacar el máximo provecho a la información realizando buen análisis de datos.

Análisis de datos

Independientemente de las numerosas aplicaciones y soluciones que existen hoy en día para el análisis de datos, hay varios lenguajes de programación comúnmente utilizados por profesionales para realizar dicha tarea en los que cabe destacar:

  • Lenguaje de programación R. Con enfoque estadístico y muy popular entre los data scientists. Es la versión open source del lenguaje S. R es un lenguaje muy útil, además de permitirte manipular y organizar datos en gráficas.
  • Lenguaje de programación SAS. SAS también se utiliza para análisis estadístico. Es una herramienta poderosa para transformar la información desde bases de datos a formatos legibles como HTML o PDF, así como tablas y gráficos.
  • Lenguaje de programación Python. Si bien los lenguajes R y SAS son los típicos en el mundo del análisis, Python se ha consagrado como uno de los grandes competidores. Uno de los mayores beneficios es la variedad de bibliotecas y funciones estadísticas que ofrece. Se trata de un lenguaje open source y probablemente el más sencillo de aprender con muchos recursos disponibles.
  • Lenguaje de programación SQL. SQL, que significa Lenguaje de Consulta Estructurado, no se relaciona con estadísticas, sino que se centra en el manejo de información y bases de datos relacionales. Es el lenguaje de bases de datos más utilizado y es open source, por lo que los científicos de datos no deben ignorarlo. Con SQL se pueden crear bases de datos SQL, manejar los datos que las integran y utilizar funciones relevantes.

Autor: Héctor Romero, profesor del Máster en Big Data y Business Intelligence y del Curso de Business Intellgence (Fundamentos de Inteligencia de Negocio)

Máster en Big Data y Business Intelligence

Comentarios

Deja tu comentario

You must be logged in to post a comment. So log in!

EADIC Blog