Comunidad

16 de febrero de 2020 | por: Comunicación EADIC | 0 comentarios

Nuestro amigo R: Rattle.

La minería de datos, requiere de herramientas de programación que generalmente están en R, Rattle permite su uso sin necesidad de escribir líneas de código, solo basta con hacer clics.

Rattle se suele utilizar con fines pedagógicos, ya que permite introducir al alumno en los análisis predictivos de minería de datos de la manera más sencilla posible.

Para empezar, tenemos que reconocer que la inmensa mayoría de los programadores y usuarios de las aplicaciones informáticas, prefieren realizar sus trabajos con el ratón antes que sin él.

Dicha costumbre, tiene como contrapartida que aquellos entornos en donde se requiere ser un “coder”, es decir, un escritor de código de software, presentan una curva de aprendizaje más larga para aquellos que realmente terminan dominando un lenguaje de programación o un entorno.

Pues bien, dentro de R y también en el análisis predictivo que es el aprendizaje supervisado, tenemos Rattle que una vez instalado, permite dar unos primeros pasos dentro de esas tareas.

Para cargarlo, basta con escribir las siguientes órdenes:
library(rattle)
rattle()

Entonces, nos aparecerá una pantalla semejante a la que se muestra en la imagen:

rattle

Figura 1: Pantalla inicial de rattle.

 

En este primer menú, como puede verse, podemos cargar diversos datos de fuentes variadas: Excel, csv, odbc, arff, Rdata, entre otros.

A lo largo de las pestañas que se nos muestran, podemos realizar diversas actividades que tenemos también descritas en de la metodología CRISP-DM: exploración de datos, transformación, generación de nuevas variables, modelización y evaluación de los modelos.

Con Rattle como herramienta GUI (Interfaz gráfica de usuario), la minería de datos puede realizarse en sus primeros pasos. Por eso, nosotros la usamos para introducir al alumno de manera sencilla para que comprenda los conceptos fundamentales de la materia.

Contiene además una última pestaña “log” en donde queda constancia en lenguaje R, de toda la actividad que realicemos. Esto es muy útil, puesto que permite al usuario poco experimentado empezar a conocer todas las características de la programación en R. Instrucciones que, dicho sea de paso, son perfectamente ejecutables mediante un copy-paste en el entorno de R.

En su libro Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery, Graham Williams explica las facilidades de esta herramienta, teniendo una gran recepción y recibiendo comentarios como:

“Este texto es un manual para la fantástica interfaz gráfica de usuario (GUI) de Rattle para R, que describe tanto el uso de la GUI como el código R que se invoca para llevar a cabo los cálculos…Es probable que los analistas de datos encuentren en Rattle una herramienta útil que les permita ser productivos rápidamente con R… Existe un amplio asesoramiento práctico útil sobre la preparación y manipulación de datos… Es muy adecuado para su uso en cursos de nivel intermedio sobre regresión o clasificación” -John H. Maindonald, International Statistical Review, 2012.

Esto demuestra la gran acogida a nivel mundial de Rattle, como herramienta introductora a R.

Y pensar que hay profesores que aún no lo usan…

 

Enlaces de interés:

https://rattle.togaware.com/

 

Autor: Pedro José Jiménez López, docente del Máster en Big Data y Business Intelligence de EADIC

 

Comentarios

Deja tu comentario

You must be logged in to post a comment. So log in!

EADIC Blog