R en hadoop y el idioma r

Video: Introducción a R - tutorial de computación estadística

La disciplina de aprendizaje de máquina cuenta con un catálogo rico y extenso de técnicas. Mahout trae una serie de herramientas estadísticas y algoritmos para la mesa, pero sólo captura una fracción de esas técnicas y algoritmos, ya que la tarea de convertir estos modelos para un marco MapReduce es un desafío.

Video: Introducción a Data Science aplicado a datos espaciales usando el lenguaje R

Con el tiempo, mahout es seguro de continuar la expansión de su caja de herramientas estadística, pero hasta entonces todos los científicos y estadísticos que hay datos necesitan estar al tanto de software de modelización estadística alternativa - que es donde entra en juego R.

El lenguaje R es un entorno de lenguaje y el desarrollo estadístico de código abierto potente y popular. Ofrece un ecosistema rico análisis que pueden ayudar a los científicos de datos con la exploración de datos, visualización, análisis estadístico y la computación, modelado, aprendizaje automático, y la simulación. El lenguaje R es comúnmente utilizado por los estadísticos, los mineros de datos, analistas de datos, y (hoy en día), los científicos de datos.

Video: Programación en Lenguaje R

programadores de lenguaje R tienen acceso a la Red Integral R Archivo (CRAN) bibliotecas que, a partir del momento de escribir estas líneas, contiene más de 3000 programas de análisis estadístico. Estos complementos pueden introducirse en cualquier proyecto de I, proporcionando herramientas analíticas ricos para el funcionamiento de clasificación, regresión, clustering, modelos lineales y algoritmos de aprendizaje automático más especializados.

El lenguaje es accesible para quienes están familiarizados con simples tipos de estructura de datos - vectores, escalares, tramas de datos (matrices), y similares - comúnmente utilizados por los estadísticos, así como programadores.

Video: R Programming Software and Statistics Tutorials (All Videos)

Fuera de la caja, uno de los principales escollos con el uso de la lengua I es la falta de apoyo que ofrece para ejecutar tareas concurrentes. herramientas de lenguaje estadísticos como R sobresalen en un análisis riguroso, pero carecen de escalabilidad y soporte nativo para cálculos paralelos.

Estos sistemas son no distribuibles y no fueron desarrolladas para ser escalable para el moderno petabyte-mundo de grandes volúmenes de datos. Las propuestas para la superación de estas limitaciones necesitan para extender el alcance de R más allá de la carga en memoria y entornos de ejecución de ordenador individuales, mientras que el mantenimiento de un estilo de R como algoritmos estadísticos fácilmente desplegables.

Artículos Relacionados