Descripción
Inicios Próximos:
Aún no tenemos inicios de este curso |
Objetivos:
Después de completar este curso, los estudiantes serán capaces de:
- Explicar cómo funcionan el servidor de Microsoft R y el cliente de Microsoft R.
- Utilizar R Client con R Server para explorar grandes cantidades de datos almacenadas en diferentes almacenes de datos.
- Visualizar los datos mediante gráficos y trazados.
- Transformar y limpiar grandes conjuntos de datos.
- Implementar opciones para dividir trabajos de análisis en tareas paralelas.
- Construir y evaluar modelos de regresión generados a partir de big data.
- Crear, puntuar e implementar modelos de particiones generados a partir de big data.
- Usar R en los entornos de SQL Server y Hadoop.
Audiencia:
La audiencia principal de este curso es la gente que desea analizar grandes conjuntos de datos dentro de un entorno de big data.
La audiencia secundaria son desarrolladores que necesitan integrar los análisis R en sus soluciones.
Prerrequisitos:
Además de su experiencia profesional, los estudiantes que asisten a este curso deben tener:
- Experiencia de programación con R y familiaridad con paquetes R comunes
- Conocimiento de métodos estadísticos comunes y mejores prácticas de análisis de datos.
- Conocimiento básico del sistema operativo Microsoft Windows y su funcionalidad principal.
- Conocimiento de trabajo de bases de datos relacionales.
Certificación:
Contenido:
Módulo 1: Microsoft R Server y R Cliente
1.1 ¿Qué es el servidor de Microsoft R?
1.2 Usando el cliente de Microsoft R
1.3 Las funciones de ScaleR
1.4 Laboratorio: exploración de Microsoft R Server y Microsoft R Client
1.4.1 Usando el cliente R en VSTR y RStudio
1.4.2 Explorando funciones de ScaleR
1.4.3 Conectándose a un servidor remoto
Módulo 2: Explorando Big Data
2.1 Comprensión de las fuentes de datos de ScaleR
2.2 Lectura de datos en un objeto XDF
2.3 Resumiendo datos en un objeto XDF
2.4 Laboratorio: Explorando Big Data
2.4.1 Lectura de un archivo CSV local en un archivo XDF
2.4.2 Transformando datos en entrada
2.4.3 Lectura de datos de SQL Server en un archivo XDF
2.4.4 Generando resúmenes sobre los datos XDF
Módulo 3: Visualización de Big Data
3.1 Visualización de datos en memoria
3.2 Visualizando Big Data
3.3 Laboratorio: Visualización de datos
3.3.1 Usar ggplot para crear un gráfico facetado con superposiciones
3.3.2 Usando rxlinePlot y rxHistogram
Módulo 4: Procesamiento de Big Data
4.1 Transformando Big Data
4.2 Administrar conjuntos de datos
4.3 Laboratorio: Procesamiento de Big data
4.3.1 Transformando Big Data
4.3.2 Ordenando y fusionando Big data
4.3.3 Conectándose a un servidor remoto
Módulo 5: Paralelización de operaciones de análisis
5.1 Uso del contexto de cálculo RxLocalParallel con rxExec
5.2 Usando el paquete revoPemaR
5.3 Laboratorio: uso de rxExec y RevoPemaR para paralelizar operaciones
5.3.1 Usando rxExec para maximizar el uso de recursos
5.3.2 Crear y usar una clase PEMA
Módulo 6: Creación y evaluación de modelos de regresión
6.1 Agrupación de Big Data
6.2 Generando modelos de regresión y haciendo predicciones
6.3 Laboratorio: creación de un modelo de regresión lineal
6.3.1 Creando un cluster
6.3.2 Creando un modelo de regresión
6.3.3 Genera datos para hacer predicciones
6.3.4 Usa los modelos para hacer predicciones y comparar los resultados
Módulo 7: Creación y evaluación de modelos de particionamiento
7.1 Crear modelos de particiones basados en árboles de decisión.
7.2 Probando modelos de partición haciendo y comparando predicciones
7.3 Laboratorio: creación y evaluación de modelos de particionamiento
7.3.1 Dividir el conjunto de datos
7.3.2 La construcción de modelos
7.3.3 Ejecutando predicciones y probando los resultados
7.3.4 Comparando resultados
Módulo 8: Procesamiento de Big Data en SQL Server y Hadoop
8.1 Usando R en SQL Server
8.2 Usando Hadoop Map / Reduce
8.3 Usando Hadoop Spark
8.4 Laboratorio: procesamiento de big data en SQL Server y Hadoop
8.4.1 Crear un modelo y predecir los resultados en SQL Server
8.4.2 Realizando un análisis y trazando los resultados usando Hadoop Map / Reduce
8.4.3 Integración de una secuencia de comandos sparklyr en un flujo de trabajo de ScaleR
Costos:
Este costo incluye: Material de estudio, el uso de una computadora por persona, certificados, refrigerios e impuestos de ley.
Reviews
There are no reviews yet, would you like to submit yours?