Análisis de datos en R un enfoque moderno
Este curso borda una amplia gama de temas, desde la instalación de las herramientas necesarias hasta el uso de técnicas avanzadas de Machine Learning.
Los estudiantes aprenderán a trabajar con diferentes tipos de datos en R, como vectores, matrices, listas y marcos de datos. También se enseñará cómo utilizar la librería dplyr y el enfoque Tidy para manipular y transformar datos de manera reciente. Además, se explorará cómo la simulación puede ser utilizada para resolver problemas estadísticos y entender mejor los conceptos subyacentes. Se enseñará cómo utilizar la simulación Montecarlo, Bootstrap y Jackknife para estimar el error estándar de un estadístico y se compararán estas estimaciones con los valores teóricos.
1. Instalación de R, RStudio y Posit
2. Estructura de Datos en R.
3. La librería dplyr y el enfoque Tidy
4. La simulación como herramienta computacional para la solución y entendimiento de problemas estadísticos.
5. Simulación Montecarlo en el manejo de
- a. Error estándar de un estadístico
- b. Comparación con el Error estándar teórico
6. Simulación Bootstrap en el manejo de
- a. Error estándar de un estadístico
- b. Comparación con el Error estándar teórico y Montecarlo
7. Simulación Jackknife en el manejo de
- a. Error estándar de un estadístico
- b. Comparación con el Error estándar teórico, Montecarlo y Bootstrap
8. Visualización de datos
9. Reducción de Varianza con método MonteCarlo
10. Jackknife después de Bootstrap
11. Intervalos de Confianza Bootstrat y su comparación con métodos tradicionales.
12. Bootstrapping con dependencias
13. Medidas de similaridad
14. Matrices de Correlación
15. Introducción a las pruebas de Hipótesis con las consideraciones modernas.
16. Estimación de potencia de pruebas mediante remuestreo.
17. Diseño de Experimentos y Modelos lineales: enfoque usual
18. El papel de la simulación en el análisis de la varianza
19. Diseño de Experimentos y Modelos lineales: enfoque robusto
20. Machine Learning
- a. Introducción y métodos
- b. Datos de entrenamiento y prueba
- c. Regresión múltiple en ML
- d. Regresión logística en ML
21. Bootstrapping en ML
22. ML no supervisado: Clusters Jerárquicos
23. ML no supervisado: Componentes Principales