INTRODUCCIÓN A LOS ANÁLISIS ESTADÍSTICOS EN R

INTRODUCCIÓN A LOS ANÁLISIS ESTADÍSTICOS EN R

CARRASCO RIBELLES, LUCÍA AMALIA / MARÍN MORALES, JAVIER

20,85 €
IVA incluido
Consultar disponibilidad
Editorial:
MARCOMBO S.A. BOIXAREU ED
Año de edición:
2022
Materia
Informática
ISBN:
978-84-267-3544-7
Páginas:
230
Encuadernación:
RUSTEGA
20,85 €
IVA incluido
Consultar disponibilidad

Índice general i
Preámbulo v
1 Generación de conocimiento a partir de datos 1
1.1 Datos, información y conocimiento . . . . . . . . . . . . . . . . . 1
1.2 Métodos estadísticos . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Inferencia estadística: población, muestra e incertidumbre asociada 3
2 Instalación y primeros pasos en R 5
2.1 R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Instalación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Instalación de R . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.2 Instalación e introducción a RStudio . . . . . . . . . . . . . . . 7
2.2.3 Instalando paquetes . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Importación y exportación de datos . . . . . . . . . . . . . . . . 11
2.3.1 Utilizando el importador . . . . . . . . . . . . . . . . . . . . 11
2.3.2 Utilizando comandos . . . . . . . . . . . . . . . . . . . . . . 14
2.3.3 Datos online . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.4 Datos precargados . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.5 Exportación . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4 tidyverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3 Análisis exploratorio de datos 19
3.1 Análisis exploratorio de datos . . . . . . . . . . . . . . . . . . . 19
3.2 Primer vistazo al conjunto de datos . . . . . . . . . . . . . . . . 20
3.3 Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4 Crear subconjuntos de datos . . . . . . . . . . . . . . . . . . . . 25
3.4.1 Subconjuntos de variables . . . . . . . . . . . . . . . . . . . . 25
3.4.2 Subconjuntos de registros . . . . . . . . . . . . . . . . . . . . 26
3.5 El concepto de frecuencia . . . . . . . . . . . . . . . . . . . . . . 28
3.5.1 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5.2 Tablas de frecuencia . . . . . . . . . . . . . . . . . . . . . . . 29
3.5.3 Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.5.4 Funciones de densidad . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Describiendo las distribuciones . . . . . . . . . . . . . . . . . . . 35
3.6.1 Campana de Gauss . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.2 Medidas de posición . . . . . . . . . . . . . . . . . . . . . . . 36
3.6.3 Medidas de variabilidad . . . . . . . . . . . . . . . . . . . . . 39
3.6.4 Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . 41
3.7 Visualización de datos . . . . . . . . . . . . . . . . . . . . . . . . 44
3.7.1 Gráfico de barras . . . . . . . . . . . . . . . . . . . . . . . . 45
3.7.2 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.7.3 Scatterplot . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.7.4 Pie chart . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7.5 Combinar gráficos . . . . . . . . . . . . . . . . . . . . . . . . 51
3.7.6 Exportar gráficos . . . . . . . . . . . . . . . . . . . . . . . . 52
4 La distribución normal 53
4.1 Las distribuciones de probabilidad de los datos . . . . . . . . . . 53
4.2 La distribución normal . . . . . . . . . . . . . . . . . . . . . . . 54
4.3 La distribución normal tipificada . . . . . . . . . . . . . . . . . . 56
4.4 Análisis de normalidad . . . . . . . . . . . . . . . . . . . . . . . 58
4.4.1 Q-Q plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5 Otras distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5.1 Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . 60
4.5.2 Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . 63
5 Contraste de hipótesis 67
5.1 Inferencia estadística . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2 Contrastes de hipótesis . . . . . . . . . . . . . . . . . . . . . . . 69
5.3 Metodología científica . . . . . . . . . . . . . . . . . . . . . . . . 71
5.4 Definición y formulación de hipótesis . . . . . . . . . . . . . . . 72
5.5 P-valor y nivel de significación . . . . . . . . . . . . . . . . . . . 72
5.6 Errores tipo I y tipo II . . . . . . . . . . . . . . . . . . . . . . . 73
5.7 Contraste unilateral y bilateral . . . . . . . . . . . . . . . . . . . 75
5.9 Ejemplo práctico . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.10 Tamaño de efecto, poder estadístico y tamaño de muestra . . . . 78
5.10.1 Tamaño de efecto . . . . . . . . . . . . . . . . . . . . . . . . 79
5.10.2 Poder estadístico . . . . . . . . . . . . . . . . . . . . . . . . 79
5.10.3 Calculando el tamaño de la muestra . . . . . . . . . . . . . . . 80
6 Test estadísticos 83
6.1 Métodos de contraste de hipótesis . . . . . . . . . . . . . . . . . 83
6.2 Contrastes de una variable . . . . . . . . . . . . . . . . . . . . . 86
6.2.1 Contraste para una proporción . . . . . . . . . . . . . . . . . . 86
6.2.2 Contraste para una media . . . . . . . . . . . . . . . . . . . . 89
6.2.3 Contraste para una varianza . . . . . . . . . . . . . . . . . . . 92
6.3 Contraste para proporciones de más de una variable . . . . . . . 94
6.3.1 Test de independencia Chi-cuadrado . . . . . . . . . . . . . . . 94
6.3.2 Test McNemar . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.4 Contraste para medias: test de una variable y dos condiciones . 101
6.4.1 t-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.4.2 t-test pareado . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.4.3 Wilcoxon-Mann-Whitney test . . . . . . . . . . . . . . . . . . 108
6.4.4 Wilcoxon signed rank test (pareado) . . . . . . . . . . . . . . . 110
6.5 Contraste para medias: test de una variable con más de dos condiciones . . . . . . . . . . 112
6.5.1 ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.5.2 Comparación múltiple: análisis post hoc . . . . . . . . . . . . . 118
6.5.3 ANOVA de medidas repetidas . . . . . . . . . . . . . . . . . . 122
6.5.4 Kruskal-Wallis . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.5.5 Friedman . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.6 Contraste para medias: test de una variable y más de un factor 131
6.6.1 ANOVA (two-way) . . . . . . . . . . . . . . . . . . . . . . . 131
6.7 Visualización de contraste de medias . . . . . . . . . . . . . . . 137
6.8 Contraste para varianzas: análisis de la homocedasticidad . . . . 138
6.8.1 Test de Levene . . . . . . . . . . . . . . . . . . . . . . . . . 140
6.9 Bondad de ajuste: análisis de la normalidad . . . . . . . . . . . 141
6.9.1 Test Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . . 142
6.9.2 Test Shapiro-Wilk . . . . . . . . . . . . . . . . . . . . . . . . 144
6.9.3 ¿Qué test de bondad de ajuste utilizar? . . . . . . . . . . . . . 144
6.10 Categorizando variables cuantitativas . . . . . . . . . . . . . . . 145
7 Correlaciones y regresión lineal 149
7.1 La relación de variables cuantitativas . . . . . . . . . . . . . . . 149
7.2 Correlación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.2.1 Correlación y causalidad . . . . . . . . . . . . . . . . . . . . . 151
7.2.2 Covarianza y coeficientes de correlación . . . . . . . . . . . . . 151
7.2.3 Contraste de correlación . . . . . . . . . . . . . . . . . . . . . 152
7.2.4 Coeficiente de Pearson . . . . . . . . . . . . . . . . . . . . . . 153
7.2.5 Coeficiente de Spearman . . . . . . . . . . . . . . . . . . . . . 153
7.2.6 Ejemplo de aplicación . . . . . . . . . . . . . . . . . . . . . . 154
7.3 Regresión lineal simple . . . . . . . . . . . . . . . . . . . . . . . 157
7.3.1 Formulación . . . . . . . . . . . . . . . . . . . . . . . . . . 158
7.3.2 Coeficientes de regresión . . . . . . . . . . . . . . . . . . . . . 158
7.3.3 Análisis de la precisión del modelo . . . . . . . . . . . . . . . . 160
7.3.4 Inferencia y estimación . . . . . . . . . . . . . . . . . . . . . 164
7.3.5 Condiciones necesarias . . . . . . . . . . . . . . . . . . . . . 165
7.3.6 Ejemplo de aplicación . . . . . . . . . . . . . . . . . . . . . . 166
7.4 Regresión lineal múltiple . . . . . . . . . . . . . . . . . . . . . . 169
7.4.1 Formulación . . . . . . . . . . . . . . . . . . . . . . . . . . 169
7.4.2 Coeficientes de regresión . . . . . . . . . . . . . . . . . . . . . 170
7.4.3 Análisis de la precisión del modelo . . . . . . . . . . . . . . . . 170
7.4.4 Significación global del modelo . . . . . . . . . . . . . . . . . . 171
7.4.5 Condiciones necesarias . . . . . . . . . . . . . . . . . . . . . 171
7.4.6 Ejemplo de aplicación . . . . . . . . . . . . . . . . . . . . . . 173
7.4.7 Inclusión de variables categóricas . . . . . . . . . . . . . . . . 176
7.4.8 Interacciones entre variables . . . . . . . . . . . . . . . . . . . 181
7.4.9 Regresión polinómica . . . . . . . . . . . . . . . . . . . . . . 183
7.4.10 Selección de variables independientes . . . . . . . . . . . . . . . 187
7.4.11 Validación y test . . . . . . . . . . . . . . . . . . . . . . . . 191
8 Detección de valores atípicos y faltantes 199
8.1 Valores que pueden invalidar el análisis . . . . . . . . . . . . . . 199
8.2 Valores atípicos u outliers . . . . . . . . . . . . . . . . . . . . . 200
8.2.1 Detección univariante . . . . . . . . . . . . . . . . . . . . . . 201
8.2.2 Detección multivariante . . . . . . . . . . . . . . . . . . . . . 206
8.3 Valores faltantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.3.1 Descripción y visualización . . . . . . . . . . . . . . . . . . . 210
8.3.2 Imputación . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
Bibliografía 219

La estadística es una herramienta esencial para extraer un conocimiento riguroso a partir del análisis de datos, tanto para la toma de decisiones empresariales como para la investigación científica. Sin embargo, su aprendizaje a menudo se hace tedioso, y es común perderse en la notación matemática o los conceptos teóricos. En este libro encontrará una introducción a los métodos estadísticos desde una perspectiva eminentemente práctica y actualizada. Está destinado a cualquier estudiante, investigador o profesional que necesite aplicar análisis estadísticos en un conjunto de datos, independientemente de su naturaleza. Los conceptos teóricos se presentan utilizando la menor notación matemática posible mediante descripciones intuitivas. Cada capítulo incluye ejemplos prácticos de análisis con el código y los datos necesarios para implementar los análisis presentados en R sin necesidad de tener conocimientos previos de programación. Gracias a la lectura de este libro, asimilará y aprenderá a realizar técnicas de estadística descriptiva, y a aplicar los principales métodos de contraste de hipótesis, paramétricos y no paramétricos, así como correlaciones y regresiones, además de la forma de tratar los datos anómalos y los faltantes, en un programa informático de referencia en estadística como es R. Con todo ello, esta es una guía completa que le permitirá minimizar la curva de aprendizaje y adquirir la seguridad necesaria para identificar el análisis estadístico apropiado en cada caso y realizarlo con éxito. Javier Marín Morales es doctor en Tecnologías para la Salud y el Bienestar, investigador en el Instituto de Investigación e Innovación en Bioingeniería (Universitat Politècnica de València, UPV) y colaborador docente en el Departamento de Estadística e Investigación Operativa Aplicadas y Calidad (UPV). Lucía Amalia Carrasco Ribelles tiene un Máster en Ciencia de Datos y es investigadora en la Fundación Instituto Universitario para la Investigación en Atención Primaria de Salud Jordi Gol i Gurina (IDIAPJGol). Ambos autores han publicado numerosos artículos en revistas científicas y tienen amplia experiencia en R.

Artículos relacionados

  • LÁNZATE A LA IA. DESPIERTA TUS SUPERPODERES
    FUENTES CALLE, ARTURO
    Tus superpoderes ya existen. Solo te falta dar el primer paso. Si todavía miras la IA con distancia, no estás solo . A muchos les pasa: sienten curiosidad, pero también respeto, dudas o la sensación de 'esto no es para mí'. La IA no es una moda pasajera: es la siguiente etapa natural de la digitalización que ya transformó cómo trabajamos, aprendemos y nos comunicamos. Mirar ...
    Solo 1 en stock

    19,90 €

  • LA BIBLIOTECA ROSA. UNA CASA DE LOCOS, 13. ¡OTRA VEZ ALBÓNDIGAS!
    GAY, OLIVIER
    ¿Cuántas albóndigas puede soportar una familia antes de que el caos se apodere de la mesa? ¡Lincoln Loud está a punto de averiguarlo!¿Martes de albóndigas otra vez? ¡En la casa Loud, eso es una señal de alarma, cucharas volando y once hermanos al borde de la locura! Lincoln, el cerebro de la operación (y el único chico entre tanto alboroto), tiene una misión: salvar a sus herma...
    En stock

    7,50 €

  • FANCY BEAR SE VA DE PHISHING
    SHAPIRO, SCOTT J.
    Es una paradoja de nuestros tiempos que vivamos en la sociedad de la información, pero no entendamos cómo funciona. ¿Qué pasaría si supiésemos más? En Fancy Bear se va de phishing, Scott J. Shapiro recurre a su popular clase en la universidad de Yale sobre hackeo para mostrar que el cibercrimen tiene menos que ver con la programación defectuosa que con el cableado imperfecto de...
    Solo 1 en stock

    31,95 €

  • COMPRENDER LOS ALGORITMOS
    Y. BHARGAVA, ADITYA
    Los algoritmos que utilizas con más frecuencia ya han sido descubiertos, probados y comprobados. La segunda actualización de Comprender los algoritmos hace que sea muy fácil aprenderlos, comprenderlos y usarlos. Con explicaciones maravillosamente sencillas, más de 400 ilustraciones divertidas y docenas de ejemplos relevantes, aprenderás a desbloquear el poder de los algoritmos ...
    Solo 1 en stock

    36,95 €

  • SI ALGUIEN LA CREA, TODOS MORIREMOS
    YUDKOWSKY, ELIEZER / SOARES, NATE
    "En 2023, cientos de expertos en inteligencia artificial advirtieron que supone un grave riesgo de extinción para la humanidad. Desde entonces, la carrera se ha intensificado: empresas y países compiten por crear máquinas más inteligentes que cualquier persona, y el mundo no está preparado. Durante décadas, Yudkowsky y Soares han estudiado cómo pensarán estas inteligencias y co...
    Solo 1 en stock

    21,90 €

  • AGOTAMIENTO DIGITAL
    LEONARDI, PAUL
    Todos conocemos la sensación del agotamiento digital. El scrolling sin rumbo, los ojos vidriosos frente a la pantalla. No importa cuántos mensajes respondas, cuántas publicaciones leas o cuánta información proceses, no hay forma de mantenerte al día. En Agotamiento digital, el experto en transformación digital y profesor, el Dr. Paul Leonardi, nos muestra cómo podemos reimagina...
    Solo 1 en stock

    21,90 €