Bienvenidos a Bioestadística con R
Autor
Prefacio
Acerca del libro
Agradecimientos
1
Descargando e instalando R y Rstudio
1.1
Paquetes en R
1.2
Iniciando con R
2
Introdución
2.1
Funciones Básicas en R
2.2
Operaciones Básica en R
2.3
Objetos y Vectores
2.4
Listas
2.4.1
Función Concatenar
2.4.2
Función listar
2.4.3
Remover objetos
2.5
Creando vectores
2.6
Vectores y matrices
2.7
Patrones simples para vectores
2.7.1
Crear una simple secuencia de números.
2.7.2
Repetir patrones, utilizando la función rep().
2.8
Práctica
2.8.1
Función “rnorm”
2.8.2
Función “set.seed”
2.8.3
Genere 10 valores con una distribución normal.**
2.9
Solicitando ayuda a R
2.9.1
Genere un vector denominado “a”, que contenga 10 valores con una distribución normal, cuya media sea de 17, con una desviación estándar de 3.**
2.9.2
Genere un histograma del vector “a”. Ver figura **
2.9.3
Genere dos vectores aleatorios que contengan 10 valores cada uno, denominados “a” y “b”, cuyo vector “a” tenga una media de 35 y “b” de 42, con desviaciones estándares de 4 y 2.5 respectivamente. Proceda a unir las variables en un data.frame que se denomine “cuadro”.**
2.9.4
Genere un “Diagrama de cajas del vector”cuadro“. Ver figura **
2.9.5
Visualice la base de datos de airquality. Ver cuadro **
2.9.6
Extraer de la base de datos de airquality, la variable “Ozone”, y elaborar un diagrama de cajas, en color gris. Ver figura Ver figura **
2.9.7
Calcular un resumen estadístico de la variable “Ozone”, contenida en la base de datos de airquality.**
2.9.8
Crear un vector que se llame, “variable”, que contenga los siguientes datos: 5,4,8,7,6,6,2,4,5,8,9,1,2,0,4,5.**
2.9.9
Crear una secuencia de datos que inicie en 5 y termine en 40, que sean cada 4, cuyo objeto se llame “y”.**
2.10
Principios básicos de la edición gráfica en R
2.11
Parámetros gráficos
2.12
Inclusión de colores en las gráficas
2.13
Uso de simbolos “pch” y lineas (“lty y lwd”)
2.14
Atajos en R
3
Importando Datos
3.1
Procedimiento para importar datos en formato “.csv”.
3.2
Procedimiento para importar datos en formato de un archivo Excel “.xlsx”.
3.3
Procedimiento para importar datos en formato “.txt”.
4
Aprendiendo Estadística
4.1
Métricas para estadísticas descriptivas
4.2
Resumenes de datos numéricos en R.
4.2.1
Estructura de los datos
4.2.2
Cantidad de datos
4.2.3
Mediana
4.2.4
Promedio
4.2.5
Valor máximo
4.2.6
Valor mínimo
4.2.7
Cuantiles, Cuartiles y Percentiles
4.2.8
Percentiles
4.3
Resumen completo.
4.3.1
Resumenes para marcos de datos (data.frame)
4.4
Coeficiente de variación
4.5
Media Geométrica
4.6
Media Armónica
4.7
Moda
4.8
Error estándar
4.9
Curtosis
4.10
Asimetría
5
Distribución de Frecuencias
5.1
Utilizando bases de datos
5.2
Obtención del número de clases en la distribución de frecuencias
5.3
Práctica
5.3.1
Obtenga el set completo de la distribución de frecuencia para la variable “weight”. Interprete la primera clase de la Frec.
5.3.2
Interprete la tercera clase de Frec. rel.
5.3.3
Interprete la segunda clase de Frec. Acum.
5.3.4
Interprete la segunda clase de Frec. Rel. Acum.
5.3.5
Elabore un polígono de frecuencia, agregue un título y color a su figura.
5.3.6
Elabore un polìgono de frecuencia
5.4
Resumen de funciones utilizados en R
6
Probabilidad Discreta
6.1
USE LA FUNCION MASA
6.2
USE LA FUNCION ACUMULADA
6.3
Probabilidad Binomial
6.4
Ejemplos
6.4.1
Determine cual es la probabilidad de que exactamente 3 parcelas no pierdan su cosecha?**
6.4.2
Cual es la probabilidad de que exactamente 3 parcelas pierdan su cosecha?**
6.4.3
Al menos 3 parcelas tengan perdida de cosecha.**
6.4.4
Un reciente estudio indica que los estudiantes de universidades de primer ingreso a carrera utilizan aproximadamente 35.4% el recurso de libros impresos para obtener su información de trabajos o tareas. Sea x una variable aleatoria binomial, y con base a una muestra aleatoria de n=23, utilizada como fuente para obtención del dato.
6.4.5
Encuentre la probabilidad que de x sea igual a 5. Dicho de otra forma, de que 5 estudiantes utilicen libros impresos.**
6.4.6
Encuentre la probabilidad de que al menos x sea de 7.** Solución. n = 23; x = 7; p = 0.354; q = 0.646
6.4.7
Calcular la probabilidad de que una variable aleatoria binomial de parámetros n=15, p=0.4 tome el valor 7.
6.4.8
Encontrar que cuantil de una variable aleatoria binomial de parámetros n=15,
6.4.9
Encontrar el percentil 73 de una variable aleatoria binomial de parámetros n=15,
6.4.10
Encontrar el percentil (x) de una variable aleatoria binomial de parametros n=15, p=0.4, que tome el valor 4:**
6.5
Forma gráfica de la distribución binomial
6.5.1
n = 10; x = 0:10 parcelas no pierdan su cosecha; p = 0.75; q = 0.25.**
6.5.2
n = 10; x = 0:10 parcelas pierdan su cosecha; p = 0,25; q = 0,75.**
6.5.3
Graficar resultados con funciones que involucren la regla de complementación.
6.5.4
Se conoce que la probabilidad que ocurra el evento es de 0.35. Describa como es la probabilidad resultante de por lo menos en 0 a 10 intentos de 10 ensayos tratados.**
6.5.5
Se conoce que la probabilidad que ocurra el evento es de 0.65. Describa como es la probabilidad resultante de por lo menos en 0 a 10 intentos de 10 ensayos tratados.***
6.5.6
Obtenga un cuadro resumen utilizando la funcion cbind(., ) de sus resultados.**
6.5.7
Determine cual es la probabilidad de que exactamente 6 eventos, ocurran de los 10 ensayos tratados.**
6.5.8
Se conoce que la probabilidad que ocurra el evento es de 0.35. Describa como es la probabilidad resultante de 0 a 10 intentos de 10 ensayos tratados.**
6.5.9
Obtenga un cuadro resumen utilizando la funcion cbind(., ) de sus resultados.**
6.5.10
Se realizan de 0:10 intentos de una variable “x” que sigue una distribucion binomial, y se tiene que la probabilidad de que ocurra el evento es 0.65. Cual seria la probabilidad de que menos de 7 eventos ocurran en los 10 ensayos tratados.**
6.5.11
Se realizan de 0:10 intentos de una variable “x” que sigue una distribucion binomial, y se tiene que la probabilidad de que ocurra el evento es 0.65. Cual seria la probabilidad de que Por lo menos de 7 eventos ocurran en los 10 ensayos tratados.**
6.6
Distribución Poisson
6.6.1
Supongamos que deseamos describir la probabilidad resultante de 0 a 10 intentos, cuando se conoce que la media es de 0.2***
6.6.2
En una intersección de carreteras ocurren en promedio 3 accidentes de transito por mes. Calcule las probabilidades de que en un mes cualquiera ocurra:***
6.6.3
exactamente 6 accidentes.**
6.6.4
entre 5 y 15 accidentes.** Solución.
6.6.5
Supongamos que el numero de plantas individuales de una especie dada que esperamos en cien metros cuadrados sigue la distribución de Poisson con una media = 10.***
6.6.6
Determine cual es la probabilidad de encontrar esa misma planta 12 individuos, en otra parcela del mismo tamaño.
6.6.7
Cual es la probabilidad de encontrar al menos 15 individuos?**
6.6.8
Cual es la probabilidad de encontrar 3 o mas individuos?**
7
Test de Hipotesis y Pruebas No paramétricas
7.1
Test de Hipótesis de Una Variable e Intervalos de Confianza
7.1.1
Ejemplo 7.1.
7.2
Distribucion t- student (Cuando la varianza es desconocida)
7.3
Test de la Distribución Normal
7.4
t.test para una muestra
7.4.1
Ejemplo 7.2.
7.4.2
Estime el intervalo de confianza al 95% para el rendimiento promedio del numero de vainas producidas por cada mata de frijol. Los datos presentan una distribucion normal.
7.4.3
Construya un intervalo de confianza al 99% de confianza para el rendimiento promedio de la de vainas producidas por cada mata de frijol.
7.4.4
Supongamos que deseamos verificar la siguiente hipotesis estadistica: el numero de vainas producidas por mata de frijol, es diferente de 23, al 99% de confianza.**
7.4.5
Supongamos que deseamos verificar la siguiente hipotesis: el numero de vainas producidas por mata es mayor que 23, al 99% de confianza.**
7.4.6
Suponga que se desea conocer que: si, el numero de vainas producidas por mata es menor de 6, al 95% de confianza.**
7.4.7
Genere 100 numeros aleatorios con distribucion normal, con una media de 15, cuya desviacion estandar sea de 4.65.
7.4.8
Calcule el intervalo al 95% de confianza de los 100 datos aleatorios con distribucion normal.
7.5
Test de Wilcoxon
7.6
Test de Wilcoxon para una muestra
7.6.1
Se cuentan en una parcela experimental, la cantidad de maleza producida por metro cuadrado en una plantacion de maiz. Los datos son los siguientes.**
7.6.2
Se quiere saber si la cantidad de maleza por metro cuadrado es mayor a 10.
7.6.3
Se lleva a cabo una encuesta, donde se les solicita a pacientes de un hospital, que califiquen la atencion que se les ha brindado en dicha institucion. Se clasifican las respuestas utilizando una escala de 1 a 10, donde 10 denota la mejor calificacion. Los datos son los siguientes.
7.6.4
El administrador desea sabe si la respuesta de calificación media obtenida es mayor a 7.
7.6.5
Preocupado el administrador por los primeros resultados, ahora desea conocer si el puntaje medio es menor a 7.
7.7
Test pareado de T-test
7.7.1
Se desarrolla una investigacion para conocer el efecto placebo en pacientes con cierto tipo de enfermedad. Se mide una cierta determinacion medica en un tiempo uno (t1: sin tomar el placebo) y su respuesta en un tiempo dos (t2: despues de haber tomado el placebo), para conocer si hubo un efecto. Los pacientes desconocen que el medicamento es un simple placebo. Los datos son los siguientes:**
7.8
Test pareado de Wilcoxon
7.8.1
Se evalua la reduccion del peso (Kg) en personas obesas luego de seguir un regimen de dieta y ejercicios. Se les tomo el peso inicial (p1), y tres meses despues el peso final (p2). Los datos son los siguientes:**
7.8.2
Se desea conocer si el régimen medio de la dieta fue efectivo?
7.9
Comparacion de las varianzas para dos poblaciones o grupos
7.10
Kolmogorov-Smirnov test
7.11
Transformando datos
7.12
Transformacion Logaritmica.
7.13
Transformacion raiz cuadrada
7.14
Test para dos muestras
7.14.1
Se tiene dos grupos experimentales, donde se seleccionan al azar 25 muestras de cada grupo. Se mide en cada grupo una variable aleatoria x, y se obtiene que la media del primer grupo es de 25.6 con una desviacion estandar de 4.4. El grupo dos presento una media de 22.5, con una desviacion estandar de 2.98. **
7.14.2
Se quiere determinar si existe diferencia en los grupos experimentales, al 95% de confianza.**
7.14.3
Probar si las varianzas son iguales
7.14.4
A partir de Poblaciones con Distribucion Normal: Se Desconoce Las Varianzas de las Poblaciones, pero supone que son desiguales.**
7.14.5
Se compara la edad de estudiantes que cursan el ultimo ano de colegio. El grupo 1, se trata de un colegio diurno y el grupo 2 de un colegio nocturno.**
7.14.6
Se desea conocer si las edades medias de los grupos son diferentes.**
7.14.7
Se desarrolla un experimento donde se desea conocer si un tipo de atrayente resulta ser mas efectivo para la atraccion de insectos, los datos son medidos cada hora y se contabiliza la cantidad de insectos que visitan los atrayentes. Se utiliza un atrayente natural, vrs uno artificial.**
8
Distribución Normal Estándar
8.0.1
Determine la probabilidad de z (de la curva normal) con valores que están entre -1.73 y 2.60?
8.0.2
Dada la curva normal estándar, calcular Pr(z mayor igual que 2.65).
8.0.3
Casos para la curva normal estándar
8.1
Aplicación de la curva normal estándar.
8.1.1
Un estudio acerca de la estructura de árboles, determino que la población de la especie de Cecropias en la zona del Caribe tienen una media en DAP cercana a los 63 cm con una desviación estándar de 4.4 cm. Se quisiera determinar otras mediaciones en una zona próxima y suponiendo que los datos pertenecen a una población grande con una distribución aproximadamente normal.
8.1.2
Es posible encontrar arboles con DAP igual a 60 cm que pertenezcan a esa misma población?
8.1.3
Determine si es posible encontrar árboles con DAP igual a 67 cm que pertenezcan a esa misma población?
8.1.4
Determine la probabilidad de encontrar arboles con DAP mayores a 70 cm, dentro de la población.
8.1.5
Probabilidad de encontrar árboles mayores a 55 cm.
8.1.6
Se realiza un estudio para conocer los ámbitos de acción de especies de perezosos durante un periodo de un mes, se seleccionan de manera aleatoria de la población 35 individuos. Los datos fueron registrados en hectáreas por mes.
8.1.7
Cual es la probabilidad de encontrar un individuo dentro de la población cuyo ámbito de acción sea igual a 7.5?
8.1.8
Cual es la probabilidad de encontrar individuos cuyo ámbito de acción este entre 5.8 y 7.8 hectáreas al 95% de confianza?
Ejercicios prácticos
9
Distribución de Frecuencias
9.0.1
Genere 100 datos aleatorios con una media de 50 y desviación estándar de 4.6
9.0.2
Visualice los datos utilizando un plot.**
9.0.3
Genere un diagrama de cajas según se muestra en la figura.**
9.0.4
Obtenga una distribución de frecuencias.**
9.0.5
Obtenga una distribución de frecuencias con 10 clases.**
9.0.6
Interprete la frecuencia absoluta de la segunda clase.**
9.0.7
Obtenga una distribución de frecuencias , que inicie desde 10 y termine en 45, con una amplitud de 7.**
9.0.8
Se está interesado en conocer cuantas personas que visitan el hospital tienen entre 30 a 40 años “year” de edad.**
9.0.9
Elabore una polígono de frecuencia acumulado, como se muestra en la figura, de los datos anteriores (30-40).**
9.0.10
Elabore un polígono de frecuencia relativa, como se muestra en la figura.**
9.0.11
Elabore una histograma, como se muestra en la figura.**
9.0.12
Calcule un resumen estadístico.**
9.0.13
Analice el Diagrama de cajas realizado anteriormente, y revise que sus datos resumen, coincidan con el diagrama de cajas realizado.**
9.0.14
Calcule el percentil 26 de los datos. Analice como es su interpretación, revise muy bien los datos en bruto y discuta con su compañero.**
9.0.15
Elabore un Tallos y Hojas.**
9.0.16
Calcule la mediana de los datos.**
9.0.17
Calcule el rango de los datos.**
9.0.18
Calcule el rango intercuartílico de los datos y de su interpretación.**
10
Distribución Discreta
10.1
Ejericio
10.1.1
La probabilidad de que cierto antibiótico presente una reacción negativa al administrarse a un ave rapaz en recuperación es de 0.15. Si se les ha administrado dicho antibiótico a 10 aves, calcular las probabilidades de que haya reacción negativa.
10.1.2
En dos aves.**
10.1.3
En ningún ave**
10.2
Ejercicio
10.2.1
En una gasolinera la llegada de veh?culos sigue la Distribución de Poisson de parámetro 1.6. Calcúlese la probabilidad de que?**
10.2.2
El no de vehículos que lleguen sea superior a tres?**
10.2.3
Está comprendido entre dos y cinco.**
10.2.4
Llegue algún vehículo (P>=1)?**
10.2.5
Plot de la distribución cuyos parámetros son de Lambda=1.6, cuya x sea hasta 10 eventos posibles, de una funciín acumulada, de “mas allá de”.**
10.2.6
Revisamos el comportamiento para todos los eventos, en un cuadro de resultados (data.frame).**
10.2.7
Buscar la máxima verosimilitud de una Distribución binomial cuyos parámetros son N=30, P=0.68, de una función en masa.**
10.2.8
Plot de la distribución cuyos parámetros son de N=30, P=0.15, de una función en “masa”.**
10.2.9
Una empresa electrónica observa que el número de componentes que fallan antes de cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos fallos es ocho.**
10.2.10
Cuál es la probabilidad de que falle un componente en 25 horas?**
10.3
Ejericio
10.3.1
Supongamos que el número de imperfecciones en un alambre delgado de cobre sigue una Distribución Poisson con una media de 2.3 imperfecciones por milímetro.**
10.3.2
Determine la probabilidad de 2 imperfecciones en un mil?metro de alambre.**
10.3.3
Visualizar todos los posibles eventos (utilice 0:25) de la función anterior.**
10.4
Ejercicio
10.5
Ejericio
10.5.1
En una empresa el término medio de accidentes es de 3 por mes. Calcular la probabilidad de:**
10.5.2
Que ocurran 30 accidentes en un año.**
10.5.3
Visualizar todos los eventos posibles, para encontrar la máxima verosilitud de la distribución Poisson de los datos brindados en el problema anterior (utilice de 0:36 para este ejercicio).**
10.5.4
Visualización gráfica, utilice hasta 60 eventos para determinar la máxima verosimilitud.**
11
Distribución Continua
11.0.1
Calcular el número de días del mes en los que se espera alcanzar máximas entre 21 y 27?**
11.0.2
La media de los pesos de 500 estudiantes de un Instituto es 70 kg y la
11.0.3
Exactamente 65 kg.**
11.0.4
Más de 90 kg.**
11.0.5
menos de 64 kg**
11.0.6
Las calificaciones en un examen de 34 estudiantes, siguen una distribución normal de media 8.6 y desviación típica 0.75.**
11.0.7
?Qué proporción de alumnos tendrá puntuaciones menores o iguales a 6.**
11.0.8
Cuál es la probabilidad que existe de que la nota de satisfacción para un estudiante sea de 7?**
11.0.9
Cuantos alumnos aprobaron el curso, sabiendo que la nota de aprobación es mayor o igual a 6.76?**
11.0.10
Qué proporción de alumnos obtendrá notas Notable o Sobresaliente (entiendase notas de 95 para arriba, en una escala de 10)?**
11.0.11
Cual es la probabilidad de encontrar un alumno que saque notas de 8?**
11.0.12
La temperatura a finales de año (diciembre) est+a distribuida normalmente con una media de 19°C y una desviación estándar de 3°C.**
11.0.13
Cuál es la probabilidad de que la temperatura sea exactamente de 22°C.**
11.0.14
Cuál es la probabilidad de que la temperatura sea exactamente de 16°C.**
11.0.15
La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación
11.0.16
Pesan menos de 60 kg. **
11.0.17
Exactamente 64Kg**
11.0.18
Una prueba consta de 200 preguntas de verdadero o falso, para un sujeto que
11.0.19
90 preguntas o menos**
Published with bookdown
https://osoramirez.weebly.com/
Aprendiendo Bioestadística con R
Ejercicios prácticos