El diseño split-plot, o de parcelas divididas fue diseñado para combinar factores que tienen escalas espaciales dispares. Como la mayoría de métodos de diseño y análisis de experimentos fueron diseñados en agricultura, el ejemplo clásico de este diseño sería la combinación de tipos de suelo y fertilizante. El tipo de suelo es un atributo geográfico que es difícil de manipular, por lo que el diseño más práctico es la identificación de parcelas con los tipos de suelo de interés y aplicar los fertilizantes a cada tipo de suelo (Yates 1935; figura 1.1).
Una de las consecuencias de este diseño experimental es que uno de los factores (tipo de suelo en este caso), se convierte en un factor de agrupación de otro factor experimental. A dicha agrupación de un factor experimental dentro de otro se le conoce como anidación, la cual da origen a un diseño anidado. Es importante saber identificar la anidación porque el factor experimental que está anidado (fertilizante) dentro de otro factor será afectado por las fuentes de variabilidad que ocurren dentro del factor de anidación (tipo de suelo). Entonces, el análisis de un diseño anidado requiere de una especificación diferente a los modelos que hemos visto a la fecha. Debido a que el componente aleatorio de un diseño anidado está relacionado con el factor experimental de anidación, es necesario contar con réplicas verdaderas de este factor.
A diferencia de los diseños con efectos aleatorios y mixtos que vimos anteriormente, la especificación de los efectos aleatorios en los diseños split-plot es un poco más complicada, pues depende de los factores de anidación y los factores anidados. Una incorrecta especificación de los efectos aleatorios en relación a los factores de anidación y los anidados resultará en la estimación incorreta de efectos y sus significancias, debido a que los grados de libertad por tratamiento cambian dependiendo de la estructura de anidación, lo que afecta las estimaciones del estadístico \(F\) y la significancia estadística (valores de \(P\)).
Es común que los diseños split-plot tengan un componente espacial difícil de manipular aunque hay excepciones. Por ejemplo, hay muchos estudios clínicos donde los individuos participantes son sujetos a diferentes tratamientos o a medidas repetidas. Tratamientos diferentes que puedan ser aplicados al mismo individuo podrían ser medicamentos tópicos (en la piel) para tratar condiciones generalizadas, aquellos que requieran observaciones repetidas del efecto acumulado de otro medicamento (común en psiquiatría). En ecología, la mayoría de los diseños split-plot tienen un componente espacial importante.
Wissinger et al. (1996) estudiaron el efecto de la competencia sobre el reclutamiento de larvas acuáticas (metamórfosis a adultos potencialmente reproductores) de los tricópteros Asynarchus nigriculus y Limnephilus externus. El experimento consistió en crear condiciones que regularan la competencia entre larvas por medio del regímen hídrico y la densidad poblacional de cada especie. Para hacer ello Wissinger et al. seleccinaron sitios a las orillas de una posa más grande con regímenes de inundación permanente y efímera. En cada sitio colocaron seis cajas de madera que contenían seis niveles de densidad poblacional de cada especie tricóptero (Figura 1.2).
En este caso, el diseño split-plot era sólo una de las opciones, pues lo autores pudieron haber colocado los contenedores de madera en regiones de la posa con las condiciones deseadas (diseño completamente aleatorizado), aunque ello hubiera resultado en una logística más complicada. La logística más sencilla de mantener cada bloque experimental en el diseño split-plot, sin embargo, hace al experimento más susceptible a la pérdida definitiva de unidades experimentales. Desde un punto de vista estadístico, la varianza de los datos en el diseño completamente aleatorizado hubiera sido mucho mayor que en el split-plot.
Los experimentos con mediciones repetidas generalmente se consideran como un diseño distinto al split-plot, aunque en esencia y estadísticamente son equivalentes. Las mediciones repetidas sobre la misma unidad experimental pueden ocurrir tanto con el objetivo de registrar el efecto del tiempo de exposición al tratamiento, como con el objetivo de reducir costos, utilizando las unidades para aplicar tratamientos de manera subsecuente.
El paquete datarium
contiene ejemplos de mediciones repetidas con este objetivo. El primero es la base de datos selfesteem2
(autoestima 2), que consiste del registro del nivel de autoestima de 12 individuos inscritos en dos experimentos clínicos para ver el efecto de una dieta especial comparadas con un placebo. A cada individuo se le registró el nivel de autoestima en tres ocasiones durante un período de cuatro semanas que corresponden con el inicio, intermedio y final del experimento. Los mismos individuos participaron en la aplicación de ambos tratamientos (dieta y placebo), por lo que el experimento consta de medidas repetidas de dos tratamiento en cada individuo (factor de anidación).
Como en el ejemplo de Wissinger, hay varias alternativas para este experimento. La primera, era aplicar ambos tratamientos a grupos diferentes de pacientes, lo que duplicaría el número de voluntarios para el experimento. Aún así existiría el factor de anidación para las mediciones repetidas del efecto de cada tratamiento en el nivel de autoestima. Para eliminar este último nivel de anidación sería necesario conseguir más voluntarios a quienes se les midiera el nivel de autoestima en los diferentes tiempos. Este diseño incrementaría drásticamente la variabilidad, sin mencionar el gran reto logístico de coordinar un experimento de tal magnitud. Para comprender la estructura de los datos, podemos echar un vistazo a la base de datos:
id | treatment | t1 | t2 | t3 |
---|---|---|---|---|
1 | ctr | 83 | 77 | 69 |
2 | ctr | 97 | 95 | 88 |
3 | ctr | 93 | 92 | 89 |
4 | ctr | 92 | 92 | 89 |
5 | ctr | 77 | 73 | 68 |
6 | ctr | 72 | 65 | 63 |
7 | ctr | 92 | 89 | 79 |
8 | ctr | 92 | 87 | 81 |
9 | ctr | 95 | 91 | 84 |
10 | ctr | 92 | 84 | 81 |
11 | ctr | 92 | 92 | 91 |
12 | ctr | 79 | 69 | 62 |
1 | Diet | 84 | 86 | 88 |
2 | Diet | 100 | 99 | 97 |
3 | Diet | 91 | 91 | 92 |
4 | Diet | 91 | 92 | 95 |
5 | Diet | 74 | 76 | 72 |
6 | Diet | 76 | 75 | 76 |
7 | Diet | 90 | 87 | 87 |
8 | Diet | 89 | 89 | 88 |
9 | Diet | 93 | 94 | 93 |
10 | Diet | 90 | 93 | 95 |
11 | Diet | 93 | 92 | 91 |
12 | Diet | 80 | 80 | 78 |
En la primera unidad, en la sección de Unidad experimental, vimos cómo el diseño experimental puede solventar problemas logísticos , particularmente mediante la aplicación secuencial de tratamientos a unidades experimentales como animales para reducir el número de animales requeridos para completar el experimento (figura 1.4).
La reducción de unidades por medio de diseños de medidas repetidas, es posible gracias al desarrollo de las técnicas analíticas para diseños anidados que surgieron con la introducción del diseño split-plot.
Como se mencionó arriba, en los diseños split-plot hay que saber identificar los factores de anidación para así incluirlos adecuadamente en el análisis. Una errónea especificación llevaría a un uso equivocado de los grados de libertad. Comenzaremos por ver esto con el análisis de selfesteem
.
selfesteem2
La base de datos mostrada en la tabla 1.1 es la que analizaremos ahora. En la tabla podemos ver que hay seis mediciones de autoestima en cada individuo participante, por lo que, para medir el efecto de tiempo hay cinco grados de libertad, y para medir el efecto del tratamiento hay dos (tres observaciones por tratamiento), y el factor de anidación es el individuo (columna id
). Aquí, el factor tiempo
está anidado en el factor tratamiento
y existe un factor de agrupación que corresponde al individuo. El formato de la base es ancho por lo que hay que transformarla a largo para el análisis:
auto <- datarium::selfesteem2
auto.l <- reshape2::melt(auto, id.vars = c("id", "treatment"))
names(auto.l) <- c("id", "tratamiento", "tiempo", "auto")
Para comenzar, veremos cómo se distribuyen los datos alrededor de la media, y si éstos se desvían significativamente de la normalidad con shapiro_test
:
boxplot(auto ~ tiempo + tratamiento, auto.l)
library(tidyverse); library(rstatix)
shap.test <- auto.l %>%
group_by(tratamiento, tiempo) %>%
shapiro_test(auto)
knitr::kable(shap.test, caption = "Resultados de la prueba de Shapiro dentro de cada grupo experimental.", align = "c")
tratamiento | tiempo | variable | statistic | p |
---|---|---|---|---|
ctr | t1 | auto | 0.8282109 | 0.0199662 |
ctr | t2 | auto | 0.8681048 | 0.0618350 |
ctr | t3 | auto | 0.8868127 | 0.1072088 |
Diet | t1 | auto | 0.9191145 | 0.2786646 |
Diet | t2 | auto | 0.9234678 | 0.3159624 |
Diet | t3 | auto | 0.8858129 | 0.1040792 |
Con esto podemos ver que sólo hay una combinación de tratamientos que se desvía significativamente de la normalidad. Ahora sí, continuemos con el análisis utilizando aov
. Comenzaremos por ver qué inferiríamos sobre \(H_0\) si omitimos la estructura de anidamiento y los efectos aleatorios:
m1 <- aov(auto ~ tiempo * tratamiento, auto.l)
summary(m1)
## Df Sum Sq Mean Sq F value Pr(>F)
## tiempo 2 259 129.3 1.685 0.1933
## tratamiento 1 317 316.7 4.126 0.0463 *
## tiempo:tratamiento 2 266 133.2 1.735 0.1843
## Residuals 66 5066 76.8
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
A estas alturas, nos resulta evidente que hay pocas razones para rechazar las hipótesis, nulas, excepto por el efecto de tratamiento
. Como ya sabemos, los datos de este experimento fueron generados con un diseño split-plot. En este experimento, ambos factores están anidados en los individuos, y tiempo
está anidado en tratamiento
, de modo que en aov
debemos especificarlo en la fórmula y en los efectos aleatorios. Prosigamos primero, especificando un modelos con los factores anidados de acuerdo con su estructura: tratamiento
contiene a tiempo
, por lo que:
m2 <- aov(auto ~ tratamiento / tiempo , auto.l)
summary(m2)
## Df Sum Sq Mean Sq F value Pr(>F)
## tratamiento 1 317 316.7 4.126 0.0463 *
## tratamiento:tiempo 4 525 131.3 1.710 0.1582
## Residuals 66 5066 76.8
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como podemos ver, cuando el modelo esta anidado, no se puede separar el efecto del factor de anidacion del factor anidado, de modo que SIEMPRE se estima la interacción, y podemos ver que la conclusió sobre \(H_0\) sigue siendo la misma, aunque nos queda por tomar en cuenta al individuo, id
, como efecto aleatorio:
m3 <- aov(auto ~ tratamiento / tiempo + Error(id/tratamiento/tiempo), auto.l)
summary(m3)
##
## Error: id
## Df Sum Sq Mean Sq F value Pr(>F)
## Residuals 11 4641 421.9
##
## Error: id:tratamiento
## Df Sum Sq Mean Sq F value Pr(>F)
## tratamiento 1 316.7 316.7 15.54 0.0023 **
## Residuals 11 224.2 20.4
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Error: id:tratamiento:tiempo
## Df Sum Sq Mean Sq F value Pr(>F)
## tratamiento:tiempo 4 525.1 131.26 28.84 8.56e-12 ***
## Residuals 44 200.3 4.55
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como podemos ver, las conclusiones serían completamente diferentes entre un método y otro. Cuando incluimos correctamente los efectos aleatorios (variación entre individuos en el valor de auto
), rechazamos todas las hipótesis nulas, particularmente sobre la interacción tratamiento:tiempo
, con lo que concluimos que el efecto del tratamiento con dieta depende del tiempo que ésta dure, pues como resulta evidente en la figura 2.1, el nivel de autoestima incrementa con el tiempo cuando los individuos consumieron la dieta en comparación con el control, donde el nivel de autoestima disminuyó con el tiempo.