La ecología y biología son cada vez más sofisticadas, por lo que es imposible aprender todos los tipos de estudios que existen. En general, con base en el grado de manipulación del objeto de estudio podemos clasificarlos en dos tipos:
Como es de esperarse, hay grados intermedios pues, por ejemplo, hay experimentos a gran escala (ecosistemas enteros) donde tenemos poco control sobre muchos de los factores que afectan el comportamiento del sistema de estudio.
Es importante tener en cuenta esta burda clasificación, porque durante nuestra carrera podremos vernos en la necesidad de diseñar ambos tipos de estudios. Tal como mencionamos anteriormente, para diseñar experimentos hay que considerar factores biológicos, estadísticos, éticos y logísticos. Cuando decidimos si hacemos estudios observacionales o experimentales, debemos de tomar en cuenta los mismos factores y otros adicionales, pues ambos tipos de estudios tienen ventajas y desventajas tanto biológicas como estadísticas:
Existen otras clasificaciones de los estudios con base en la naturaleza de los tratamientos aplicados. Cuando los tratamientos tienen como objetivo identificar el efecto de tratamientos categóricos (diferentes medicamentos, tipo de alimento) les llamamos factoriales. En ocasiones, el objetivo del estudio es más bien estimar la magnitud de efectos, por ejemplo medir respuestas de los objetos de estudio al aumento de la temperatura.
A partir de aquí veremos una clasificación más profunda de los estudios (experimentos) con base en sus cualidades estadísticas, las cuales determinarán la naturaleza de las observaciones que obtendremos y el tipo de análisis que se puede hacer de ellas.
En este curso profundizaremos en los experimentos factoriales, que como su nombre indica están basados en probar si dos o más factores distintos afectan el comportamiento de la variable de inter'es. Este tipo de diseños experimentales fueron desarrollados por ingenieros agrónomos, por lo que los ejemplos básicos ser'an con plantas. Para comenzar hagamos un breve recordatorio de los tipos de variables que hay:
Y por su función en el experimento podemos clasificar a las variables como:
A estas variables también se les llama de respuesta (dependiente) y explicativa (independiente). Estos nombres provienen de la idea matemáticas de las funciones:
\[ f(x) = a + b \cdot y\]
Donde \(x\) (variable dependiente) es una función de \(y\) (variable independiente).
A continuación se expone una serie de ejemplos para dejar de manifiesto las implicaciones experimentales de las cualidades matemáticas y estadísticas de las variables.
Estamos trabajando con una especie de planta y nos interesa saber qué fertilizante funciona mejor para que produzca más fruto. Entonces creamos dos parcelas dentro de un invernadero, donde colocamos 100 plantas, a 50 de ellas les aplicaremos el fertilizante A y a las otras 50 el fertilizante B. Durante una temporada de producción medimos la producción de fruto.
Claramente, en este experimento la variable de interés es la producción de fruto (dependiente), la cual es contínua. La variable que va a afectar la producción de fruto es el fertilizante (categórica e independiente).
Este es un experimento donde la variable independiente (fertilizante) es categórica y consta de dos niveles, los cuales constituyen los tratamientos. De este modo, podemos hacer una comparación visual de la producción de fruto obtenida con cada tratamiento, donde la línea gruesa de en medio muestra el promedio en kilogramos al final del experimento:
Estamos interesados en determinar si la temperatura afecta la productividad de la planta. Por lo que diseñamos un experimento para medir la producción de fruto a diferentes temperaturas (10-25 °C). Entonces decidimos que vamos a aplicar cuatro tratamientos con 12 plantas cada uno: 10, 15, 20 y 25 °C. Como pueden ver, aquí sería posible haber seleccionado más temperaturas intermedias, pues la temperatura es una variable contínua.
De este modo, medimos la producción por planta (contínua, dependiente) en función de la temperatura (contínua, independiente). Aquí es más fácil concebir la producción como una ecuación lineal:
\[ Producción = a + b \times Temperatura\]
Y los datos se prestan para ser representados como una función lineal:
Aquí vimos dos ejemplos sumamente sencillos, uno con un factor categórigo a dos niveles, y un factor contínuo a cuatro niveles. En la práctica es necesario tomar en cuenta muchos otros factores externos que pueden afectar los resultados y las conclusiones que obtenemos de los experimentos. Por ejemplo, en el experimento de los fertilizantes, es posible que si dividimos el invernadero tal como se muestra en la figura, un lado de este tenga más sol que el otro, afectando la producción del mismo modo que el fertilizante. Por lo tanto tendríamos que introducir un modo diferente de arreglar las parcelas o las plantas. Una alternativa, quizás más robusta, sería poner las plantas en macetas del tamaño suficiente e intercalar los tratamientos A y B, como en un tablero de ajedrez con dos macetas con el mismo tratamiento intercaladas, para eliminar el posible efecto del lado del invernadero:
Este diseño experimental fue desarrollado por el famoso estadístico R. A. Fisher en la estación experimental de Rothamsted, Londres. Es obvio que un experimento de este tipo sería imposible para aplicar tratamientos de temperatura (segundo ejemplo), pues no podríamos controlar la temperatura como sí se puede controlar el tipo de fertilizante aplicado.
Existen alternativas a este diseño que también podrían dar mejores resultados que el diseño original del ejemplo. El cuadrado latino, por ejemplo, está basado en parcelas dispuestas en filas y columnas tal que cada fila y cada columna debe tener una parcela de cada tratamiento:
También hay variaciones de este tipo de arreglos de los tratamientos experimentales, algunos de los cuales pueden ser muy complejos, sobretodo cuando aplicamos tratamientos con tres, cuatro niveles o más niveles (tres o cuatro fertilizantes diferentes); o combinaciones de tratamientos, por ejemplo combinando tres fertilizantes en dos tipos de suelo diferentes. Algunos de los diseños experimentales que revisaremos a profundidad junto con los métodos estadísticos para analizarlos son:
Estos estudios más complicados se llaman multi-factoriales. Lo que todos estos diseños experimentales tienen en común es que la técnica de análisis estadístico es un Análisis de Varianza (ANOVA por “Analysis of Variance”, sus siglas en inglés). En la unidad 2 comenzaremos a ver por qué recibe este nombre y cómo se hace dependiendo del diseño experimental elegido.
En el primer ejemplo probamos si un fertilizante es mejor que otro, es decir: diseñamos dos tratamientos y utilizamos la estadística para aceptar o rechazar la hipótesis nula (\(H_0\)) de no-diferencia entre tratamientos. En el segundo caso, probamos si la temperatura afecta la producción de las plantas, y como la temperatura es contínua, diseñamos un experimento para estimar el efecto de la temperatura (parámetro \(b\) de la ecuación lineal de arriba!).
Generalmente, es más fácil interpretar los resultados de los experimentos con variables contínuas, por lo que nos centraremos en profundizar en los experimentos donde las variables independientes son categóricas (\(1^{er}\) ejemplo).
En la sección 2.1.1 vimos un experimento donde acomodábamos 100 plantas en dos parcelas, cada una con 50. En la discusión de esta sección (2.2) vimos otras alternativas de diseño experimental. La principal diferencia entre estas fue que en la primera (Figura 2.5) no hubo parcela, sino contenedores para cada planta, mientras que en la segunda (Figura 2.6) acomodamos las plantas en dos parcelas, como en un cuadrado latino. En la primera alternativa, estaríamos registrando la producción por planta, mientras que en la segunda se registraría la producción por parcela. De aquí que tengamos dos tipos de observaciones, una por planta, y otra donde agregamos la producción de las plantas por parcela o bloque. Cada registro que hacemos lo denominamos observación, y los tipos de observaciones aquí descritas son:
Los tipos de observaciones tienen implicaciones importantes para el análisis de los datos colectados, pues durante un experimento obtendremos observaciones tanto de las cantidades que estamos investigando como de aquellas que afectan los datos que analizaremos. Como vimos en la sección 2.2 las condiciones del lugar donde hacemos los experimentos pueden afectar el desempeño de las unidades de estudio (planta individual o parcela/bloque), anulando el efecto de los tratamientos. Estos efectos del diseño experimental son muy comunes, por lo que es necesario tener registros precisos de las condiciones experimentales. Es importante tener un vocabulario consistente para describir los componentes de los diseños experimentales, pues estos componentes forman parte del análisis estadístico. Por lo general:
La figura 2.2 es una comparación de los promedios de los datos obtenidos de dos tratamientos sin bloques. El mismo experimento con bloques está representado en la figura 2.6. Cuando hacemos un análisis de las observaciones de este experimento, podemos aislar el efecto del bloque de la siguiente manera:
\[ Observación_{i(j)} = Media_i + Bloque_j + Tratamiento_i + Error_{i(j)}\]
Es decir que el promedio de las observaciones del tratamiento \(i\) (\(i = (A, B)\)) es la suma del promedio global, el promedio del bloque \(j\) y el tratamiento \(i\).
Aquí podemos ver por qué es necesario tomar en cuenta el tipo de observaciones que obtendremos con el diseño experimental elegido, y de registrar adecuadamente su obicación en los bloques y tratamientos.
Completa la actividad correspondiente a este módulo en Classroom