Justin ofrece algunas buenas reglas generales. El libro de Montgomery sobre DOE sería una buena referencia si está buscando uno. Creo que es bastante estándar para los ingenieros industriales y otros que vienen al DOE desde una perspectiva de fabricación / industria.
La belleza del DOE es equilibrar el costo de obtener datos versus el valor que brindan los datos. Un experimento diseñado adecuadamente facilitará (“dictar” podría ser un verbo mejor aquí) un análisis posterior.
¿Tiene alguna estimación de la variabilidad de cada respuesta? Pregunto porque una pieza clave para elegir un diseño es descubrir cuántas muestras necesitará tomar para responder los tipos de preguntas que le interesan. Este cálculo generalmente requiere que también especifique las tasas de error de tipo I y tipo II como un estimado de variabilidad. Las tasas de error de tipo I y tipo II que proporcione reflejarán su tolerancia para 1) pensar que una de las entradas tiene un efecto en una de las salidas cuando en realidad no lo tiene o 2) pensar que una de las entradas no tiene efecto en una salida cuando realmente lo hace. El cálculo del tamaño de la muestra también depende del tipo de análisis que realice.
- ¿Qué tipo de empresas ofrecen capacitación de verano y pasantías para ingenieros químicos?
- Soy un estudiante de ciencias, ¿qué ingeniería debo seguir en el futuro, o cuál es el mejor campo para ingresar que tiene un alcance en la India?
- ¿Cuáles son los mejores cursos de maestría en Canadá después de un BE en ingeniería civil en India?
- ¿Cuál es la diferencia entre automático y autónomo?
- ¿Cuál es el límite de tamaño teórico para los barcos?
El DOE de vainilla implicaría un experimento factorial analizado con ANOVA (análisis de varianza). Pero ANOVA supone una distribución normal para los términos de error (cualquier variabilidad en las salidas que las entradas no tienen en cuenta). Existen alternativas que no asumen la normalidad, pero el cálculo del tamaño de la muestra será diferente.
En cuanto a los detalles del diseño, debe depender tanto de su presupuesto (que debe depender de cuánto valor anticipará que producirá este experimento) como de cualquier conocimiento que pueda obtener sobre el proceso. Como Justin mencionó, si sus interacciones o no son lineales en las salidas afectará o no el diseño óptimo.
Para responder la pregunta exacta que hizo aquí, hay 3 opciones que le ofrecen una variedad de tamaños:
1) Un diseño factorial completo de 2 ^ k (8 corridas, una para cada combinación de cada nivel de cada entrada, donde cada entrada tiene 2 niveles). Una forma inteligente de hacer esto sería elegir los niveles como mínimo y máximo para cada entrada.
2) Un diseño factorial replicado 2 ^ k. Igual que 1), pero para aumentar su capacidad de detectar un efecto, realiza más de una carrera para cada combinación de cada nivel de cada entrada. Esto implicaría 16 ejecuciones si se replica dos veces, 24 si se replica tres veces, y así sucesivamente. Recuerde que tanto su presupuesto como el cálculo del tamaño de la muestra deben proporcionar información sobre cuántas ejecuciones desea realizar.
3) Un diseño factorial fraccionario 2 ^ k. Por ejemplo, un diseño medio 2 ^ k implicaría 4 corridas en lugar de 8. Esto reduce el costo pero a expensas de la sensibilidad. Con menos datos, podría perderse un efecto que habría recogido si hubiera ejecutado un diseño completo.
Mi consejo sería ejecutar el diseño más pequeño que permitan sus cálculos de tamaño de muestra. Una pieza clave de sabiduría del DOE es experimentar de forma iterativa. Esto significa que no diseñas, ejecutas y analizas un solo experimento. Es común ejecutar un diseño 2 ^ k como primer paso, luego usar esos datos para informar una segunda ronda de experimentación y así sucesivamente. Sin tener más información, así es como abordaría su problema.
Para responder la pregunta adicional, no estoy 100% seguro, pero creo que desea utilizar la densidad como una variable de bloqueo. Esto cambiará su modelo y análisis. Tendrá que obtener más datos, pero estará protegido contra la posibilidad de que piense que una de las entradas está afectando la salida cuando en realidad la densidad está correlacionada con la entrada y es lo que realmente tiene un efecto.