Estudios Experimentales

Definición y clasificación

Hay tres tipos principales de estudios experimentales en epidemiología: el ensayo clínico, el ensayo de campo y el estudio de intervención comunitaria. Según Bradford Hill, en su clásica definición de 1952, un ensayo clínico es un experimento cuidadosa y éticamente diseñado con el fin de contestar a preguntas concretas formuladas previamente. Estas preguntas tienen que ver con la evaluación de procedimientos diagnósticos, terapéuticos y profilácticos en el ser humano. En el concepto de Bradford Hill, los ensayos clínicos incluyen también los ensayos de campo, que tienen por objeto evaluar intervenciones preventivas (el ensayo clínico en sentido estricto sólo evaluaría las intervenciones curativas). Los ensayos clínicos se caracterizan por ser estudios prospectivos y experimentales.

Son prospectivos porque la información sobre la variable de resultado se recoge a medida que se va produciendo, es decir, hacia el futuro. Son experimentales porque en ellos, a diferencia de lo que ocurre en los estudios observacionales, es el investigador quien asigna la exposición al procedimiento que se ha de evaluar. Esto implica que existe un grupo de comparación, o grupo control, no expuesto al procedimiento. Por lo tanto, desde un punto de vista práctico, un ensayo clínico es un estudio de cohortes prospectivo en el que el investigador asigna la exposición. Además, el ensayo debe ser, en la mayoría de los casos, aleatorizado y doble ciego. Más adelante se indicará el significado de estos dos términos.

Por último, un estudio de intervención comunitaria es una investigación experimental cuya unidad de intervención son comunidades, grupos o poblaciones considerados de forma entera. Obsérvese que en los ensayos clínicos y de campo, la unidad de intervención y análisis son los individuos. Los ensayos comunitarios se utilizan para evaluar intervenciones que tienen sentido a nivel poblacional, como la cloración de las aguas de una comunidad, intervenciones de promoción de la salud aplicadas a todos los trabajadores de una empresa, programas de actividad física en varias clases de un colegio o intervenciones para mejorar la salud cardiovascular en toda una región, como en el estudio de Karelia del Norte. A partir de ahora se describirán las características metodológicas de los ensayos clínicos, aunque la mayoría de ellas son comunes a todos los estudios experimentales.

Pasos en la realización de un ensayo clínico aleatorizado

En este apartado se describirán, de acuerdo con Hulley (2006), las etapas habituales en la realización del más típico de los ensayos clínicos: el ensayo de fase III, con dos grupos de intervención, con medicamentos y fines terapéuticos. El lector interesado en algunas alternativas a este tipo de ensayo puede consultar la bibliografía específica.

Selección de la cohorte de estudio

Consiste en elegir un grupo de sujetos adecuados para la evaluación del medicamento, e implica la formulación de unos criterios de inclusión y de exclusión que reduzcan el conjunto de enfermos atendidos en una institución sanitaria a los más adecuados para responder a la pregunta de investigación. Los criterios de inclusión aluden generalmente a características clínicas y sociodemográficas de los enfermos.

Es necesario un equilibrio entre su amplitud, que permita seleccionar a enfermos con características muy variadas que aumenten la generalización de la eficacia del fármaco, y la utilización de un criterio muy restrictivo que limite la inclusión de enfermos a aquellos en quienes la eficacia del fármaco sea máxima y pueda medirse con mayor claridad.

Los criterios de exclusión pretenden retirar de los enfermos que cumplen los criterios de inclusión a aquellos que presentan alguna contraindicación para someterse al tratamiento, a los que se considera malos cumplidores, a los que acarrean riesgos competitivos con el acontecimiento o enfermedad en estudio y a los que, por cualquier razón, sea complicado estudiar. Por consiguiente, los criterios de exclusión persiguen fines éticos o mejorar la viabilidad del estudio.

Por ejemplo, el estudio 4S, un ensayo clínico para medir la eficacia de la simvastatina, un fármaco hipolipemiante, sobre la supervivencia y morbilidad de enfermos de cardiopatía isquémica, seleccionó a pacientes con las siguientes características: hombres y mujeres, de 35 a 70 años, historia previa de angina de pecho o infarto de miocardio, y colesterol sérico de 5,5 a 8,0 mmol/l después de seguir una dieta hipolipemiante.

Los criterios de exclusión fueron, entre otros, los siguientes: ser mujer premenopáusica con posibilidad de quedarse embarazada; presentar hipercolesterolemia secundaria, angina inestable o de Prinzmetal; tener programada una angioplastia o cirugía coronaria; infarto de miocardio durante los 6 meses anteriores; tratamiento antiarrítmico; haber tenido un ictus completo; disminución de la función hepática; consumo de drogas o abuso del alcohol; deterioro intelectual, y presencia de cualquier enfermedad grave.

En esta fase se establece también el número de sujetos necesarios para evaluar el fármaco y se formula un plan para su reclutamiento. Un reto muy importante será cumplir con este plan.

Medida de variables basales

La medida de variables basales es una etapa parcialmente simultánea con la anterior. En general, primero se miden las variables que permiten establecer la elegibilidad de los pacientes, es decir, los criterios de inclusión. Los pacientes que los cumplen son invitados a participar en el estudio. Si aceptan, se pueden medir otras variables más costosas, con mayor riesgo para el paciente, o más relevantes para los siguientes fines:

  1. Establecer el grupo de sujetos a los que se podrán aplicar los resultados del estudio, es decir, qué tipo de pacientes podrán beneficiarse del tratamiento.
  2. Verificar la eficacia de la aleatorización.
  3. Demostrar que el acontecimiento de interés (enfermedad, recidiva, discapacidad, etc.) cuya frecuencia de aparición pretende modificar el medicamento no está presente en el inicio del estudio.
  4. Registrar los predictores del acontecimiento que se ha de estudiar. Esto permitirá medir su efecto sobre la aparición de la variable de resultado en presencia o ausencia del fármaco, o controlar su efecto en caso de que la aleatorización no haya sido eficaz.

En general, deben medirse tantas variables como sean necesarias y tan pocas como sea posible. Además, habrá que llegar a un equilibrio entre el número de sujetos del estudio y el número de variables que hay que medir de forma precisa. Suele haber una relación inversa entre ambas, y el punto de equilibrio lo determinan los recursos disponibles. Sin embargo, lo más aconsejable habitualmente es medir menos variables en el mayor número posible de individuos.

Aleatorización

La aleatorización (también llamada «randomización») es una de las características más distintivas de los ensayos clínicos, y a ella deben gran parte de su capacidad demostrativa. Consiste en asignar aleatoriamente a los participantes a dos o más grupos de tratamiento. Su mérito estriba en que, si el grupo de pacientes es suficientemente numeroso, tiende a conseguir una distribución homogénea de los principales predictores, conocidos o no, de la variable de resultado (enfermedad, discapacidad, recidiva, muerte, etc.) al inicio del estudio. Si al finalizar el estudio existe una diferencia significativa entre la frecuencia de esta variable en los expuestos y en los no expuestos al fármaco que se ha de evaluar, la única explicación plausible es la acción del fármaco.

A causa de esta característica de su diseño, el ensayo clínico es el estudio epidemiológico más potente para medir la relación entre dos variables (ej. la exposición a un fármaco y la curación de una enfermedad). Por otro lado, la aleatorización garantiza también la validez de las comparaciones estadísticas, ya que permite adscribir una distribución de probabilidad a las diferencias encontradas entre ambos grupos de tratamiento y, por lo tanto, asignar niveles de significación a las diferencias observadas. En contraste con la validez de la comparación, la validez de una prueba de significación estadística no depende del equilibrio de los factores de confusión, sino del conocimiento de la distribución de probabilidad de los datos.

La aleatorización tiende a conseguir una distribución similar de los predictores de la variable de resultado en los dos grupos de comparación, pero no la asegura. La probabilidad de conseguirlo aumenta con el tamaño del estudio. Es conveniente confirmar que la aleatorización fue eficaz.

Existen varias formas de realizar la aleatorización. La más sencilla es la aleatorización simple, que consiste en distribuir el conjunto de los sujetos de estudio en dos grupos —intervención y control— de acuerdo con los designios de una tabla de números aleatorios o de una serie de ellos producida por un ordenador. Su inconveniente es que el azar también puede hacer que la mayor parte de los sujetos sean asignados a uno de los grupos de tratamiento, especialmente cuando el número de participantes es pequeño. En esta situación el análisis estadístico es menos eficiente, e incluso puede resultar imposible medir adecuadamente la variable de resultado en alguno de los grupos. Para evitar este problema, cabe recurrir a la aleatorización por bloques, en la que se forman grupos o bloques de pacientes de moderado tamaño, generalmente de 6 a 10 personas. En el primer grupo se aleatoriza la intervención y, una vez que la mitad de los participantes han sido asignados a un tipo de tratamiento, el resto se asigna al segundo hasta completar el grupo. Una vez que se ha acabado con el primer grupo o bloque, se pasa al segundo, y así sucesivamente hasta completar la asignación de todos los pacientes del estudio. Cuando se quiere garantizar el perfecto equilibrio de un importante predictor de la variable resultado, puede realizarse una aleatorización estratificada. Los pacientes son separados en categorías o estratos de la variable predictora. A continuación, los pacientes de cada estrato son asignados aleatoriamente a cada tipo de tratamiento. Por ejemplo, en el estudio 4S, los pacientes se estratificaron según la presencia de infarto de miocardio previo, ya que éste es un importante predictor de la supervivencia. En los ensayos multicéntricos, como el 4S, la aleatorización también suele estratificarse en cada centro. Esto garantiza un equilibrio más perfecto del riesgo basal de los pacientes y del tipo de cuidados a que son sometidos, que pueden variar bastante de unos centros a otros.

La aleatorización es una de las etapas más complicadas del estudio desde un punto de vista logístico. Una aleatorización correcta debe cumplir dos condiciones:

  1. Una lista de asignación de pacientes a los grupos de tratamiento que sea realmente aleatoria. No deben utilizarse procedimientos de asignación de pacientes basados en su fecha de nacimiento, signo del zodíaco, orden de entrada en el estudio u otra característica similar. Son procedimientos de asignación sistemática, aunque su arranque —es decir, la asignación del primer paciente a un grupo de tratamiento— pueda ser aleatorio. No es posible descartar mecanismos, conocidos o no, que conduzcan a la pérdida de comparabilidad de los dos grupos de tratamiento, es decir, a una mayor tendencia de los pacientes con ciertas características pronósticas a recibir uno de los dos tratamientos.
  2. La aleatorización se realiza de acuerdo con el plan previsto, evitando la interferencia de investigadores o personal sanitario con preferencias para que un enfermo determinado sea expuesto o no al medicamento que tiene que evaluarse. Con este fin, es fundamental que quien valora la elegibilidad de los pacientes, realiza su inclusión en el ensayo, lleva a cabo la aleatorización, o cualquier persona que puede influir en estas decisiones, desconozca la secuencia de aleatorización hasta que vaya a aplicarse a cada enfermo reclutado para el estudio. Esta segunda condición recibe el nombre de ocultación de la secuencia de aleatorización (OSA). En ausencia de esta medida, existen mecanismos, conscientes o inconscientes, que tienden a seleccionar incorrectamente a los sujetos del ensayo y a perder la comparabilidad de los grupos de tratamiento. Por ejemplo, si el responsable del reclutamiento de los pacientes conoce de antemano la secuencia de aleatorización, puede retrasar la entrada de un participante en el ensayo hasta que la secuencia alcanza el tratamiento que considera más adecuado para ese paciente. También podría excluir del ensayo a pacientes potencialmente elegibles, o desaconsejar su participación en el estudio.

Para realizar la OSA es necesario, por ejemplo, un sistema de aleatorización centralizado en la farmacia del hospital o en una ubicación externa al centro donde se realiza el ensayo. El médico que asigna el paciente a cada grupo de tratamiento debe solicitar a la central de aleatorización la asignación para cada paciente una vez lo ha introducido en el estudio. Un procedimiento alternativo es disponer de sobres numerados secuencialmente, opacos y lacrados, en cuyo interior está el grupo de tratamiento de cada paciente. El sobre correspondiente a cada paciente sólo debe abrirse en el momento en que se le vaya a asignar a su grupo de tratamiento. También es posible contar con un sistema accesible por terminales informáticas que asigna el grupo de tratamiento cuando se le proporciona un código para cada paciente que ha sido introducido en el ensayo.

La aleatorización debe realizarse sólo cuando a priori la probabilidad de desarrollar un curso clínico favorable en presencia del medicamento que debe evaluarse no es muy diferente de la probabilidad de desarrollarlo en su ausencia o Estudios experimentales en presencia de la medicación estándar. Si no fuera así, se privaría a un grupo de enfermos, aunque fueran elegidos por azar, del mejor tratamiento disponible y, por lo tanto, de la mejor probabilidad de evolucionar bien. Por ello, algunos ensayos son analizados periódicamente durante su ejecución, y si se demuestra que una de las dos alternativas terapéuticas es mejor que la otra, son interrumpidos antes de acabar el plan de reclutamiento de enfermos o de completar el tiempo de seguimiento. Estas consideraciones descubren implicaciones éticas en la investigación en seres humanos, y han promovido el desarrollo de normas de conducta que todos los investigadores de ensayos clínicos deben seguir.

Aplicación de la intervención

Dentro de la fase de aplicación de la intervención hay que distinguir varios aspectos. En primer lugar, el llamado enmascaramiento de la intervención. El ensayo es simple ciego cuando el paciente desconoce el grupo de tratamiento al que pertenece; doble ciego, cuando lo desconocen el paciente, los proveedores de cuidados sanitarios y el evaluador de la variable de resultado, y triple ciego, cuando incluso el analista de los datos del ensayo desconoce el tratamiento de cada grupo de comparación. Por último, el ensayo recibe el nombre de abierto o «no ciego» cuando no se dan este tipo de enmascaramientos.

El enmascaramiento es otro de los puntos fuertes del diseño de un ensayo. Dificulta o evita cointervenciones del paciente, los investigadores y otros proveedores de cuidados, tratando a los expuestos al tratamiento de forma diferente que a los no expuestos a éste. Evita, por lo tanto, los factores de confusión tras la aleatorización, que alterarían el equilibrio de predictores de la variable de resultado en ambos grupos de comparación, alcanzado en la etapa anterior. El enmascaramiento también reduce errores diferenciales de medida en la variable de resultado por parte de los sujetos del estudio o de los investigadores. Si alguno de ellos conociera con qué medicamento están siendo tratados, su evaluación consciente o inconsciente del curso clínico en presencia del tratamiento podrá ser influida por sus expectativas sobre la eficacia de dicho tratamiento.

Sin embargo, no siempre es posible enmascarar el tratamiento. Por ejemplo, en la comparación de un tratamiento farmacológico frente a uno quirúrgico para una misma enfermedad, no es factible ocultar la rama del tratamiento en la que se encuentran los pacientes. Aun cuando el enmascaramiento sea posible, presenta algunas dificultades prácticas.

Para solventarlas, hay que disponer de placebos, es decir, medicamentos o productos de aspecto similar pero componentes activos diferentes. Asimismo, debe montarse un sistema de desenmascaramiento para conocer si un cuadro clínico concreto es producido por el tratamiento, y elegir los fármacos más adecuados para resolver la situación. También hay que evitar un desenmascaramiento inapropiado ante los resultados de pruebas analíticas rutinarias. Si se compara, por ejemplo, la acción hipotensora de dos diuréticos, uno de los cuales es ahorrador de potasio, ¿cómo evitar reconocer el fármaco con que está tratado un enfermo concreto si se dispone de la composición de los iones en su orina, procedente de una analítica rutinaria? En cualquier caso, al final de todo estudio nunca estará de más comprobar, mediante encuesta a sus participantes, que el enmascaramiento se ha mantenido.

La OSA también es conocida con el equívoco nombre de «aleatorización ciega». Este término es desaconsejable por varias razones. Primero, porque la OSA es una condición que tiene lugar antes que la aleatorización, mientras que el enmascaramiento o «ciego» del grupo de tratamiento al que ha sido asignado cada paciente se realiza después de la aleatorización.

En segundo lugar, porque la OSA pretende garantizar el control de factores de confusión al inicio del estudio mediante la adecuada selección de los participantes, mientras que el enmascaramiento o ciego de la intervención pretende evitar otro tipo de problemas, en concreto, la cointervención en el curso del ensayo y el sesgo de medida diferencial de la variable de resultado. En tercer lugar, la OSA es siempre factible, a diferencia del enmascaramiento de la intervención. Por último, la OSA es una característica que afecta a todo el ensayo, mientras que el enmascaramiento es específico para cada variable de resultado. Puede lograrse en una y no en otras.

Probablemente, la OSA es la característica metodológica que más contribuye al poder demostrativo de un ensayo clínico. Primero, porque en su ausencia la eficacia de una secuencia aleatoria (impredecible) de asignación de tratamientos se reduce sustancialmente, al poder burlar dicha secuencia alterando el orden de entrada de los pacientes en el ensayo. Segundo, porque si se conoce el contenido de la secuencia de aleatorización, puede resultar imposible garantizar el enmascaramiento del tratamiento. Además, hay pruebas empíricas de su importancia. En 250 ensayos clínicos sobre problemas perinatales se ha estudiado la asociación entre el efecto del tratamiento y algunos aspectos metodológicos. Se observó que los ensayos en los que la OSA se realiza incorrectamente, y en los que se describe de forma poco clara, sobrevaloran en un 41 y un 30%, respectivamente, los beneficios del tratamiento. Por otro lado, en ausencia de OSA, la generación de una lista realmente aleatoria de asignación de tratamiento carecía de efecto estadísticamente significativo sobre los resultados de los ensayos. Por último, la ausencia de «doble ciego» en el ensayo exageraba en un 17% los beneficios del tratamiento.

El segundo aspecto relevante en la aplicación de la intervención es la elección del tratamiento del grupo control. ¿Se les debe administrar el tratamiento habitual para su enfermedad, o un fármaco no activo de aspecto y características organolépticas similares al del fármaco que se ha de evaluar, es decir, un placebo? Siempre que exista un tratamiento habitual de probada eficacia para el proceso al que se dedica el fármaco que se va a evaluar, hay que administrarlo al grupo control. De no hacerlo, se estaría privando a un grupo de enfermos de un tratamiento eficaz, lo cual es éticamente inaceptable. En la actualidad sería inadmisible medir la eficacia de una vacuna termoestable para la poliomielitis comparando la tasa de protección de la vacuna frente a un placebo.

Habríamos privado a un grupo de niños de la protección de la vacuna Sabin, termolábil, pero eficaz. También es importante destacar que la información que proporciona un ensayo es diferente según se utilice, en el grupo de control, el tratamiento habitual o un placebo. En el primer caso se establece la eficacia relativa del nuevo fármaco, hasta qué punto supera lo que ya existe en el mercado. Ésta suele ser la pregunta más relevante para la práctica clínica. En el segundo caso sólo se mide su eficacia en términos absolutos.

De lo expuesto se deduce que la utilización de placebos en ensayos clínicos deberá justificarse explícitamente. En general, el uso de un placebo sólo podrá justificarse cuando:

  1. no existe un tratamiento de referencia de eficacia demostrada, o éste presenta efectos adversos de frecuencia o gravedad inaceptables;
  2. la enfermedad en estudio puede beneficiarse de la administración de un placebo, y
  3. la enfermedad tiene carácter banal y escaso impacto sobre el estado general del enfermo.

El ensayo 4S se realizó comparando la supervivencia de los enfermos tratados con simvastatina y con placebo. La justificación es que ningún ensayo clínico previo había demostrado que el tratamiento farmacológico hipolipemiante prolongara la vida entre los enfermos de cardiopatía isquémica, e incluso existían indicios de que este tratamiento podía elevar la mortalidad por causas no cardiovasculares, especialmente el cáncer y las muertes violentas. Sin embargo, hoy ya no sería ético un ensayo comparando un fármaco hipolipemiante frente a un placebo, porque hay muchas evidencias de que las estatinas reducen el riesgo cardiovascular.

El tercer aspecto relevante es asegurar el cumplimiento terapéutico. Esto es más importante en los ensayos con períodos largos de seguimiento y en los que el medicamento se administra de forma ambulatoria, como la mayoría de los tratamientos crónicos. Muchos problemas de cumplimiento pueden evitarse en el diseño del estudio. Es importante que la intervención o tratamiento sea de administración sencilla, y seleccionar a sujetos adecuadamente informados y comprometidos a cumplir el protocolo del ensayo. La introducción de un período de prueba (run-in period) previo a la aleatorización de los pacientes puede mejorar su cumplimiento.

En este período, que puede durar semanas o meses, los pacientes se someten a los tratamientos que deben evaluarse y sólo se selecciona a los buenos cumplidores para participar en el ensayo. El ensayo 4S incluyó una fase de prueba de 2 semanas en las que se administró el placebo, y sólo se reclutaron de forma definitiva los pacientes cumplidores.

Durante la realización del estudio es necesario informar a los sujetos sobre la importancia del cumplimiento del tratamiento, entrenar al paciente en su administración, buscar la colaboración de sus familiares y reforzar el cumplimiento manteniéndose en contacto frecuente con los pacientes y mediante visitas periódicas al centro clínico, en las que encuentren un ambiente acogedor. Por último, hay que medir el cumplimiento mediante técnicas de encuesta o determinaciones del fármaco en los líquidos corporales. Sólo cuando se ha alcanzado un nivel razonable de cumplimiento se podrá demostrar la eficacia del fármaco.

Seguimiento de las cohortes

El seguimiento de las cohortes debe evitar pérdidas de sujetos en el transcurso del estudio, de forma que se pueda medir la frecuencia de la variable de resultado en la mayoría de los sujetos incluidos en el ensayo. Las pérdidas suelen producirse en ensayos de larga duración, que evalúan la eficacia de tratamientos crónicos sobre acontecimientos poco frecuentes.

Para minimizar las pérdidas, se debe recoger abundante información de filiación, tanto del sujeto de estudio como de los familiares, amigos y su médico de familia. Asimismo, los contactos frecuentes con los sujetos y su selección en poblaciones «cerradas» con escasa movilidad geográfica son estrategias útiles para reducir las pérdidas.

Durante el seguimiento hay que evitar cambios en la asignación de los tratamientos en los grupos de comparación que hagan difícil o imposible evaluar su eficacia. También habrá que registrar cambios tras la aleatorización en los predictores de la variable de resultado, para tenerlos en cuenta en el análisis estadístico del ensayo. Por último, habrá que excluir del estudio, y registrar, a todos aquellos enfermos que sufran acontecimientos adversos graves o que desarrollen condiciones en las que el tratamiento del ensayo esté contraindicado.

Medida de las variables de resultado

Variable de resultado es aquella característica de los sujetos de estudio más adecuada para evaluar la eficacia del medicamento. Si se evalúa la eficacia de un fármaco hipotensor, la variable de resultado natural es la presión arterial. La comparación de dicha presión entre los sujetos tratados y los no tratados con el hipotensor es una medida de su eficacia.

Sin embargo, puede haber otras variables de resultado más relevantes, como la morbimortalidad cardiovascular, la mortalidad general, y algunos efectos adversos del tratamiento especialmente graves o probables. Un ensayo clínico debe seleccionar, al menos, una variable de resultado principal, a la que se pueden añadir otras variables secundarias. En el ensayo 4S, la variable principal fue la mortalidad general, que es la variable relacionada con el objetivo más importante del estudio. Una variable secundaria fueron «los acontecimientos coronarios mayores», que incluyen las muertes coronarias, el infarto de miocardio no fatal confirmado o probable diagnosticado en un hospital, el fallo cardíaco con manifestaciones clínicas y el infarto de miocardio silente diagnosticado por electrocardiograma.

Todas las variables de un estudio deben medirse de forma válida y precisa. Sin embargo, las variables de resultado son aquellas en las que los errores de medida tienen mayor efecto sobre la validez del estudio. Tal como se comentó anteriormente, la medida de las variables de resultado deberá hacerse de forma «ciega» respecto al tratamiento.

Análisis de los datos

El análisis de los datos es similar al de un estudio de cohortes. Una de sus peculiaridades es la utilidad más frecuente de análisis no paramétricos y de análisis de supervivencia. Los primeros derivan del reducido número de sujetos incluidos en muchos ensayos clínicos. Los segundos, de la necesidad de caracterizar no sólo la presencia de la variable de resultado, sino además cuándo tiene lugar. En muchos casos, un fármaco no reduce el número de complicaciones de una enfermedad, incluida la muerte, pero sí las retrasa. Caracterizar este hecho es de una enorme trascendencia para el pronóstico.

Un tipo de análisis muy frecuente en ensayos clínicos es el análisis «según la intención de tratar». Este tipo de análisis surge para contestar a la pregunta: ¿qué hacer en el manejo de datos con aquellas personas que no cumplieron con su tratamiento o que incluso se cambiaron a lo largo del estudio al tratamiento del grupo de comparación? Este análisis consiste en incluirlos en el grupo al que fueron asignados inicialmente, aunque no cumplieran con el tratamiento. Esto infraestima la eficacia del tratamiento y reduce el poder estadístico para medirla. Sin embargo, en caso de que la falta de cumplimiento refleje el futuro comportamiento de los enfermos, la medida de la eficacia obtenida en el estudio constituye una estimación del beneficio del tratamiento en sus condiciones habituales de administración, más parecido al que se obtendría en la práctica clínica fuera del ambiente «controlado» del ensayo clínico.

Este argumento no debe utilizarse, sin embargo, para minimizar la importancia de un buen cumplimiento terapéutico durante el ensayo. Por último, la mayor ventaja de este tipo de análisis estriba en que preserva los beneficios de la aleatorización. Es probable que la falta de cumplimiento del tratamiento se asocie a factores predictores de la variable de resultado.

Un análisis de los datos que incluyera sólo a los cumplidores de cada tratamiento no aseguraría, en la mayoría de los casos, la comparabilidad de los grupos de estudio, al no contar con una distribución similar de los predictores de la variable de resultado. Por consiguiente, el análisis «según la intención de tratar» prioriza la validez en la medida de la eficacia del tratamiento, que es la principal ventaja metodológica del ensayo clínico, frente a la maximización de la eficacia medida.

Los investigadores a menudo quieren conocer la eficacia en subgrupos de pacientes con ciertas características clínicas o demográficas, o en aquellos cuyo tratamiento se ha realizado de forma precoz o más mantenida en el tiempo. Este análisis puede resultar especialmente interesante cuando el tratamiento no ha sido eficaz en el conjunto de participantes en el ensayo, pero los investigadores suponen que ha podido serlo en algunos subgrupos.

En cambio, si los subgrupos están definidos por características medidas con posterioridad a la aleatorización y que pueden estar influidas por la eficacia del tratamiento, el análisis es inadecuado. Un ejemplo de este tipo de subgrupos son los pacientes que han cumplido bien con el tratamiento o los que han mostrado una buena evolución clínica durante el ensayo. El problema con estos subgrupos es que los tratados y los no tratados con el fármaco dentro de cada subgrupo pueden no ser comparables, como se ha argumentado en el párrafo anterior, y, por lo tanto, el efecto del fármaco puede mezclarse con las diferentes características pronósticas de los pacientes.

Los subgrupos tienen que definirse por características basales de los pacientes, es decir, medidas antes de la aleatorización y que el tratamiento no pueda modificar, como el sexo, la edad, el tratamiento precoz de un cuadro clínico, la gravedad de la enfermedad, etc. Aun así, el análisis es problemático porque suele carecer de poder estadístico para demostrar con claridad un efecto en el subgrupo en cuestión y para demostrar que el efecto es diferente del observado en el conjunto del estudio.

Por otro lado, el análisis requiere realizar múltiples comparaciones, por lo que hay que ajustar el nivel de significación; en estas situaciones suele ser difícil demostrar la significación estadística. Al igual que en cualquier otro tipo de análisis, es necesario explicitar si la hipótesis que se quiere contrastar se ha formulado en el diseño del estudio o después de la inspección de sus resultados. En el primer caso, el análisis podrá contribuir a su verificación; en el segundo caso, tiene valor exploratorio y sólo permite sugerir dicha hipótesis. Por último, siempre que existen dificultades para la interpretación de un análisis, requiere la plausibilidad biológica y la consistencia en otros estudios.

En 1992, Oxman y Guyatt formularon un conjunto de preguntas cuya respuesta afirmativa permite concluir con mayor verosimilitud que los efectos observados en un análisis de subgrupos son reales. Sin embargo, y a pesar de todas estas reservas, el análisis de subgrupos del estudio 4S ha permitido concluir que la simvastatina reduce la mortalidad general en mujeres y hombres, así como en personas mayores y menores de 60 años (características «basales» de los pacientes).

Ventajas y limitaciones de los ensayos clínicos aleatorizados

Al igual que cualquier otro diseño epidemiológico, el ensayo clínico presenta ventajas e inconvenientes. Entre las primeras están las siguientes:

  1. Proporcionan la prueba más sólida para inferir causalidad en la relación entre dos variables. Esta propiedad deriva fundamentalmente de la aleatorización.
  2. A veces pueden ser el único diseño posible para una pregunta de investigación. Así, no son posibles diseños observacionales para productos no comercializados. En otros casos son el diseño más rápido y barato. La medida de las relaciones entre dieta y nivel de colesterol en plasma es más fácil y precisa si se asigna una dieta determinada a un grupo de sujetos y se observan sus efectos sobre el colesterol plasmático que realizando una encuesta transversal de sujetos que siguen una dieta ad libitum.

Entre las limitaciones cabe destacar las siguientes:

  1. Los ensayos clínicos en general son costosos, en tiempo y dinero. Es necesario preparar el placebo, reclutar a enfermos con cuadros clínicos no siempre frecuentes, organizar su seguimiento, hacer frente a algunos de los costes de su asistencia médica, retribuir la recogida de datos, etc.
  2. Hay algunas preguntas de investigación que no pueden responderse mediante ensayos clínicos, a causa de salvaguardias éticas o problemas de viabilidad. Así, un ensayo clínico no es útil para confirmar los efectos de un factor de riesgo, pues ningún investigador está legitimado para exponer a un sujeto a dicho factor. Prueba de ello es que nunca se ha realizado un estudio experimental en seres humanos para medir los efectos del tabaco sobre la salud. Sólo se ha realizado algún ensayo reduciendo el consumo de tabaco para ver su eficacia reduciendo el riesgo cardiovascular. En otros casos, la frecuencia de la variable de resultado es tan baja, como las reacciones adversas a medicamentos, que el tamaño y la duración de un ensayo clínico razonable no podrá caracterizarla adecuadamente. Por eso habrá que esperar para hacerlo a que se lleven a cabo estudios de poscomercialización, habitualmente observacionales. Los ensayos clínicos pueden no ser útiles para evaluar tecnologías diagnósticas que se asocian a tratamientos variados entre los diagnosticados y cuya variable de resultado tiene lugar bastante tiempo después del uso de la tecnología diagnóstica. Esto se debe a que es difícil separar los beneficios del diagnóstico de los del tratamiento.
  3. En general, los ensayos clínicos sólo miden la eficacia de las intervenciones sanitarias, es decir, su capacidad para conseguir el efecto deseado aplicadas en condiciones ideales. Los ensayos clínicos se realizan en excelentes instituciones sanitarias, dotadas de los mejores instrumentos diagnósticos en manos de profesionales muy competentes, donde se insiste en el cumplimiento terapéutico, etc. Las condiciones habituales de aplicación de un tratamiento en la clínica habitual no serán éstas, y, por consiguiente, tampoco será igual su capacidad de conseguir los efectos deseados (efectividad). Por ejemplo, muchos ensayos clínicos han demostrado que existen fármacos capaces de controlar la presión arterial en grupos de enfermos y reducir sus complicaciones cardiovasculares. Sin embargo, ninguno de ellos podrá demostrar que tal como se mide la presión habitualmente en los centros sanitarios españoles, como se administra el tratamiento y como lo cumplen los pacientes, los avances terapéuticos de las últimas décadas estén produciendo una reducción de los niveles medios de presión arterial de nuestros ciudadanos o reduciendo su morbimortalidad vascular.

Una vez realizado el análisis de sus ventajas y limitaciones, la pregunta pertinente es: ¿cuándo está indicado realizar un ensayo clínico? Dados sus inconvenientes de coste y viabilidad, un ensayo clínico no suele ser el primer diseño que hay que realizar para responder a una pregunta de investigación. En general, y según Hulley (2006), deben reservarse para las situaciones que cumplan las tres condiciones siguientes:

  1. Cuando ya se han llevado a cabo todos los diseños observacionales necesarios para responder a una pregunta de investigación. Por lo tanto, se trata de una pregunta relativamente «madura».
  2. Cuando el conocimiento hasta entonces existente no es suficiente para realizar recomendaciones clínicas o de salud pública.
  3. Cuando un ensayo clínico proporcione probablemente un aumento importante del conocimiento; cuando sea la única forma o la más barata para responder a una pregunta de investigación.

Uso crítico de ensayos clínicos

Se han publicado recomendaciones para la publicación estructurada de los ensayos clínicos en revistas biomédicas.

Los autores recomiendan informar secuencialmente sobre 22 aspectos diferentes de un ensayo clínico, en especial sobre las características del protocolo de estudio, la asignación de los participantes a los grupos de tratamiento, el enmascaramiento de la intervención, el seguimiento de los participantes y el análisis estadístico. Además, se recomienda incluir en todas las publicaciones de ensayos clínicos un diagrama de flujos con información del paso de los pacientes por las etapas del ensayo antes descritas. Estas recomendaciones, llamadas Declaración CONSORT, se han incorporado a las normas de publicación de algunas de las revistas científicas más prestigiosas, y su lectura puede ser interesante para los lectores de este capítulo, aunque en él se han tratado prácticamente todos los aspectos considerados en dichas recomendaciones.

También se han publicado unas recomendaciones para el uso/lectura críticos de este tipo de investigacio nes. Pretenden facilitar la utilización de la información biomédica en la toma de decisiones clínicas sobre el uso de un procedimiento terapéutico o preventivo. Para ello, primero se juzga la validez de los resultados del estudio, y si son validos, después se intenta establecer si revisten una relevancia directa para la asistencia de nuestros pacientes.

Confiamos en que, con el conocimiento adquirido con la lectura de este capítulo, se expliquen prácticamente por sí mismas.

Anterior
Siguiente