Curso de diseño de ensayos clínicos – con especial énfasis en Oncología
Número 3. Ensayos clínicos de fase III

Dr. Pedro M. Politi


Una vez decidido (en base a los resultados de la fase II) que vale la pena emprender un ensayo de fase III (controlado frente al tratamiento estándar, aleatorizado, y si fuese posible, a doble ciego) para evaluar eficacia y seguridad de un nuevo tratamiento o método terapéutico, de rehabilitación o preventivo (sea éste una droga, una vacuna, una combinación de fármacos o de modalidades de tratamiento - ej, cirugía, radioterapia y fármacos -, un tipo de algoritmo de decisión - más raramente -, un dispositivo terapéutico - ej, cirugía láser o laparoscópica -, o un elemento de prevención o protección - ej, un mosquitero para prevenir el paludismo, un protector de cadera para prevenir fracturas al caer, etc), la primera pregunta es: "¿para qué?". Esta pregunta implica plantearse si el ensayo busca obtener aprobación regulatoria del producto o método - por primera vez - o bien si se pone a prueba una nueva indicación de un producto o método ya aprobado. Además, es necesario considerar con toda franqueza si el nuevo producto o método impresiona como con probabilidad de salir bien parado o no. Esto es importante, dada la gran inversión de tiempo y recursos que implica un ensayo de fase III : una propuesta, en general, millonaria. Y que no debe tomarse a la ligera.

Volviendo al punto de la estimación más realista y honesta posible de las probabilidades de éxito del tratamiento nuevo, importa recordar que una terapia "igual o levemente inferior" al estándar puede aún ser un gran progreso:
- si es mucho más conveniente
- si es no-invasiva, frente a una terapia estándar "dura, agresiva y cruel"
- si es menos tóxica
- si brinda una alternativa diferente, por ej en un subgrupo que no tolerase bien la terapia estándar (ej: ancianos, diabéticos, trasplantados, niños prematuros, etc).
- Si tiene un perfil de toxicidad limitante muy diverso de la terapia estándar.
- Si exhibe un mecanismo de acción novedoso, muy diferente del de la terapia estándar.

Esto se exterioriza en un posible planteo de "ensayo de no-inferioridad". Es decir, que se busca demostrar que el nuevo tratamiento NO ES SIGNIFICATIVAMENTE INFERIOR al estándar. Lo cual es mucho menos que buscar que el nuevo tratamiento sea superior, en términos de diseño y recursos. En resumen: a veces, un empate es un triunfo. Se analizará el tema de los ensayos de "no-inferioridad" más adelante.

Una vez tomada la decisión de realizar el ensayo, la pregunta más importante es: ¿qué endpoints utilizamos? Esto es crítico, ya que si los endpoints seleccionados no fuesen clínicamente relevantes, el ensayo puede resultar exitoso, pero no impactará en la práctica clínica.

Uno de los objetivos alejados más importantes de un ensayo clínico - además de obtener reconocimiento o aprobación regulatoria) es LOGRAR PRODUCIR UN IMPACTO O CAMBIO EN LA PRACTICA CLINICA ESTANDAR. De otro modo, fue "una voz que clama en el desierto" - algo irrelevante.

En entregas previas, vimos que hay endpoints primarios y secundarios, y que los endpoints pueden ser considerados "duros" (mortalidad) o "blandos" (control glucémico, descenso de la presión arterial o del colesterol en sangre). Los endpoints primarios son aquellos por los cuales el ensayo de fase III será juzgado como exitoso o no. Todo o nada. Los secundarios, son aspectos en los que un "éxito" o fracaso probablemente no comprometan el resultado general en forma crítica. Se notará que los endpoints secundarios son frecuentemente endpoints "sustitutos" (surrogate), o sea "no-la-cosa-que-vale-absolutamente": la mejora en recuento de plaquetas, qué bien, pero la frecuencia de sangrado grave - por ejemplo, intracraneal - , la mortalidad... ésos son endpoints que valen!

Por lo tanto, a seleccionar bien los endpoints primarios. Y a seleccionar bien los pacientes.

A veces, un ensayo puede fracasar porque .... no pasa nada. Porque no ocurren "eventos", es decir, porque nadie se infarta, o nadie tiene stroke , o nadie se muere, o nadie se fractura - en ninguna de las ramas. Esto implica que el ensayo se queda sin poder comparar válidamente la tasa de eventos (queda cero versus cero). Para evitar estos problemas...
- se seleccionan pacientes que exhiban un cierto riesgo de presentar un "evento". Si es un estudio en enfermedad coronaria, "rinde" más evaluar prevención secundaria (gente que tuvo ya un infarto de miocardio) que ocuparse de prevención primaria (habría que prepararse para incorporar decenas o centenares de miles de pacientes, y seguirlos por décadas - nada atractivo, y prohibitivamente costoso! ).
- se seleccionan pacientes que no estén "al borde de la muerte", o "más allá de las cosas". Por ejemplo , si diseñamos un protocolo para leucemia refractaria o cáncer de páncreas no respondedor (que de por sí tienen una pobre expectativa de sobrevida), deberemos asegurarnos que los pacientes no estén tan deteriorados que no tengan ninguna chance de beneficiarse, así se reduzca la masa neoplásica o no.


Para esto, lo fundamental es contar con expertos en el manejo de la patología que se estudie, de modo que nos expliquen qué endpoint - o qué diferencia en endpoints - sería atractiva o médicamente interesante, al punto de llevar a un cambio en la práctica estándar. En otras palabras: "Doctor, le serviría una disminución del 20% en la mortalidad de la sepsis grave? Y un 15% menos de infartos de miocardio a lo largo de 10 años?. Valdría la pena si se extiende la sobrevida mediana en 12 meses?". También podríamos preguntar: "Cuántos puntos porcentuales menos de probabilidad de sobrevida estaría Usted dispuesto a aceptar, a cambio de un tratamiento mucho más gentil, oral, simple y no-tóxico?".
Estas son las preguntas valiosas.


Ensayos de no-inferioridad
Este diseño es común en estos tiempos, que los laboratorios producen drogas derivadas de otras ya disponibles. Un ejemplo es la doxorrubicina liposomal. Sería largo discutir si se trata de "absolutamente otra droga" (en parte, sí) o si es solamente otra formulación de la misma droga ("nueva y mejorada"). El punto es: en cáncer de mama metastásico, qué valor tendría una droga que - sin ser claramente inferior a la doxorrubicina convencional - tuviese bajo riesgo de toxicidad cardíaca irreversible, menor riesgo de mielosupresión severa y mínimo riesgo de necrosis por extravasación? Ahí está la cosa: ¿cuánto menos, a cambio de otras ventajas? ¿Podría uno decir: si el "menos" en eficacia fuese "una tendencia", o "no significativo", adelante pues?. Esa es la idea de los ensayos de no-inferioridad: que la droga experimental no cae por debajo del límite inferior - del intervalo de confianza prefijado. O sea que de entrada, sabemos que no va a superar en eficacia al estándar. Queremos que no se quede muy atrás, simplemente, de modo que la ecuación riesgo-beneficio todavía le sea favorable al nuevo producto.

Como surge claramente, una cosa es el diseño, otra los resultados y su interpretación, y en otro plano va la discusión sobre si este tipo de ensayos clarifica o bien tiende a oscurecer el panorama. “Que la ciencia fuese neutral” (tal como lo expresa Joan Manuel Serrat en su canción “Sería fantástico”, es uno de tantos deseos postergados de la sociedad.

Continuará...