Reporte técnico · Abril 2026 · auditable

El 95.2% agenda al primer intento.
El 100% en tres.

Publicamos los números porque la confianza se construye con evidencia, no con promesas. 42 casos, 14 flujos conversacionales, 3 clínicas reales.

Hablar con ventas →Leer el estudio completo

● 14 flujos · 3 clínicas reales · Última medición abril 2026

pass@1

95.2%

Al primer intento

pass@2

97.6%

Al segundo intento (juez)

pass@3

100%

En máximo tres intentos

Lo que el paciente percibe

El paciente nunca repite el agendamiento.

Si el primer intento del agente falla, un segundo agente (juez) lo corrige internamente. Lo único que varía es el tiempo de respuesta.

Intento 1

40 s

95.2% de los casos

Intento 2

90 s

+2.4% (corregido por el juez)

Intento 3

120 s

+2.4% (cierra el 100%)

Para comparar: una recepcionista humana validando agenda y creando un turno

5–15 min

Evidencia visual

El reporte original, sin filtros.

Las dos páginas que generó la suite de evals el 22 de abril de 2026. Sin retoques, sin marketing, sin selección. Si alguna cifra de esta página no coincide con la captura, gana la captura.

Métricas pass@1 95.2%, pass@2 97.6% y pass@3 100% del reporte de evals de Clinera del 22 de abril de 2026, sobre 42 casos y 14 flujos contra 3 clínicas reales — Página 1 · Métricas generales

Tabla de los 5 bugs críticos arreglados antes del release: sycophancy con precios, loop con otra IA, error 400 multi-sucursal, fechas 2025 y alucinación de confirmación — Página 2 · Desglose y bugs

Por flujo

Los 14 flujos evaluados.

Cada flujo se ejecutó 3 veces con variaciones de prompt. Doce pasaron con pass@1 perfecto. Dos necesitaron al juez para llegar al 100%.

agendar_cita

3/3

auto_booking_off

3/3

burst_messages

3/3

cancelar_cita

3/3

charla_general

3/3

consultar_disponibilidad

3/3

consultar_servicios

3/3

cross_tenant_leak

3/3

handoff_explicito

3/3

ia_loop_detection

3/3

instrucciones_custom

3/3

manipulacion_datos

3/3

multi_turno

2/3

prompt_injection

2/3

pass@1 perfecto requirió juez (pass@2)

Cómo se llega al 100%

Self-refine con agente juez.

El agente principal responde, un segundo LLM independiente verifica si el objetivo se cumplió, y si no, genera un hint y dispara un reintento. El paciente no nota el proceso: solo el tiempo varía.

Mensaje

Paciente

WhatsApp · IG · Widget web

Nivel 1LLM

Fluentia

Agente conversacional. Crea turno con tools reales.

Nivel 2LLM

Juez

LLM independiente. ¿Se cumplió el objetivo?

Resultado

Turno creado

DB real de la clínica. Trazable end-to-end.

¿Quieres ver el código, los patrones de guardrail, el stack completo y la metodología?

Leer el estudio técnico →

Preguntas frecuentes

Lo que más nos preguntan.

¿Qué significa “100% de agendamientos exitosos”?

En la muestra auditada de 42 casos sobre 3 clínicas reales, todos los casos terminaron en agendamiento correcto o en derivación a humano correcta cuando ese era el objetivo. Ningún caso quedó sin resolver.

¿El paciente tiene que escribir varias veces si la IA falla?

No. Escribe una sola vez. Si el agente principal falla, un segundo agente (juez) lo detecta y reintenta internamente. El paciente solo nota que la respuesta tardó 90 o 120 segundos en lugar de 40.

¿Puedo auditar estos resultados?

Sí. Los clientes activos pueden solicitar el JSONL crudo de resultados. Periodistas e investigadores pueden coordinar una auditoría en sandbox bajo NDA.

¿Cada cuánto actualizan el estudio?

La suite corre en cada release y bloquea merge si pass@1 baja de 90%. Publicamos un reporte resumido trimestralmente. Próxima actualización: julio 2026.

¿Qué hace Clinera distinto de otros chatbots para clínicas?

Tres cosas auditables: arquitectura de dos niveles con agente juez y self-refine, tests contra clínicas reales publicados, y trazabilidad completa desde el mensaje hasta el turno creado en la base de datos.

Empieza hoy

Contrata a AURA hoy. Esta noche ya está agendando.

30 minutos con ventas y te mostramos cómo quedaría tu empleado digital — con tu agenda, tu base de datos y tus precios. Sin compromiso.

Hablar con ventas →Ver demo

● Activación en < 1 hora · Soporte en Chile y México · Factura en USD

✦

Así parte AURA en tu clínica

01

Conectas tu WhatsApp Business

Sin cambiar de número. 2 minutos.

02

AURA se conecta a tu agenda y BD

Importamos tu base de pacientes y horas disponibles.

03

Empieza a responder con contexto

Esta misma tarde, sabiendo quién es quién.

El 95.2% agenda al primer intento.El 100% en tres.