Métricas
Define qué medir para evaluar la calidad de tu modelo. Opik incluye métricas predefinidas y soporta métricas personalizadas.
Métricas predefinidas
Hallucination Score
Detecta cuando el modelo inventa información que no está en el contexto o conocimiento base.
Por qué importa: Crítico para confianza del usuario
Relevance Score
Mide que tan bien la respuesta aborda la pregunta real del usuario.
Por qué importa: Indica utilidad de la respuesta
Answer Correctness
Compara la respuesta con una respuesta de referencia (si existe).
Por qué importa: Precisión factual
Tone Appropriateness
Evalúa si el tono es profesional, amigable, o el esperado.
Por qué importa: Experiencia del usuario
Context Precision
Para RAG: que tan relevante es el contexto recuperado.
Por qué importa: Calidad del retrieval
Métricas para ventas
Para bots de ventas, estas métricas adicionales son útiles:
Qué tan bien identifica leads valiosos
Efectividad manejando objeciones de precio, tiempo, etc.
Frecuencia con que guía hacia siguiente paso
Precisión en precios, specs, disponibilidad
Interpretación de resultados
Listo para producción
Pequeñas mejoras posibles
Revisar datos de entrenamiento
No desplegar, investigar
Anterior
Auto-TracingSiguiente
Experimentos