Gestión de Conversaciones
La sección de Conversaciones es el espacio central para revisar, limpiar, etiquetar y preparar tus datos de entrenamiento. Desde aquí puedes validar manualmente, aplicar limpieza automatizada con regex, usar micro-agentes de IA y exportar datasets listos para fine-tuning.
Vista general
Accede desde el menú lateral haciendo clic en Conversaciones. La interfaz tiene tres áreas principales: la barra de herramientas en la parte superior, la tabla de conversaciones en el centro y el inspector lateral que se abre al seleccionar una conversación individual.
Vista principal de conversaciones
La barra superior concentra los controles de navegación y acceso rápido. Aquí puedes alternar entre dos fuentes de datos, seleccionar el proyecto o dataset activo, y acceder a todas las acciones disponibles.
Fuente de datos
Conversaciones del Proyecto
Muestra las conversaciones almacenadas directamente en el proyecto seleccionado. Soporta búsqueda de texto completo, filtro por estado y ordenación. Es la vista principal para revisar y limpiar conversaciones antes del entrenamiento.
Conversaciones del Dataset
Permite inspeccionar y editar los ítems de un dataset existente como si fueran conversaciones. Útil para revisar datasets importados antes de usarlos para entrenamiento. Selecciona el dataset deseado en el desplegable.
Panel de estadísticas
Debajo de la barra de herramientas aparece una fila de estadísticas que se actualiza en tiempo real al cambiar filtros o realizar operaciones.
Número total de conversaciones en la vista actual
Conversaciones marcadas como aptas para entrenamiento
Conversaciones descartadas del conjunto de entrenamiento
Conversaciones que aún no han sido revisadas
Media de puntuaciones asignadas manual o automáticamente
Búsqueda y filtros
Búsqueda de texto completo
Escribe cualquier término en el campo de búsqueda para encontrar conversaciones que contengan ese texto en cualquier mensaje (usuario, asistente o system). La búsqueda se aplica en el servidor y es eficiente incluso con miles de conversaciones.
Filtro por estado
Filtra la tabla por estado de validación: Todas, Válidas, Inválidas o Pendientes. Combina el filtro con la búsqueda para encontrar, por ejemplo, conversaciones inválidas que contienen cierta palabra clave.
Ordenación
| Campo | Descripción |
|---|---|
| Fecha de creación | Más recientes o más antiguas primero |
| Score de calidad | De mayor a menor puntuación |
| Número de mensajes | De más a menos turnos |
| Estado QA | Agrupa por estado de validación |
Haz clic en el encabezado de cualquier columna ordenable para alternar entre ascendente y descendente. La paginación se reinicia automáticamente al cambiar el orden.
Tabla de conversaciones
La tabla muestra las conversaciones de forma paginada con acceso inline a las acciones más comunes. Cada fila representa una conversación completa.
Columnas de la tabla
| Columna | Descripción |
|---|---|
| Selección | Checkbox para incluir en operaciones en lote |
| Mensajes | Vista previa de los primeros mensajes de la conversación. Haz clic para abrir el inspector |
| Turno | Número de intercambios usuario-asistente en la conversación |
| Estado | Etiqueta de validación: válida, inválida, pendiente, omitida o evaluando |
| Score | Puntuación de calidad del 1 al 5 (convertido internamente a 0–1) |
| Tags | Etiquetas temáticas o de calidad asignadas manual o automáticamente |
| Fecha | Momento en que fue creada o importada la conversación |
Edición inline
Editar mensajes
Haz clic en cualquier conversación de la tabla para abrirla en el Inspector lateral, donde puedes editar el contenido de cada mensaje individualmente.
Editar etiquetas
Haz clic en el área de tags de una conversación para agregar o quitar etiquetas directamente desde la tabla sin necesidad de abrir el inspector.
Cambiar estado
Haz clic en la etiqueta de estado de una fila para cambiarla entre válida, inválida, pendiente u omitida de forma instantánea.
Puntuar conversaciones
Asigna entre 1 y 5 estrellas desde el inspector lateral. La puntuación se almacena como score de 0 a 1 y aparece en las estadísticas del panel.
Estados de validación
Válida
Lista para entrenamiento
Inválida
Excluida del dataset
Pendiente
Esperando revisión
Omitida
Ignorada temporalmente
Paginación: La tabla muestra 50 conversaciones por defecto. Puedes cambiar el tamaño de página a 10, 25, 50 o 100 usando el selector en la barra inferior de la tabla. Navega entre páginas con los botones de anterior y siguiente.
Inspector de conversaciones
El Inspector es un panel lateral de 520px que se abre al hacer clic en cualquier fila de la tabla. Muestra el detalle completo de la conversación seleccionada y centraliza todas las acciones que puedes realizar sobre ella.
Historial completo de mensajes
Visualiza todos los mensajes de la conversación con indicadores de rol: system (fondo distinto), user y assistant. Cada mensaje muestra su contenido íntegro con scroll.
Edición de mensajes individuales
Haz clic en el icono de edición junto a cualquier mensaje para modificar su contenido. Guarda los cambios con el botón "Guardar" que aparece al editar. Los cambios se persisten de inmediato.
Gestión de etiquetas
Agrega o elimina tags desde el inspector. Puedes elegir de la lista de tags predefinidos (production_ready, high_quality, needs_review, uses_tools, multi_turn, complex_query, good_escalation, good_context) o escribir tags personalizados.
Cambio de estado y puntuación
Cambia el estado de validación con los botones rápidos en la cabecera del inspector. Asigna una puntuación de 1 a 5 estrellas usando el control de rating interactivo.
Acciones rápidas
Desde el inspector puedes eliminar la conversación, guardarla directamente como un nuevo dataset o cerrar el panel para volver a la tabla completa.
Nota: El inspector y la tabla coexisten en pantalla. Si tu pantalla es menor a ~1200px de ancho, el inspector puede comprimir la tabla. Usa el botón "Cerrar inspector" en la barra de estadísticas para devolver el espacio completo a la tabla.
Subir conversaciones
Usa el botón Subir en la barra superior para abrir el panel de carga. Soporta arrastrar y soltar archivos directamente sobre el área o hacer clic para seleccionarlos.
Abre el panel de subida
Haz clic en el botón "Subir" de la barra superior. El panel se despliega con animación debajo de la barra de herramientas. Para cerrarlo, vuelve a hacer clic en el mismo botón.
Selecciona el archivo JSONL
Arrastra un archivo .jsonl al área marcada o haz clic para abrirlo desde tu explorador de archivos. El archivo debe contener una conversación por línea en formato ChatML (array de messages con role y content).
Validación automática
AstrApp valida cada línea del archivo antes de importar: verifica que el JSON sea válido, que existan los campos requeridos (messages con role y content) y que los roles sean correctos.
Importación completada
Al terminar recibirás una notificación con el número de conversaciones importadas correctamente. La tabla se actualiza automáticamente para mostrar el nuevo contenido.
{"messages": [{"role": "system", "content": "Eres un asistente de ventas."}, {"role": "user", "content": "¿Cuál es el precio?"}, {"role": "assistant", "content": "Desde $9.99/mes."}]}
{"messages": [{"role": "system", "content": "Eres un asistente de ventas."}, {"role": "user", "content": "¿Tienen soporte?"}, {"role": "assistant", "content": "Sí, soporte 24/7 por chat y email."}]}Operaciones en lote
Cuando seleccionas una o más conversaciones con los checkboxes de la tabla, aparece automáticamente una barra flotante en la parte inferior de la pantalla con todas las operaciones disponibles. La barra desaparece al limpiar la selección.
Validar
Marca las seleccionadas como válidas para entrenamiento
Invalidar
Marca las seleccionadas como inválidas
Regex Toolkit
Aplica patrones de limpieza de texto
Micro-Agentes
Mejora con IA: puntuar, etiquetar o reescribir
Exportar JSONL
Descarga las seleccionadas en formato JSONL
Guardar como Dataset
Convierte la selección en un nuevo dataset
Eliminar
Elimina permanentemente las conversaciones seleccionadas
Tip: Usa el checkbox en el encabezado de la tabla para seleccionar todas las conversaciones visibles en la página actual. Para seleccionar en múltiples páginas, aplica primero un filtro y luego selecciona todas.
Regex Toolkit
El Regex Toolkit aplica patrones de expresiones regulares sobre el contenido de texto de las conversaciones seleccionadas. Es ideal para anonimizar datos sensibles, normalizar formatos o eliminar ruido antes del entrenamiento.
Selecciona las conversaciones
Marca los checkboxes de las conversaciones que quieres procesar o usa "Seleccionar todas" en el encabezado.
Abre el Regex Toolkit
Haz clic en el botón "Regex" de la barra de operaciones en lote, o desde el Command Palette (Cmd+K → Regex Toolkit).
Configura los patrones
Usa los patrones predefinidos haciendo clic en los botones de la pestaña "Patrones" o crea patrones personalizados en la pestaña "Personalizado". Cada patrón incluye la expresión regular, el texto de reemplazo y los flags.
Previsualiza los cambios
Antes de aplicar, revisa la vista previa que muestra cómo quedarán los mensajes afectados. Los cambios se resaltan para que puedas confirmar que el patrón funciona correctamente.
Aplica la operación
Haz clic en "Aplicar" para procesar todas las conversaciones seleccionadas. Recibirás confirmación con el número de conversaciones actualizadas.
Patrones predefinidos
| Categoría | Patrón | Reemplaza con | Descripción |
|---|---|---|---|
| PII | Emails | [EMAIL] | Reemplaza direcciones de correo electrónico |
| PII | Teléfonos | [PHONE] | Reemplaza números de teléfono en varios formatos |
| PII | URLs | [URL] | Reemplaza enlaces http/https |
| Formato | Espacios extra | Normaliza espacios en blanco múltiples | |
| Formato | Saltos excesivos | \n | Reduce múltiples saltos de línea consecutivos |
Advertencia: Las operaciones de regex modifican el contenido de los mensajes de forma permanente. Siempre previsualiza los cambios antes de aplicarlos y considera exportar una copia de respaldo en JSONL antes de procesar lotes grandes.
Micro-AgentesPRO
Los Micro-Agentes son tareas de IA que se ejecutan en lote sobre las conversaciones seleccionadas. Cada agente usa un modelo de lenguaje para analizar o transformar el contenido de forma automatizada. Requieren una conexión activa a un proveedor LLM.
Templates disponibles
Scorer de Calidad
Puntúa automáticamente cada conversación de 0 a 1. Considera naturalidad, coherencia, utilidad, precisión factual y gramática.
Salida: Score numérico + estado valid/invalid
Etiquetador Automático
Asigna tags temáticos y de calidad como production_ready, high_quality, needs_review, multi_turn, complex_query, entre otros.
Salida: Array de etiquetas
Reescritor
Mejora las respuestas del asistente corrigiendo gramática, redacción y claridad, manteniendo el contenido factual intacto.
Salida: Conversación reescrita completa
Agente Personalizado
Define tu propio prompt y formato de salida para tareas específicas que no cubren los templates predefinidos.
Salida: Configurable por el usuario
Modelos disponibles
Gemini 2.5 Flash
gemini-flash
Velocidad y bajo costo
Claude Haiku 4.5
claude-haiku
Precisión en español
ChatGPT-4o
chatgpt-5
Calidad general alta
Cómo usar los Micro-Agentes
Selecciona las conversaciones
Marca las conversaciones que quieres procesar con los checkboxes de la tabla.
Abre el diálogo de Micro-Agentes
Haz clic en "Agentes" en la barra de operaciones en lote o usa Cmd+K → Micro-Agentes.
Elige el template y modelo
Selecciona el tipo de agente (Scorer, Etiquetador, Reescritor o Personalizado) y el modelo LLM a usar. Puedes personalizar el prompt del agente si lo necesitas.
Ejecuta el agente
Haz clic en "Ejecutar". El agente procesará cada conversación seleccionada de forma secuencial. Verás el progreso en tiempo real.
Revisa los resultados
Al completarse, la tabla se actualizará mostrando los nuevos scores, tags o contenido reescrito aplicado por el agente. Puedes revisar los cambios en el Inspector.
Guardar como dataset
Una vez que hayas validado y limpiado tus conversaciones, puedes convertirlas en un nuevo dataset listo para fine-tuning. Esto crea una copia permanente en la sección de Datasets.
Selecciona las conversaciones a incluir
Marca con checkboxes las conversaciones que formarán el dataset. Recomendamos filtrar primero por estado "válida" para incluir solo conversaciones de calidad.
Abre el diálogo de guardado
Haz clic en el botón "Dataset" en la barra de operaciones en lote. También puedes guardar una conversación individual desde el Inspector.
Asigna nombre y descripción
Escribe un nombre descriptivo para el nuevo dataset (ej: "Conversaciones válidas - mayo 2025"). La descripción es opcional pero recomendada para documentar el origen.
Confirma la operación
Haz clic en "Guardar Dataset". Verás una barra de progreso mientras se procesan las conversaciones. Al completarse, serás redirigido al nuevo dataset.
Evaluar conversacionesPRO
El botón Evaluar de la barra superior lanza una evaluación automática usando LLM-as-a-Judge sobre las conversaciones seleccionadas. El sistema asigna un score y determina si cada conversación es válida para entrenamiento.
Cómo lanzar una evaluación
- Selecciona las conversaciones a evaluar
- Haz clic en el botón "Evaluar" de la barra superior
- Configura el modelo juez y los criterios
- Inicia la evaluación y espera los resultados
- Los scores se guardan automáticamente en cada conversación
Qué evalúa el sistema
- Naturalidad del diálogo y coherencia
- Precisión factual de las respuestas
- Utilidad e informatividad del asistente
- Gramática y claridad general
Tip: Usa el Scorer de Micro-Agentes como alternativa más económica si no necesitas la evaluación comparativa completa. El Scorer aplica el mismo criterio de puntuación 0–1 a un costo de API menor.
Generar conversaciones sintéticasPRO
El botón Generar de la barra superior te lleva a la herramienta de síntesis de datos donde puedes crear conversaciones de entrenamiento de forma automatizada usando IA.
Desde documento
Sube un PDF, DOCX o TXT y genera pares de pregunta-respuesta basados en su contenido. Ideal para manuales y documentación.
Desde ejemplos semilla
Proporciona unos pocos ejemplos de alta calidad y genera variaciones que mantienen el mismo estilo y dominio.
Aumentación de dataset
Amplía un dataset existente con paráfrasis y variaciones para evitar overfitting y aumentar la diversidad.
Command Palette
El Command Palette es un acceso rápido a todas las acciones disponibles en la vista de conversaciones. Se activa con el atajo de teclado y permite ejecutar operaciones sin necesidad de usar el ratón.
| Acción en el Command Palette | Descripción |
|---|---|
| Filtrar: solo válidas | Muestra únicamente conversaciones con estado válido |
| Filtrar: solo inválidas | Muestra únicamente conversaciones con estado inválido |
| Filtrar: solo pendientes | Muestra únicamente conversaciones pendientes de revisión |
| Limpiar filtros | Restablece todos los filtros activos |
| Abrir/Cerrar inspector | Alterna el panel lateral del Inspector |
| Abrir/Cerrar panel de subida | Alterna el área de carga de archivos |
| Validar seleccionadas | Aplica estado válido en lote |
| Invalidar seleccionadas | Aplica estado inválido en lote |
| Regex Toolkit | Abre el panel de limpieza con expresiones regulares |
| Micro-Agentes | Abre el diálogo de mejora con IA |
| Exportar seleccionadas (JSONL) | Descarga las conversaciones seleccionadas |
Atajos de teclado
Cmd+K (macOS) o Ctrl+K (Windows/Linux) abre el Command Palette en cualquier momento dentro de la vista de conversaciones. Es la forma más rápida de ejecutar acciones en lote cuando ya tienes conversaciones seleccionadas.
Buenas prácticas
Valida antes de entrenar
Revisa manualmente al menos el 10–20% de tus conversaciones antes de usarlas para entrenamiento. Los errores en el dataset se trasladan directamente al comportamiento del modelo.
Usa el Scorer antes de validar manualmente
Ejecuta el Micro-Agente Scorer sobre todo el dataset primero. Filtra por score < 0.5 para identificar conversaciones problemáticas y revisarlas con prioridad.
Anonimiza datos sensibles
Si tus conversaciones contienen datos de clientes (emails, teléfonos, nombres), usa el Regex Toolkit con los patrones de PII antes de entrenar o exportar.
Mantén el system prompt consistente
Todas las conversaciones de un mismo dataset deberían usar el mismo system prompt. Las inconsistencias confunden al modelo durante el entrenamiento.
Exporta respaldos periódicamente
Usa la función de exportar en lote (JSONL) para guardar copias de respaldo de tus conversaciones antes de aplicar operaciones destructivas como regex o eliminación masiva.
Itera en lotes pequeños
Al usar Micro-Agentes, prueba primero con 10–20 conversaciones para verificar que el agente hace lo que esperas antes de ejecutarlo en cientos de conversaciones.