Guía de Uso

Gestión de Conversaciones

La sección de Conversaciones es el espacio central para revisar, limpiar, etiquetar y preparar tus datos de entrenamiento. Desde aquí puedes validar manualmente, aplicar limpieza automatizada con regex, usar micro-agentes de IA y exportar datasets listos para fine-tuning.

Vista general

Accede desde el menú lateral haciendo clic en Conversaciones. La interfaz tiene tres áreas principales: la barra de herramientas en la parte superior, la tabla de conversaciones en el centro y el inspector lateral que se abre al seleccionar una conversación individual.

Conversaciones del Proyecto

Filtrar y ordenar

Validar y etiquetar

Exportar dataset

Vista principal de conversaciones

La barra superior concentra los controles de navegación y acceso rápido. Aquí puedes alternar entre dos fuentes de datos, seleccionar el proyecto o dataset activo, y acceder a todas las acciones disponibles.

Fuente de datos

Conversaciones del Proyecto

Muestra las conversaciones almacenadas directamente en el proyecto seleccionado. Soporta búsqueda de texto completo, filtro por estado y ordenación. Es la vista principal para revisar y limpiar conversaciones antes del entrenamiento.

Conversaciones del Dataset

Permite inspeccionar y editar los ítems de un dataset existente como si fueran conversaciones. Útil para revisar datasets importados antes de usarlos para entrenamiento. Selecciona el dataset deseado en el desplegable.

Panel de estadísticas

Debajo de la barra de herramientas aparece una fila de estadísticas que se actualiza en tiempo real al cambiar filtros o realizar operaciones.

Total

Número total de conversaciones en la vista actual

Válidas

Conversaciones marcadas como aptas para entrenamiento

Inválidas

Conversaciones descartadas del conjunto de entrenamiento

Pendientes

Conversaciones que aún no han sido revisadas

Score Promedio

Media de puntuaciones asignadas manual o automáticamente

Búsqueda y filtros

Búsqueda de texto completo

Escribe cualquier término en el campo de búsqueda para encontrar conversaciones que contengan ese texto en cualquier mensaje (usuario, asistente o system). La búsqueda se aplica en el servidor y es eficiente incluso con miles de conversaciones.

Filtro por estado

Filtra la tabla por estado de validación: Todas, Válidas, Inválidas o Pendientes. Combina el filtro con la búsqueda para encontrar, por ejemplo, conversaciones inválidas que contienen cierta palabra clave.

Ordenación

Campo	Descripción
Fecha de creación	Más recientes o más antiguas primero
Score de calidad	De mayor a menor puntuación
Número de mensajes	De más a menos turnos
Estado QA	Agrupa por estado de validación

Haz clic en el encabezado de cualquier columna ordenable para alternar entre ascendente y descendente. La paginación se reinicia automáticamente al cambiar el orden.

Tabla de conversaciones

La tabla muestra las conversaciones de forma paginada con acceso inline a las acciones más comunes. Cada fila representa una conversación completa.

Columnas de la tabla

Columna	Descripción
Selección	Checkbox para incluir en operaciones en lote
Mensajes	Vista previa de los primeros mensajes de la conversación. Haz clic para abrir el inspector
Turno	Número de intercambios usuario-asistente en la conversación
Estado	Etiqueta de validación: válida, inválida, pendiente, omitida o evaluando
Score	Puntuación de calidad del 1 al 5 (convertido internamente a 0–1)
Tags	Etiquetas temáticas o de calidad asignadas manual o automáticamente
Fecha	Momento en que fue creada o importada la conversación

Edición inline

Editar mensajes

Haz clic en cualquier conversación de la tabla para abrirla en el Inspector lateral, donde puedes editar el contenido de cada mensaje individualmente.

Editar etiquetas

Haz clic en el área de tags de una conversación para agregar o quitar etiquetas directamente desde la tabla sin necesidad de abrir el inspector.

Cambiar estado

Haz clic en la etiqueta de estado de una fila para cambiarla entre válida, inválida, pendiente u omitida de forma instantánea.

Puntuar conversaciones

Asigna entre 1 y 5 estrellas desde el inspector lateral. La puntuación se almacena como score de 0 a 1 y aparece en las estadísticas del panel.

Estados de validación

Válida

Lista para entrenamiento

Inválida

Excluida del dataset

Pendiente

Esperando revisión

Omitida

Ignorada temporalmente

Paginación: La tabla muestra 50 conversaciones por defecto. Puedes cambiar el tamaño de página a 10, 25, 50 o 100 usando el selector en la barra inferior de la tabla. Navega entre páginas con los botones de anterior y siguiente.

Inspector de conversaciones

El Inspector es un panel lateral de 520px que se abre al hacer clic en cualquier fila de la tabla. Muestra el detalle completo de la conversación seleccionada y centraliza todas las acciones que puedes realizar sobre ella.

Historial completo de mensajes

Visualiza todos los mensajes de la conversación con indicadores de rol: system (fondo distinto), user y assistant. Cada mensaje muestra su contenido íntegro con scroll.

Edición de mensajes individuales

Haz clic en el icono de edición junto a cualquier mensaje para modificar su contenido. Guarda los cambios con el botón "Guardar" que aparece al editar. Los cambios se persisten de inmediato.

Gestión de etiquetas

Agrega o elimina tags desde el inspector. Puedes elegir de la lista de tags predefinidos (production_ready, high_quality, needs_review, uses_tools, multi_turn, complex_query, good_escalation, good_context) o escribir tags personalizados.

Cambio de estado y puntuación

Cambia el estado de validación con los botones rápidos en la cabecera del inspector. Asigna una puntuación de 1 a 5 estrellas usando el control de rating interactivo.

Acciones rápidas

Desde el inspector puedes eliminar la conversación, guardarla directamente como un nuevo dataset o cerrar el panel para volver a la tabla completa.

Nota: El inspector y la tabla coexisten en pantalla. Si tu pantalla es menor a ~1200px de ancho, el inspector puede comprimir la tabla. Usa el botón "Cerrar inspector" en la barra de estadísticas para devolver el espacio completo a la tabla.

Subir conversaciones

Usa el botón Subir en la barra superior para abrir el panel de carga. Soporta arrastrar y soltar archivos directamente sobre el área o hacer clic para seleccionarlos.

Abre el panel de subida

Haz clic en el botón "Subir" de la barra superior. El panel se despliega con animación debajo de la barra de herramientas. Para cerrarlo, vuelve a hacer clic en el mismo botón.

Selecciona el archivo JSONL

Arrastra un archivo .jsonl al área marcada o haz clic para abrirlo desde tu explorador de archivos. El archivo debe contener una conversación por línea en formato ChatML (array de messages con role y content).

Validación automática

AstrApp valida cada línea del archivo antes de importar: verifica que el JSON sea válido, que existan los campos requeridos (messages con role y content) y que los roles sean correctos.

Importación completada

Al terminar recibirás una notificación con el número de conversaciones importadas correctamente. La tabla se actualiza automáticamente para mostrar el nuevo contenido.

Formato esperado — conversaciones.jsonl

{"messages": [{"role": "system", "content": "Eres un asistente de ventas."}, {"role": "user", "content": "¿Cuál es el precio?"}, {"role": "assistant", "content": "Desde $9.99/mes."}]}
{"messages": [{"role": "system", "content": "Eres un asistente de ventas."}, {"role": "user", "content": "¿Tienen soporte?"}, {"role": "assistant", "content": "Sí, soporte 24/7 por chat y email."}]}

Operaciones en lote

Cuando seleccionas una o más conversaciones con los checkboxes de la tabla, aparece automáticamente una barra flotante en la parte inferior de la pantalla con todas las operaciones disponibles. La barra desaparece al limpiar la selección.

Validar

Marca las seleccionadas como válidas para entrenamiento

Invalidar

Marca las seleccionadas como inválidas

Regex Toolkit

Aplica patrones de limpieza de texto

Micro-Agentes

Mejora con IA: puntuar, etiquetar o reescribir

Exportar JSONL

Descarga las seleccionadas en formato JSONL

Guardar como Dataset

Convierte la selección en un nuevo dataset

Eliminar

Elimina permanentemente las conversaciones seleccionadas

Tip: Usa el checkbox en el encabezado de la tabla para seleccionar todas las conversaciones visibles en la página actual. Para seleccionar en múltiples páginas, aplica primero un filtro y luego selecciona todas.

Regex Toolkit

El Regex Toolkit aplica patrones de expresiones regulares sobre el contenido de texto de las conversaciones seleccionadas. Es ideal para anonimizar datos sensibles, normalizar formatos o eliminar ruido antes del entrenamiento.

Selecciona las conversaciones

Marca los checkboxes de las conversaciones que quieres procesar o usa "Seleccionar todas" en el encabezado.

Abre el Regex Toolkit

Haz clic en el botón "Regex" de la barra de operaciones en lote, o desde el Command Palette (Cmd+K → Regex Toolkit).

Configura los patrones

Usa los patrones predefinidos haciendo clic en los botones de la pestaña "Patrones" o crea patrones personalizados en la pestaña "Personalizado". Cada patrón incluye la expresión regular, el texto de reemplazo y los flags.

Previsualiza los cambios

Antes de aplicar, revisa la vista previa que muestra cómo quedarán los mensajes afectados. Los cambios se resaltan para que puedas confirmar que el patrón funciona correctamente.

Aplica la operación

Haz clic en "Aplicar" para procesar todas las conversaciones seleccionadas. Recibirás confirmación con el número de conversaciones actualizadas.

Patrones predefinidos

Categoría	Patrón	Reemplaza con	Descripción
PII	Emails	[EMAIL]	Reemplaza direcciones de correo electrónico
PII	Teléfonos	[PHONE]	Reemplaza números de teléfono en varios formatos
PII	URLs	[URL]	Reemplaza enlaces http/https
Formato	Espacios extra		Normaliza espacios en blanco múltiples
Formato	Saltos excesivos	\n	Reduce múltiples saltos de línea consecutivos

Advertencia: Las operaciones de regex modifican el contenido de los mensajes de forma permanente. Siempre previsualiza los cambios antes de aplicarlos y considera exportar una copia de respaldo en JSONL antes de procesar lotes grandes.

Micro-AgentesPRO

Los Micro-Agentes son tareas de IA que se ejecutan en lote sobre las conversaciones seleccionadas. Cada agente usa un modelo de lenguaje para analizar o transformar el contenido de forma automatizada. Requieren una conexión activa a un proveedor LLM.

Templates disponibles

Scorer de Calidad

Puntúa automáticamente cada conversación de 0 a 1. Considera naturalidad, coherencia, utilidad, precisión factual y gramática.

Salida: Score numérico + estado valid/invalid

Etiquetador Automático

Asigna tags temáticos y de calidad como production_ready, high_quality, needs_review, multi_turn, complex_query, entre otros.

Salida: Array de etiquetas

Reescritor

Mejora las respuestas del asistente corrigiendo gramática, redacción y claridad, manteniendo el contenido factual intacto.

Salida: Conversación reescrita completa

Agente Personalizado

Define tu propio prompt y formato de salida para tareas específicas que no cubren los templates predefinidos.

Salida: Configurable por el usuario

Modelos disponibles

Gemini 2.5 Flash

gemini-flash

Velocidad y bajo costo

Claude Haiku 4.5

claude-haiku

Precisión en español

ChatGPT-4o

chatgpt-5

Calidad general alta

Cómo usar los Micro-Agentes

Selecciona las conversaciones

Marca las conversaciones que quieres procesar con los checkboxes de la tabla.

Abre el diálogo de Micro-Agentes

Haz clic en "Agentes" en la barra de operaciones en lote o usa Cmd+K → Micro-Agentes.

Elige el template y modelo

Selecciona el tipo de agente (Scorer, Etiquetador, Reescritor o Personalizado) y el modelo LLM a usar. Puedes personalizar el prompt del agente si lo necesitas.

Ejecuta el agente

Haz clic en "Ejecutar". El agente procesará cada conversación seleccionada de forma secuencial. Verás el progreso en tiempo real.

Revisa los resultados

Al completarse, la tabla se actualizará mostrando los nuevos scores, tags o contenido reescrito aplicado por el agente. Puedes revisar los cambios en el Inspector.

Guardar como dataset

Una vez que hayas validado y limpiado tus conversaciones, puedes convertirlas en un nuevo dataset listo para fine-tuning. Esto crea una copia permanente en la sección de Datasets.

Selecciona las conversaciones a incluir

Marca con checkboxes las conversaciones que formarán el dataset. Recomendamos filtrar primero por estado "válida" para incluir solo conversaciones de calidad.

Abre el diálogo de guardado

Haz clic en el botón "Dataset" en la barra de operaciones en lote. También puedes guardar una conversación individual desde el Inspector.

Asigna nombre y descripción

Escribe un nombre descriptivo para el nuevo dataset (ej: "Conversaciones válidas - mayo 2025"). La descripción es opcional pero recomendada para documentar el origen.

Confirma la operación

Haz clic en "Guardar Dataset". Verás una barra de progreso mientras se procesan las conversaciones. Al completarse, serás redirigido al nuevo dataset.

Evaluar conversacionesPRO

El botón Evaluar de la barra superior lanza una evaluación automática usando LLM-as-a-Judge sobre las conversaciones seleccionadas. El sistema asigna un score y determina si cada conversación es válida para entrenamiento.

Cómo lanzar una evaluación

Selecciona las conversaciones a evaluar
Haz clic en el botón "Evaluar" de la barra superior
Configura el modelo juez y los criterios
Inicia la evaluación y espera los resultados
Los scores se guardan automáticamente en cada conversación

Qué evalúa el sistema

Naturalidad del diálogo y coherencia
Precisión factual de las respuestas
Utilidad e informatividad del asistente
Gramática y claridad general

Tip: Usa el Scorer de Micro-Agentes como alternativa más económica si no necesitas la evaluación comparativa completa. El Scorer aplica el mismo criterio de puntuación 0–1 a un costo de API menor.

Generar conversaciones sintéticasPRO

El botón Generar de la barra superior te lleva a la herramienta de síntesis de datos donde puedes crear conversaciones de entrenamiento de forma automatizada usando IA.

Desde documento

Sube un PDF, DOCX o TXT y genera pares de pregunta-respuesta basados en su contenido. Ideal para manuales y documentación.

Desde ejemplos semilla

Proporciona unos pocos ejemplos de alta calidad y genera variaciones que mantienen el mismo estilo y dominio.

Aumentación de dataset

Amplía un dataset existente con paráfrasis y variaciones para evitar overfitting y aumentar la diversidad.

Ver guía completa de síntesis de datos

Command Palette

El Command Palette es un acceso rápido a todas las acciones disponibles en la vista de conversaciones. Se activa con el atajo de teclado y permite ejecutar operaciones sin necesidad de usar el ratón.

Acción en el Command Palette	Descripción
Filtrar: solo válidas	Muestra únicamente conversaciones con estado válido
Filtrar: solo inválidas	Muestra únicamente conversaciones con estado inválido
Filtrar: solo pendientes	Muestra únicamente conversaciones pendientes de revisión
Limpiar filtros	Restablece todos los filtros activos
Abrir/Cerrar inspector	Alterna el panel lateral del Inspector
Abrir/Cerrar panel de subida	Alterna el área de carga de archivos
Validar seleccionadas	Aplica estado válido en lote
Invalidar seleccionadas	Aplica estado inválido en lote
Regex Toolkit	Abre el panel de limpieza con expresiones regulares
Micro-Agentes	Abre el diálogo de mejora con IA
Exportar seleccionadas (JSONL)	Descarga las conversaciones seleccionadas

Atajos de teclado

Abre el Command PaletteCmd + K

Abre el Inspector de ConversacionesClic en fila

Selecciona/deselecciona la conversaciónCheckbox

Selecciona/deselecciona todas las conversaciones visiblesCheckbox cabecera

Cmd+K (macOS) o Ctrl+K (Windows/Linux) abre el Command Palette en cualquier momento dentro de la vista de conversaciones. Es la forma más rápida de ejecutar acciones en lote cuando ya tienes conversaciones seleccionadas.

Buenas prácticas

Valida antes de entrenar

Revisa manualmente al menos el 10–20% de tus conversaciones antes de usarlas para entrenamiento. Los errores en el dataset se trasladan directamente al comportamiento del modelo.

Usa el Scorer antes de validar manualmente

Ejecuta el Micro-Agente Scorer sobre todo el dataset primero. Filtra por score < 0.5 para identificar conversaciones problemáticas y revisarlas con prioridad.

Anonimiza datos sensibles

Si tus conversaciones contienen datos de clientes (emails, teléfonos, nombres), usa el Regex Toolkit con los patrones de PII antes de entrenar o exportar.

Mantén el system prompt consistente

Todas las conversaciones de un mismo dataset deberían usar el mismo system prompt. Las inconsistencias confunden al modelo durante el entrenamiento.

Exporta respaldos periódicamente

Usa la función de exportar en lote (JSONL) para guardar copias de respaldo de tus conversaciones antes de aplicar operaciones destructivas como regex o eliminación masiva.

Itera en lotes pequeños

Al usar Micro-Agentes, prueba primero con 10–20 conversaciones para verificar que el agente hace lo que esperas antes de ejecutarlo en cientos de conversaciones.

Flujo recomendado para preparar un dataset

Subir JSONLScorer AutomáticoRegex PIIRevisión manualGuardar como Dataset

Crear Datasets Sintetizar Datos