Back to blog
    IA de Servicio al Cliente para E-Commerce: Construye un Modelo de Soporte Ajustado
    ecommercecustomer-servicefine-tuningsupportautomationsegment:agency

    IA de Servicio al Cliente para E-Commerce: Construye un Modelo de Soporte Ajustado

    Reemplaza costosas llamadas de soporte con GPT-4 por un modelo ajustado entrenado con tu historial de tickets. Aquí está la construcción completa: preparación de datos, entrenamiento, despliegue y objetivos de precisión.

    EErtas Team·

    Una marca de e-commerce que maneja 8,000 tickets de soporte por mes con GPT-4 gasta aproximadamente $3,000-5,000/mes en costos de API. Un modelo ajustado entrenado con su historial de tickets cuesta $20/mes en infraestructura y maneja el mismo volumen con mejor precisión en preguntas específicas de la marca.

    Este es el caso de ROI más directo en el trabajo de agencias de IA. Aquí está cómo construirlo.

    Por Qué la IA Genérica Tiene Bajo Rendimiento en Soporte de E-Commerce

    La IA genérica maneja bien las preguntas comunes. Pero el soporte de e-commerce es principalmente específico de la marca:

    • "¿Cuál es su política de devolución para artículos en oferta?"
    • "Mi pedido #84521 dice entregado pero nunca lo recibí — ¿qué hago?"
    • "¿Hacen envíos a Puerto Rico?"
    • "¿La versión azul del producto X está de nuevo en stock?"

    Estas preguntas requieren conocimiento de las políticas, catálogo y procedimientos específicos de esta marca. La IA genérica o alucina (inventa una política de devolución) o evade (dice "por favor contacte a servicio al cliente" en vez de responder). Un modelo ajustado con las resoluciones reales de soporte de la marca responde correctamente desde su entrenamiento.

    Qué Necesitas Construir

    Tu entregable: Un modelo que toma un ticket de soporte (mensaje del cliente) como entrada y devuelve la resolución correcta o borrador de respuesta — manejando con precisión las políticas, productos y procedimientos de la marca.

    Objetivo de calidad: ≥85% de resoluciones completamente correctas en el conjunto de prueba reservado. El 15% restante debería ser escalado o parcialmente redactado, no incorrecto.

    Paso 1: Extraer y Limpiar Datos de Entrenamiento

    Fuente: Tu sistema de tickets (Zendesk, Gorgias, Freshdesk, Intercom). Exporta todos los tickets resueltos de los últimos 12-18 meses.

    Qué necesitas por ticket:

    • Mensaje del cliente (la entrada)
    • Resolución o respuesta (la salida correcta)
    • Estado de resolución (resuelto, escalado, requiere humano)

    Filtra el dataset:

    • Incluir: tickets donde la IA podría manejar realistamente la resolución (preguntas de políticas, preguntas de estado de pedido, preguntas de producto, devoluciones, seguimiento)
    • Excluir: tickets que requieren juicio humano (disputas de fraude, excepciones a políticas, escalaciones emocionales que requieren manejo con alta empatía, tickets complejos con múltiples problemas)

    Típicamente el 60-70% de un archivo de tickets de soporte es manejable por IA con un modelo entrenado.

    Limpia las resoluciones:

    • Elimina firmas con nombre del agente
    • Elimina notas internas del equipo adjuntas a las resoluciones
    • Estandariza el lenguaje de políticas (elimina políticas desactualizadas de tickets antiguos)
    • Corrige cualquier error factual en resoluciones antiguas

    Tamaño objetivo del dataset: 1,000-3,000 pares limpios de (ticket, resolución).

    Paso 2: Construir el Dataset JSONL

    Cada ejemplo de entrenamiento es un par de conversación:

    {"messages": [{"role": "system", "content": "You are a customer support agent for [Brand], an e-commerce store selling outdoor gear. Answer customer questions accurately based on our current policies: Returns: 30 days for unworn items; Sale items: Final sale, no returns; Shipping: Free on orders $75+, typically 3-5 business days; Contact: support@brand.com for exceptions."}, {"role": "user", "content": "Hi, I ordered a jacket last week but it's too big. Can I return it?"}, {"role": "assistant", "content": "Hi! Absolutely — you have 30 days from purchase to return unworn items for a full refund or exchange. Just make sure the jacket still has its original tags and hasn't been worn outside. You can start your return at [brand.com/returns] and we'll email you a prepaid shipping label. Let me know if you have any other questions!"}]}
    

    Incluye tus políticas actuales en el mensaje de sistema. Esto es crítico — te permite actualizar políticas sin re-entrenar. El modelo sigue el mensaje de sistema; tu fine-tuning le enseña el tono, formato y patrones de manejo.

    Incluye ejemplos de escalación:

    {"messages": [..., {"role": "user", "content": "I've been waiting 3 weeks for my order and I'm really frustrated. This is unacceptable."}, {"role": "assistant", "content": "I'm really sorry about this — a 3-week wait is absolutely not acceptable, and I completely understand your frustration. Let me look into this right now. I'm escalating your case to our senior support team who will reach out within 2 hours with a resolution. Your satisfaction is our priority. — [Escalated to: Senior Support]"}]}
    

    El modelo aprende cuándo escalar vs resolver, lo cual es tan importante como saber las respuestas.

    Paso 3: Entrenar Con Ertas

    Sube tu archivo JSONL, valida y comienza el entrenamiento. Para un dataset de soporte al cliente de 1,500 ejemplos:

    • Modelo base: Llama 3 8B Instruct o Mistral 7B Instruct (ambos manejan bien el soporte conversacional)
    • Duración del entrenamiento: ~45-75 minutos
    • Los ajustes predeterminados de LoRA funcionan bien para tareas de soporte

    Paso 4: Evaluar

    Reserva 150-200 tickets antes del entrenamiento. Después del entrenamiento:

    Ejecuta el conjunto de evaluación a través del modelo. Califica cada respuesta:

    • Correcta (3): Respuesta precisa, tono apropiado, iguala o mejora la resolución humana
    • Parcial (2): La dirección es correcta pero falta un detalle específico o aclaración de política
    • Incorrecta (1): Factualmente incorrecta o claramente desacertada

    Objetivo: 80%+ en puntuación 3, menos del 5% en puntuación 1

    Presta especial atención a:

    • Precisión de políticas (¿el modelo indica la ventana de devolución correcta?)
    • Precisión de escalación (¿el modelo escala cuando debería?)
    • Tasa de alucinación (¿el modelo inventa números de pedido o disponibilidad de stock?)

    Si la tasa de alucinación es alta, agrega instrucciones más explícitas al mensaje de sistema y agrega ejemplos de entrenamiento que demuestren la respuesta correcta a información que el modelo no puede saber ("No tengo acceso al estado actual de tu pedido — por favor verifica en [URL de seguimiento] o comparte tu número de pedido para ayudarte").

    Paso 5: Desplegar y Enrutar

    Despliegue: Ollama en un VPS dedicado. Enruta los tickets de soporte entrantes al API del modelo antes de crear un ticket en Zendesk/Gorgias.

    Lógica de enrutamiento:

    1. Llega el ticket
    2. Enviar al modelo ajustado con texto del ticket
    3. El modelo devuelve: {response: "...", confidence: "high|medium|low", escalate: true|false}
    4. Si escalate: true o confidence: low: crear ticket de agente con borrador del modelo adjunto
    5. Si confidence: high y no es escalación: enviar respuesta automáticamente o encolar para aprobación del agente con un clic

    Comenzar con modo de aprobación con un clic (el agente ve la respuesta, hace clic en Enviar o edita) construye confianza antes de automatizar completamente. La mayoría de los clientes alcanzan 60-70% de automatización completa dentro de 3 meses.

    Mantenimiento Continuo

    Cada mes:

    1. Revisa las respuestas automatizadas que fueron editadas o rechazadas por agentes
    2. Las ediciones son tus nuevos datos de entrenamiento — te muestran dónde el modelo está equivocado
    3. Re-entrena trimestralmente (o mensualmente para clientes de alto volumen) con nuevos ejemplos agregados

    El modelo mejora continuamente mientras tengas este ciclo de retroalimentación. Esta es la justificación del retainer: cada mes de resoluciones registradas hace al modelo mejor.


    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Lectura Adicional

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading