
Ajusta Una Vez, Cobra Mensualmente: El Modelo de Servicio Productizado de IA
Cómo convertir un compromiso único de fine-tuning en un flujo de ingresos recurrentes mensuales. El modelo de servicio, los precios y la conversación con el cliente que lo hacen funcionar.
El error más común que cometen los consultores de IA y dueños de agencias es tratar el fine-tuning como un proyecto. Un proyecto tiene una fecha de inicio, una fecha de fin, un entregable y una factura final. El cliente está contento, cobras el cheque y ambos siguen adelante.
Esto es dejar dinero sobre la mesa, y también es dejar al cliente con un modelo que se degrada con el tiempo a medida que su negocio cambia.
El fine-tuning no es un proyecto. Es una capacidad que requiere mantenimiento, mejora y gobernanza. Las agencias que entienden esto han reemplazado los ingresos por proyecto con ingresos de suscripción recurrente, a menudo a 4-6x la tarifa horaria efectiva de su trabajo por proyecto.
Por Qué los Modelos Requieren Cuidado Continuo
Un modelo ajustado captura el estado del negocio de un cliente al momento del entrenamiento. Si entrenas con tickets de soporte del Q4 2025, el modelo refleja el lenguaje, productos, políticas y preocupaciones de clientes del Q4 2025. Para el Q4 2026, varias cosas habrán cambiado:
- Actualizaciones del catálogo de productos que el modelo no conoce
- Cambios de políticas sobre los que el modelo dará respuestas incorrectas
- Nuevos casos extremos que no estaban en los datos de entrenamiento
- Deriva de calidad a medida que la distribución de entradas de la tarea cambia
Un modelo sin mantenimiento se convierte en una responsabilidad dentro de 6-12 meses de entrenamiento para la mayoría de casos de uso empresariales. Esto no es un defecto, es la naturaleza de cualquier sistema que captura una instantánea de un negocio cambiante. También es el argumento de negocio natural para un retainer mensual.
El Servicio Productizado de Fine-Tuning
Aquí está la estructura de servicio que convierte trabajo por proyecto en ingresos recurrentes:
Nivel 1: La Construcción (Único)
Este es el compromiso inicial: recolección y limpieza de datos, fine-tuning, evaluación y despliegue. Con precio de proyecto, típicamente AU$3,000-12,000 dependiendo de la complejidad de datos y requisitos de despliegue.
Entregables:
- Dataset de entrenamiento limpio (el cliente es dueño de esto)
- Modelo ajustado desplegado en Ollama o plataforma de inferencia elegida
- Informe de evaluación con benchmarks de precisión
- Documentación de API
- Período de soporte de 30 días
Este es el compromiso que genera la confianza y la base técnica para todo lo que sigue.
Nivel 2: Mantenimiento del Modelo (Retainer Mensual)
Después del período de soporte de 30 días, el cliente pasa a un retainer mensual. El retainer cubre:
- Revisión mensual de la calidad de salida del modelo (muestreando 50-100 consultas de producción)
- Señalización de deriva de calidad o brechas de cobertura
- Actualizaciones menores de prompt/prompt de sistema
- Monitoreo de infraestructura (asegurando que el servidor de inferencia esté corriendo)
- Soporte prioritario para problemas de producción
Precio: AU$300-800/mes dependiendo de complejidad y volumen.
Este nivel es ingreso recurrente puro. La mayoría de meses, la inversión de tiempo es 1-2 horas: una sesión de revisión mensual y cualquier ajuste pequeño. El valor para el cliente es tranquilidad y un punto de responsabilidad para su sistema de IA en producción.
Nivel 3: Ciclos de Reentrenamiento (Episódico)
Cada 3-6 meses (o activado por eventos específicos como un lanzamiento de producto importante, cambio de políticas o degradación de calidad observada), el modelo necesita reentrenamiento con datos nuevos.
Entregables:
- Recolección y limpieza de nuevos datos de entrenamiento (nuevos tickets de soporte, documentos actualizados, etc.)
- Ejecución de reentrenamiento incorporando datos viejos + nuevos
- Evaluación comparando el nuevo modelo con el modelo anterior
- Despliegue del modelo actualizado
- Documentación actualizada
Precio: AU$1,500-5,000 por ciclo de reentrenamiento dependiendo del volumen y complejidad de datos.
Este es el evento de ingresos que se repite. Un cliente con un modelo que funciona bien activará reentrenamiento en un cronograma predecible. No les estás re-vendiendo; estás entregando el servicio continuo que necesitan para mantener el modelo actualizado.
La Matemática de Ingresos Anuales
Enfoque de proyecto único:
- Construcción inicial: AU$6,000
- Ingresos anuales de un cliente: AU$6,000
Enfoque productizado:
- Construcción inicial: AU$6,000
- Retainer mensual 12 meses: AU$6,000 (AU$500/mes)
- 2 ciclos de reentrenamiento: AU$6,000 (AU$3,000 cada uno)
- Ingresos anuales de un cliente: AU$18,000
Mismo cliente, mismo trabajo técnico, 3x los ingresos. Con 10 clientes, son AU$60,000 en ingresos recurrentes anuales solo por retainers, antes de cualquier trabajo de proyecto nuevo.
Cómo Tener la Conversación
La transición de "proyecto" a "servicio continuo" requiere una conversación específica. La mayoría de clientes no han pensado en el mantenimiento de modelos; necesitas introducir el concepto.
El marco que funciona: "El modelo que construimos juntos será excelente el día uno. Pero los modelos de IA son como un empleado talentoso: necesitan ser actualizados a medida que tu negocio cambia. Lo que realmente estamos construyendo es un sistema para mantener tu IA actualizada, y eso es una inversión continua, no un proyecto único."
Este marco:
- Establece expectativas realistas (el modelo es excelente pero necesita cuidado)
- Posiciona el mantenimiento como esperado y normal, no como señal de falla
- Crea la categoría de "mantenimiento de modelo de IA" en la mente del cliente
Los clientes más propensos a aceptar este marco son los que ya tienen experiencia con mantenimiento de software: suscripciones SaaS, servicios de TI gestionados, contadores y abogados con retainer. Entienden los modelos de servicio continuo. "Piensa en nosotros como el equipo de TI de tu sistema de IA" es un marco que aterriza bien con estos clientes.
Empaquetando el Retainer Mensual
El retainer mensual necesita sentirse como valor, no como "te estamos cobrando por no hacer nada la mayoría de los meses." Cómo estructurarlo:
Entrega un informe mensual. Incluso un PDF de una página con: estado de salud del modelo, métricas de calidad del mes, recomendación de próximo reentrenamiento (sí/no) y cualquier anomalía detectada. Esto hace el retainer tangible. Los clientes que reciben un informe mensual saben que están recibiendo algo; los clientes que no reciben nada silenciosamente consideran cancelar.
Incluye un número fijo de horas de "ajuste menor". 1-2 horas por mes para cosas como actualizar el prompt de sistema, ajustar la personalidad del modelo o probar una nueva configuración. Esto les da a los clientes algo concreto que pueden solicitar cada mes.
Crea un proceso de escalamiento claro. Cuando la calidad baja significativamente, qué pasa? Quién es notificado? Cuál es el SLA? Tener esto definido, por escrito, en el acuerdo de servicio, hace que el retainer se sienta como soporte real, no solo un cargo recurrente.
Qué Requiere Esto de Ti
El modelo productizado solo funciona si tienes una infraestructura de entrega confiable y estable:
- El modelo necesita seguir ejecutándose mes tras mes (Ollama como servicio systemd, no un script que tienes que reiniciar manualmente)
- Necesitas herramientas para ejecutar verificaciones de calidad mensuales sin gastar 4 horas por cliente (inferencia por lotes + scoring automatizado contra tu conjunto de evaluación)
- Tu proceso de reentrenamiento necesita ser lo suficientemente rápido para que una tarifa de reentrenamiento de AU$2,000 sea rentable; si el reentrenamiento te toma 20 horas manualmente, la economía no funciona
Aquí es donde una plataforma de fine-tuning como Ertas crea apalancamiento. Un ciclo de reentrenamiento que tomaría un día de trabajo manual en Python toma una tarde con buenas herramientas. La diferencia entre un servicio productizado con márgenes del 20% y uno con márgenes del 60% es a menudo la eficiencia de la infraestructura de entrega.
Consiguiendo Tu Primer Cliente de Retainer
Empieza con un cliente al que ya le hayas entregado un proyecto exitoso. La solicitud es simple: "Construimos algo que funciona bien. Queremos asegurarnos de que siga funcionando bien. Ofrecemos un servicio de mantenimiento mensual por AU$X que cubre verificaciones de salud trimestrales y un ciclo de reentrenamiento anual. Te gustaría mantenerlo funcionando bien?"
Si el cliente encontró valiosa la construcción inicial, y te dirán si fue así, la conversación del retainer es un sí fácil. Ya confían en ti, ya tienen el modelo en producción y entienden el valor.
Los clientes que dicen no al retainer generalmente dicen no porque aún no han visto al modelo fallar o degradarse. Dales 6 meses y haz seguimiento.
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Lecturas Adicionales
- AI Agency Differentiation in 2026: Stop Reselling, Start Owning — Por qué los modelos propietarios son la ventaja competitiva duradera
- How to Price Fine-Tuning Services Profitably (Agency Rate Card) — Tarifa de precios específica y metodología de fijación de precios
- The Freelance AI Consultant's Stack in 2026 — Kit de herramientas completo para ejecutar una práctica de IA en solitario
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Building a Recurring Revenue AI Service with Fine-Tuned Models
How to structure an AI agency offering around fine-tuned models that generates predictable monthly recurring revenue — covering service tiers, pricing models, and the retraining loop.

Build Recurring Revenue: The AI Agency Model Maintenance Retainer
Fine-tuned models create a natural retainer structure. Here's how to build $500-2,000/month per client retainers around model maintenance, with the pitch, the pricing, and the infrastructure.

How to QA a Fine-Tuned Model Before Client Delivery
A complete QA process for testing fine-tuned models before delivering them to clients — covering functional testing, edge cases, regression checks, and client acceptance criteria.