
Cómo Poner Precio a las Funciones de IA en Tu SaaS: Basado en Uso vs. Incluido en el Plan
Cuatro modelos de precios para funciones de IA en SaaS, la matemática de márgenes detrás de cada uno, y por qué la mayoría de equipos elige el incorrecto. Incluye ejemplos reales de Notion, Linear e Intercom.
Construiste una función de IA. A los usuarios les encanta. Ahora necesitas ponerle precio. Esta decisión determinará si tu función de IA es un motor de crecimiento o un destructor de márgenes, y la mayoría de equipos SaaS se equivocan en el primer intento.
La tensión central: las funciones de IA tienen costos variables que escalan con el uso, pero los clientes SaaS esperan precios predecibles. Cada modelo de precios que elijas es una apuesta sobre cómo resuelves esa tensión.
Los Cuatro Modelos de Precios
Hay exactamente cuatro formas de empaquetar funciones de IA en un producto SaaS. Cada una tiene diferentes perfiles de margen, diferentes expectativas del cliente y diferentes modos de falla.
Modelo 1: Incluido en el Plan (Empaquetado)
La función de IA se incluye como parte de tus planes de precios existentes. Sin partida separada. Sin límites de uso (o muy generosos).
Quién lo hace: Notion AI fue inicialmente un complemento separado a $10/usuario/mes, luego lo empaquetaron en todos los planes pagos. Linear incluye funciones de IA en cada plan.
Economía:
| Métrica | Valor |
|---|---|
| Percepción del cliente | Alto valor, posicionamiento "AI-native" |
| Incremento de ingresos | Indirecto — justifica aumentos de precio |
| Riesgo de margen | Alto — usuarios intensivos destruyen la economía unitaria |
| Impacto en churn | Bajo — la función está integrada en el flujo de trabajo principal |
Cuándo funciona: Cuando el uso de IA por usuario es predecible y limitado. Si tu función de IA genera 50-200 tokens por interacción y el usuario promedio la activa 5-10 veces al día, puedes modelar el costo de forma confiable.
Cuándo falla: Cuando los usuarios intensivos consumen 50x la mediana. Un cliente con 500 usuarios generando 2,000 solicitudes de IA por usuario por día consumirá todo tu margen en esa cuenta.
La matemática: A precios de GPT-4o (~$2.50/1M tokens de entrada, $10/1M tokens de salida), una función de IA empaquetada típica cuesta:
- Usuario mediano: 150 solicitudes/mes x 800 tokens = 120K tokens = ~$0.42/mes
- Usuario intensivo: 2,000 solicitudes/mes x 1,200 tokens = 2.4M tokens = ~$8.40/mes
- Si tu plan es $20/usuario/mes, el usuario mediano te cuesta 2.1% de los ingresos. El usuario intensivo cuesta 42%.
Modelo 2: Complemento Basado en Uso
Los clientes pagan por interacción de IA, por crédito o por token. A menudo vendido como "créditos de IA" que se mapean a alguna unidad de trabajo.
Quién lo hace: Intercom cobra por separado por su agente de IA (Fin) por resolución. Jasper usa un sistema de créditos vinculado a la salida de palabras.
Economía:
| Métrica | Valor |
|---|---|
| Percepción del cliente | Justo pero crea fricción |
| Incremento de ingresos | Directo — escala con la adopción |
| Riesgo de margen | Bajo — costo e ingresos escalan juntos |
| Impacto en churn | Medio — la ansiedad de uso reduce la adopción |
Cuándo funciona: Cuando la función de IA entrega valor claro y medible por interacción. Si tu IA resuelve un ticket de soporte (ahorrando $5-15 en tiempo de agente), cobrar $0.99 por resolución es fácil de justificar.
Cuándo falla: Cuando el uso es exploratorio o habitual. Cobrar por consulta de búsqueda con IA hace que los usuarios duden antes de buscar. Cobrar por sugerencia de IA hace que los usuarios ignoren las sugerencias. Entrenas a los clientes a evitar la función que construiste.
El impuesto de fricción: Intercom reportó que la tasa de resolución de Fin es 50% más alta en cuentas con planes ilimitados vs. facturación por resolución. Los precios basados en uso suprimen el comportamiento que quieres fomentar.
Modelo 3: Plan de IA Separado
Un plan de precios dedicado que desbloquea funciones de IA. A menudo llamado "Plus", "Pro AI" o "Enterprise AI".
Quién lo hace: GitHub Copilot es una suscripción separada de $10-19/mes. Grammarly tiene un plan "Premium" distinto con funciones de IA.
Economía:
| Métrica | Valor |
|---|---|
| Percepción del cliente | Propuesta de valor clara, fácil de evaluar |
| Incremento de ingresos | Alto — nuevo flujo de ingresos con empaquetado claro |
| Riesgo de margen | Medio — depende del precio del plan vs. uso real |
| Impacto en churn | Medio — fácil hacer downgrade si el valor no es claro |
Cuándo funciona: Cuando la IA es una capacidad distinta que algunos usuarios necesitan y otros no. Herramientas de desarrollo, asistentes de escritura y plataformas de analítica donde la IA es un "modo" más que una función.
Cuándo falla: Cuando la función de IA es integral a la experiencia principal del producto. Si tu producto se siente incompleto sin IA, ponerla detrás de un plan crea una peor experiencia gratuita en lugar de un camino de actualización atractivo.
Modelo 4: Freemium con Actualización de IA
Los usuarios gratuitos obtienen acceso limitado a IA (5-20 interacciones por mes). Los usuarios de pago obtienen más o acceso ilimitado.
Quién lo hace: ChatGPT usa este modelo. Canva ofrece generación limitada de imágenes con IA en planes gratuitos.
Economía:
| Métrica | Valor |
|---|---|
| Percepción del cliente | Baja barrera, activador natural de actualización |
| Incremento de ingresos | Fuerte impulsor de conversión si los límites son correctos |
| Riesgo de margen | Bajo — los costos del plan gratuito están limitados |
| Impacto en churn | Bajo — la IA se convierte en el gancho de actualización |
Cuándo funciona: Cuando la IA es la razón principal por la que los usuarios se actualizan. El límite gratuito debe ser lo suficientemente alto para demostrar valor pero lo suficientemente bajo para crear fricción real en el tope.
Cuándo falla: Cuando los usuarios gratuitos consumen recursos significativos de IA sin convertir. Si tu tasa de conversión de gratuito-con-IA a pago está por debajo del 3-5%, estás subsidiando uso que nunca se monetiza.
El Problema de Margen del Que Nadie Habla
Los cuatro modelos comparten el mismo problema subyacente: si estás llamando a una API de IA externa, el margen de tu función de IA está estructuralmente limitado.
Aquí está la matemática que la mayoría de fundadores SaaS no calculan:
Economía unitaria típica de SaaS:
- Ingreso por usuario: $25/mes
- COGS sin IA: $3/mes (hosting, ancho de banda, soporte)
- Margen bruto antes de IA: 88%
Después de agregar funciones de IA basadas en API:
- Costo promedio de IA por usuario: $2-8/mes (dependiendo del uso)
- Nuevo margen bruto: 68-80%
Eso es una compresión de margen de 8-20 puntos porcentuales. Para una empresa con $5M ARR, eso es $400K-$1M en erosión de margen anual. Para una empresa levantando Serie B, esa compresión de margen impacta directamente tu múltiplo de valoración.
El problema se compone a escala:
| Usuarios | Costo Mensual de API de IA | Impacto Anual en Margen |
|---|---|---|
| 1,000 | $4,000 | $48,000 |
| 10,000 | $40,000 | $480,000 |
| 50,000 | $200,000 | $2,400,000 |
| 100,000 | $400,000 | $4,800,000 |
Los ingresos escalan con usuarios. Los costos de API de IA también escalan con usuarios. Tu porcentaje de margen se queda comprimido para siempre.
Cómo el Fine-Tuning Invierte la Ecuación de Margen
Ajustar un modelo más pequeño (3B-7B parámetros) y ejecutarlo localmente o en infraestructura dedicada cambia la estructura de costos de variable a fija.
Modelo API: Costo = (tokens consumidos) x (precio por token). Escalado lineal. Sin techo.
Modelo ajustado: Costo = (costo del servidor) + (costo único de entrenamiento). Costo mensual fijo sin importar el uso.
Los números de cruce:
| Consultas Mensuales de IA | Costo API (GPT-4o) | Fine-Tuned 7B (auto-alojado) | Ahorro |
|---|---|---|---|
| 10,000 | $80 | $45 | 44% |
| 50,000 | $400 | $45 | 89% |
| 200,000 | $1,600 | $95 | 94% |
| 1,000,000 | $8,000 | $190 | 98% |
A 50,000 consultas/mes, aproximadamente 5,000 usuarios activos con uso moderado, el modelo ajustado cuesta 89% menos. A 1M consultas, cuesta 98% menos.
Esto no es marginal. Es la diferencia entre un SaaS con 68% de margen bruto y uno con 92% de margen bruto.
El Árbol de Decisión de Precios
Usa este framework para elegir tu modelo de precios:
Paso 1: El uso de IA es predecible por usuario?
- Sí (interacciones limitadas, patrones consistentes) -> Considera empaquetar (Modelo 1)
- No (altamente variable, existen usuarios intensivos) -> Continúa al Paso 2
Paso 2: Cada interacción de IA tiene ROI claro y medible?
- Sí (resuelve ticket, genera documento, completa análisis) -> Basado en uso (Modelo 2)
- No (sugerencias, búsqueda, asistencia) -> Continúa al Paso 3
Paso 3: La IA es una capacidad distinta o integrada en la UX principal?
- Distinta (modo separado, flujo de trabajo opcional) -> Plan separado (Modelo 3)
- Integrada (incorporada en cada interacción) -> Freemium con límites (Modelo 4)
Paso 4: Independientemente del modelo elegido, cuál es tu estructura de costos?
- Menos de 10,000 consultas mensuales de IA -> La API está bien, el modelo de precios es más importante que la infraestructura
- 10,000-100,000 consultas -> Ejecuta el análisis de cruce. El fine-tuning probablemente ahorra 50-90%
- Más de 100,000 consultas -> El fine-tuning es casi seguramente la elección correcta de infraestructura
Qué Hicieron Realmente Notion, Linear e Intercom
Notion empezó con IA como complemento de $10/usuario/mes. La adopción fue moderada. Luego lo empaquetaron en todos los planes pagos y subieron los precios base $2-3/usuario. Resultado: mayor adopción, mejor retención y un impacto en ingresos aproximadamente neutral por usuario, pero un posicionamiento significativamente mejor como workspace "AI-native".
La lección: empaquetar funciona cuando la IA aumenta la adherencia del producto principal lo suficiente para compensar el costo.
Linear incluyó funciones de IA desde el día uno sin un precio separado. Sus funciones de IA (resumen de issues, asistencia de escritura, sugerencias de triaje) son ligeras: cada interacción consume 200-500 tokens. A su punto de precio ($8-10/usuario/mes), el costo de IA por usuario es aproximadamente $0.30-0.80/mes. Manejable.
La lección: si tus funciones de IA son ligeras y limitadas, los costos de empaquetado son triviales.
Intercom cobra por resolución de IA para Fin, su agente de soporte con IA. Cada resolución reemplaza una interacción de agente humano que vale $5-15. Cobrar $0.99 por resolución entrega un ROI claro al cliente mientras mantiene márgenes saludables.
La lección: los precios basados en uso funcionan cuando cada interacción tiene un valor obvio y cuantificable que excede el precio.
La Variable Oculta: Infraestructura de Costos
Tu modelo de precios y tu infraestructura de costos son dos decisiones separadas, pero interactúan:
- API + precios empaquetados = riesgo de margen. Absorbes costos variables a un precio fijo.
- API + precios basados en uso = margen seguro, riesgo de adopción. Ingresos y costos escalan juntos, pero la fricción reduce el uso.
- Fine-tuned + precios empaquetados = el estado ideal. Costos fijos, precios fijos, máxima adopción, márgenes predecibles.
- Fine-tuned + precios basados en uso = escalado de ganancia pura. Costos fijos, los ingresos crecen con el uso.
Las empresas que ganan a largo plazo son las que desacoplan su modelo de precios de su estructura de costos. Puedes cobrar como quieras, por puesto, por uso, por plan, siempre que tu costo subyacente sea fijo y predecible.
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
El Playbook: Lanza, Aprende, Optimiza
Aquí está la secuencia que funciona:
- Mes 1-3: Lanza funciones de IA usando una API. Ponles el precio que genere adopción más rápido (generalmente empaquetado o freemium). No optimices costos todavía. Aprende cómo los usuarios realmente usan la función.
- Mes 3-6: Mide los patrones de uso reales. Calcula tu COGS de IA por usuario. Identifica si tienes un problema de usuarios intensivos.
- Mes 6-12: Si los costos de IA superan el 10% del ingreso por usuario, comienza la migración a modelos ajustados. Ajusta los precios basándote en datos de uso reales, no en suposiciones.
- Mes 12+: Modelos ajustados ejecutándose, costos fijos, modelo de precios validado por datos. Ahora puedes ser agresivo: ofrece IA ilimitada, empaquétala en todos lados, úsala como ventaja competitiva.
Las empresas SaaS que tratan los precios de IA como una decisión única se equivocarán. Las que los tratan como un ciclo de optimización basado en datos, empezar con APIs, medir, migrar a fine-tuned, ajustar precios, construirán ventajas de margen duraderas.
Lecturas Adicionales
- Building AI Features in Your SaaS: When to Stop Calling the OpenAI API — el análisis completo de costos para funciones de IA basadas en API a escala
- The Hidden Cost of Per-Token AI Pricing — por qué los precios por token son más caros de lo que parecen
- Shipping AI Features in Your SaaS Without an ML Team — cómo los equipos de producto pueden ser dueños de las funciones de IA de punta a punta
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

AI Feature Pricing That Actually Works: Subscription, Usage, or Hybrid?
45-50% of AI SaaS will use hybrid pricing by 2028. Here's how to price AI features — subscription, usage-based, or hybrid — so your margins survive as users scale.

Building a Recurring Revenue AI Service with Fine-Tuned Models
How to structure an AI agency offering around fine-tuned models that generates predictable monthly recurring revenue — covering service tiers, pricing models, and the retraining loop.

Pricing Data Preparation Services for Enterprise Fine-Tuning Projects
Pricing models, cost drivers, and sample structures for ML service providers delivering on-premise data preparation to enterprise fine-tuning clients.