Cómo Poner Precio a las Funciones de IA en Tu SaaS: Basado en Uso vs. Incluido en el Plan

Construiste una función de IA. A los usuarios les encanta. Ahora necesitas ponerle precio. Esta decisión determinará si tu función de IA es un motor de crecimiento o un destructor de márgenes, y la mayoría de equipos SaaS se equivocan en el primer intento.

La tensión central: las funciones de IA tienen costos variables que escalan con el uso, pero los clientes SaaS esperan precios predecibles. Cada modelo de precios que elijas es una apuesta sobre cómo resuelves esa tensión.

Los Cuatro Modelos de Precios

Hay exactamente cuatro formas de empaquetar funciones de IA en un producto SaaS. Cada una tiene diferentes perfiles de margen, diferentes expectativas del cliente y diferentes modos de falla.

Modelo 1: Incluido en el Plan (Empaquetado)

La función de IA se incluye como parte de tus planes de precios existentes. Sin partida separada. Sin límites de uso (o muy generosos).

Quién lo hace: Notion AI fue inicialmente un complemento separado a $10/usuario/mes, luego lo empaquetaron en todos los planes pagos. Linear incluye funciones de IA en cada plan.

Economía:

Métrica	Valor
Percepción del cliente	Alto valor, posicionamiento "AI-native"
Incremento de ingresos	Indirecto — justifica aumentos de precio
Riesgo de margen	Alto — usuarios intensivos destruyen la economía unitaria
Impacto en churn	Bajo — la función está integrada en el flujo de trabajo principal

Cuándo funciona: Cuando el uso de IA por usuario es predecible y limitado. Si tu función de IA genera 50-200 tokens por interacción y el usuario promedio la activa 5-10 veces al día, puedes modelar el costo de forma confiable.

Cuándo falla: Cuando los usuarios intensivos consumen 50x la mediana. Un cliente con 500 usuarios generando 2,000 solicitudes de IA por usuario por día consumirá todo tu margen en esa cuenta.

La matemática: A precios de GPT-4o (~$2.50/1M tokens de entrada, $10/1M tokens de salida), una función de IA empaquetada típica cuesta:

Usuario mediano: 150 solicitudes/mes x 800 tokens = 120K tokens = ~$0.42/mes
Usuario intensivo: 2,000 solicitudes/mes x 1,200 tokens = 2.4M tokens = ~$8.40/mes
Si tu plan es $20/usuario/mes, el usuario mediano te cuesta 2.1% de los ingresos. El usuario intensivo cuesta 42%.

Modelo 2: Complemento Basado en Uso

Los clientes pagan por interacción de IA, por crédito o por token. A menudo vendido como "créditos de IA" que se mapean a alguna unidad de trabajo.

Quién lo hace: Intercom cobra por separado por su agente de IA (Fin) por resolución. Jasper usa un sistema de créditos vinculado a la salida de palabras.

Economía:

Métrica	Valor
Percepción del cliente	Justo pero crea fricción
Incremento de ingresos	Directo — escala con la adopción
Riesgo de margen	Bajo — costo e ingresos escalan juntos
Impacto en churn	Medio — la ansiedad de uso reduce la adopción

Cuándo funciona: Cuando la función de IA entrega valor claro y medible por interacción. Si tu IA resuelve un ticket de soporte (ahorrando $5-15 en tiempo de agente), cobrar $0.99 por resolución es fácil de justificar.

Cuándo falla: Cuando el uso es exploratorio o habitual. Cobrar por consulta de búsqueda con IA hace que los usuarios duden antes de buscar. Cobrar por sugerencia de IA hace que los usuarios ignoren las sugerencias. Entrenas a los clientes a evitar la función que construiste.

El impuesto de fricción: Intercom reportó que la tasa de resolución de Fin es 50% más alta en cuentas con planes ilimitados vs. facturación por resolución. Los precios basados en uso suprimen el comportamiento que quieres fomentar.

Modelo 3: Plan de IA Separado

Un plan de precios dedicado que desbloquea funciones de IA. A menudo llamado "Plus", "Pro AI" o "Enterprise AI".

Quién lo hace: GitHub Copilot es una suscripción separada de $10-19/mes. Grammarly tiene un plan "Premium" distinto con funciones de IA.

Economía:

Métrica	Valor
Percepción del cliente	Propuesta de valor clara, fácil de evaluar
Incremento de ingresos	Alto — nuevo flujo de ingresos con empaquetado claro
Riesgo de margen	Medio — depende del precio del plan vs. uso real
Impacto en churn	Medio — fácil hacer downgrade si el valor no es claro

Cuándo funciona: Cuando la IA es una capacidad distinta que algunos usuarios necesitan y otros no. Herramientas de desarrollo, asistentes de escritura y plataformas de analítica donde la IA es un "modo" más que una función.

Cuándo falla: Cuando la función de IA es integral a la experiencia principal del producto. Si tu producto se siente incompleto sin IA, ponerla detrás de un plan crea una peor experiencia gratuita en lugar de un camino de actualización atractivo.

Modelo 4: Freemium con Actualización de IA

Los usuarios gratuitos obtienen acceso limitado a IA (5-20 interacciones por mes). Los usuarios de pago obtienen más o acceso ilimitado.

Quién lo hace: ChatGPT usa este modelo. Canva ofrece generación limitada de imágenes con IA en planes gratuitos.

Economía:

Métrica	Valor
Percepción del cliente	Baja barrera, activador natural de actualización
Incremento de ingresos	Fuerte impulsor de conversión si los límites son correctos
Riesgo de margen	Bajo — los costos del plan gratuito están limitados
Impacto en churn	Bajo — la IA se convierte en el gancho de actualización

Cuándo funciona: Cuando la IA es la razón principal por la que los usuarios se actualizan. El límite gratuito debe ser lo suficientemente alto para demostrar valor pero lo suficientemente bajo para crear fricción real en el tope.

Cuándo falla: Cuando los usuarios gratuitos consumen recursos significativos de IA sin convertir. Si tu tasa de conversión de gratuito-con-IA a pago está por debajo del 3-5%, estás subsidiando uso que nunca se monetiza.

El Problema de Margen del Que Nadie Habla

Los cuatro modelos comparten el mismo problema subyacente: si estás llamando a una API de IA externa, el margen de tu función de IA está estructuralmente limitado.

Aquí está la matemática que la mayoría de fundadores SaaS no calculan:

Economía unitaria típica de SaaS:

Ingreso por usuario: $25/mes
COGS sin IA: $3/mes (hosting, ancho de banda, soporte)
Margen bruto antes de IA: 88%

Después de agregar funciones de IA basadas en API:

Costo promedio de IA por usuario: $2-8/mes (dependiendo del uso)
Nuevo margen bruto: 68-80%

Eso es una compresión de margen de 8-20 puntos porcentuales. Para una empresa con $5M ARR, eso es $400K-$1M en erosión de margen anual. Para una empresa levantando Serie B, esa compresión de margen impacta directamente tu múltiplo de valoración.

El problema se compone a escala:

Usuarios	Costo Mensual de API de IA	Impacto Anual en Margen
1,000	$4,000	$48,000
10,000	$40,000	$480,000
50,000	$200,000	$2,400,000
100,000	$400,000	$4,800,000

Los ingresos escalan con usuarios. Los costos de API de IA también escalan con usuarios. Tu porcentaje de margen se queda comprimido para siempre.

Cómo el Fine-Tuning Invierte la Ecuación de Margen

Ajustar un modelo más pequeño (3B-7B parámetros) y ejecutarlo localmente o en infraestructura dedicada cambia la estructura de costos de variable a fija.

Modelo API: Costo = (tokens consumidos) x (precio por token). Escalado lineal. Sin techo.

Modelo ajustado: Costo = (costo del servidor) + (costo único de entrenamiento). Costo mensual fijo sin importar el uso.

Los números de cruce:

Consultas Mensuales de IA	Costo API (GPT-4o)	Fine-Tuned 7B (auto-alojado)	Ahorro
10,000	$80	$45	44%
50,000	$400	$45	89%
200,000	$1,600	$95	94%
1,000,000	$8,000	$190	98%

A 50,000 consultas/mes, aproximadamente 5,000 usuarios activos con uso moderado, el modelo ajustado cuesta 89% menos. A 1M consultas, cuesta 98% menos.

Esto no es marginal. Es la diferencia entre un SaaS con 68% de margen bruto y uno con 92% de margen bruto.

El Árbol de Decisión de Precios

Usa este framework para elegir tu modelo de precios:

Paso 1: El uso de IA es predecible por usuario?

Sí (interacciones limitadas, patrones consistentes) -> Considera empaquetar (Modelo 1)
No (altamente variable, existen usuarios intensivos) -> Continúa al Paso 2

Paso 2: Cada interacción de IA tiene ROI claro y medible?

Sí (resuelve ticket, genera documento, completa análisis) -> Basado en uso (Modelo 2)
No (sugerencias, búsqueda, asistencia) -> Continúa al Paso 3

Paso 3: La IA es una capacidad distinta o integrada en la UX principal?

Distinta (modo separado, flujo de trabajo opcional) -> Plan separado (Modelo 3)
Integrada (incorporada en cada interacción) -> Freemium con límites (Modelo 4)

Paso 4: Independientemente del modelo elegido, cuál es tu estructura de costos?

Menos de 10,000 consultas mensuales de IA -> La API está bien, el modelo de precios es más importante que la infraestructura
10,000-100,000 consultas -> Ejecuta el análisis de cruce. El fine-tuning probablemente ahorra 50-90%
Más de 100,000 consultas -> El fine-tuning es casi seguramente la elección correcta de infraestructura

Qué Hicieron Realmente Notion, Linear e Intercom

Notion empezó con IA como complemento de $10/usuario/mes. La adopción fue moderada. Luego lo empaquetaron en todos los planes pagos y subieron los precios base $2-3/usuario. Resultado: mayor adopción, mejor retención y un impacto en ingresos aproximadamente neutral por usuario, pero un posicionamiento significativamente mejor como workspace "AI-native".

La lección: empaquetar funciona cuando la IA aumenta la adherencia del producto principal lo suficiente para compensar el costo.

Linear incluyó funciones de IA desde el día uno sin un precio separado. Sus funciones de IA (resumen de issues, asistencia de escritura, sugerencias de triaje) son ligeras: cada interacción consume 200-500 tokens. A su punto de precio ($8-10/usuario/mes), el costo de IA por usuario es aproximadamente $0.30-0.80/mes. Manejable.

La lección: si tus funciones de IA son ligeras y limitadas, los costos de empaquetado son triviales.

Intercom cobra por resolución de IA para Fin, su agente de soporte con IA. Cada resolución reemplaza una interacción de agente humano que vale $5-15. Cobrar $0.99 por resolución entrega un ROI claro al cliente mientras mantiene márgenes saludables.

La lección: los precios basados en uso funcionan cuando cada interacción tiene un valor obvio y cuantificable que excede el precio.

La Variable Oculta: Infraestructura de Costos

Tu modelo de precios y tu infraestructura de costos son dos decisiones separadas, pero interactúan:

API + precios empaquetados = riesgo de margen. Absorbes costos variables a un precio fijo.
API + precios basados en uso = margen seguro, riesgo de adopción. Ingresos y costos escalan juntos, pero la fricción reduce el uso.
Fine-tuned + precios empaquetados = el estado ideal. Costos fijos, precios fijos, máxima adopción, márgenes predecibles.
Fine-tuned + precios basados en uso = escalado de ganancia pura. Costos fijos, los ingresos crecen con el uso.

Las empresas que ganan a largo plazo son las que desacoplan su modelo de precios de su estructura de costos. Puedes cobrar como quieras, por puesto, por uso, por plan, siempre que tu costo subyacente sea fijo y predecible.

El Playbook: Lanza, Aprende, Optimiza

Aquí está la secuencia que funciona:

Mes 1-3: Lanza funciones de IA usando una API. Ponles el precio que genere adopción más rápido (generalmente empaquetado o freemium). No optimices costos todavía. Aprende cómo los usuarios realmente usan la función.
Mes 3-6: Mide los patrones de uso reales. Calcula tu COGS de IA por usuario. Identifica si tienes un problema de usuarios intensivos.
Mes 6-12: Si los costos de IA superan el 10% del ingreso por usuario, comienza la migración a modelos ajustados. Ajusta los precios basándote en datos de uso reales, no en suposiciones.
Mes 12+: Modelos ajustados ejecutándose, costos fijos, modelo de precios validado por datos. Ahora puedes ser agresivo: ofrece IA ilimitada, empaquétala en todos lados, úsala como ventaja competitiva.

Las empresas SaaS que tratan los precios de IA como una decisión única se equivocarán. Las que los tratan como un ciclo de optimización basado en datos, empezar con APIs, medir, migrar a fine-tuned, ajustar precios, construirán ventajas de margen duraderas.

Lecturas Adicionales

Building AI Features in Your SaaS: When to Stop Calling the OpenAI API — el análisis completo de costos para funciones de IA basadas en API a escala
The Hidden Cost of Per-Token AI Pricing — por qué los precios por token son más caros de lo que parecen
Shipping AI Features in Your SaaS Without an ML Team — cómo los equipos de producto pueden ser dueños de las funciones de IA de punta a punta

Cómo Poner Precio a las Funciones de IA en Tu SaaS: Basado en Uso vs. Incluido en el Plan

Los Cuatro Modelos de Precios

Modelo 1: Incluido en el Plan (Empaquetado)

Modelo 2: Complemento Basado en Uso

Modelo 3: Plan de IA Separado

Modelo 4: Freemium con Actualización de IA

El Problema de Margen del Que Nadie Habla

Cómo el Fine-Tuning Invierte la Ecuación de Margen

El Árbol de Decisión de Precios

Qué Hicieron Realmente Notion, Linear e Intercom

La Variable Oculta: Infraestructura de Costos

El Playbook: Lanza, Aprende, Optimiza

Lecturas Adicionales

Ship AI that runs on your users' devices.

Keep reading

Precios de funciones de IA que realmente funcionan: ¿suscripción, uso o híbrido?

Cómo Poner Precio a Servicios de Preparación de Datos para Proyectos Empresariales de Fine-Tuning

La diferencia entre asistencia de IA y autonomía de IA en decisiones de alto riesgo