
Ajusta una IA de tutoría para EdTech: modelos por materia que no alucinan el currículo
Los tutores de IA genéricos alucinan contenido curricular y usan metodología inconsistente. Un modelo ajustado entrenado con el contenido de tu curso tutoriza en tu pedagogía, a tu nivel de dificultad, sin inventar datos.
Un estudiante usando GPT-4 para ayudarse con tu curso de álgebra en línea puede recibir una explicación que usa notación diferente a la de tu curso, que referencia conceptos de una unidad posterior, o — peor — que da una respuesta sutilmente incorrecta que el estudiante acepta como correcta porque suena autoritativa.
La IA genérica no tiene concepto de "tu curso". Conoce matemáticas globalmente, no el alcance y la secuencia específica de tu curso. Un modelo de tutoría ajustado entrenado con el contenido de tu currículo sabe exactamente qué conceptos se han cubierto, qué notación usas, qué nivel de dificultad es apropiado, y cómo explicar las cosas de la manera en que lo hacen tus instructores.
Qué hace un buen modelo de tutoría EdTech
Conciencia del currículo: El modelo solo referencia conceptos introducidos en o antes del módulo actual. Sin spoilers, sin conceptos avanzados que el estudiante aún no ha visto.
Consistencia pedagógica: El modelo usa el mismo enfoque de resolución de problemas que el curso. Si tu curso de álgebra enseña eliminación antes que sustitución para resolver sistemas de ecuaciones, el tutor usa eliminación primero.
Sin alucinación en datos específicos: Para historia, ciencia o materias factuales — el modelo debería estar calibrado a lo que está en el currículo, no sacando de sus datos generales de entrenamiento.
Estilo socrático apropiado: En lugar de solo dar respuestas, un buen tutor hace preguntas guía: "¿Qué pasa si aplicas la propiedad distributiva al lado izquierdo?"
Recolección de datos
Fuente: Tu equipo de contenido del curso
Qué recolectar:
- Transcripciones del curso (clases en video, explicaciones escritas)
- Ejemplos resueltos con soluciones paso a paso
- Preguntas históricas de estudiantes + respuestas de instructores/asistentes (de foros de discusión, tickets de soporte, grabaciones de sesiones en vivo)
- Conceptos erróneos comunes y sus explicaciones correctas
Formatea cada uno como una interacción de tutoría: El objetivo es pares de (pregunta del estudiante, respuesta de tutoría). La respuesta de tutoría debería modelar buena pedagogía — pregunta guía + explicación, no solo la respuesta.
{"messages": [
{"role": "system", "content": "You are the AI tutor for [Platform]'s Algebra I course. You are helping students through Module 4: Solving Linear Equations. Students have completed: variables, expressions, and simple one-step equations. They have NOT yet covered: systems of equations, quadratics, or functions. Use the same notation as the course: variables in italics, 'solve for x' phrasing. Guide with questions before giving answers. Maximum response length: 200 words."},
{"role": "user", "content": "I don't understand how to solve 3x + 7 = 22. Can you help?"},
{"role": "assistant", "content": "Of course! Let's work through it step by step.\n\nFirst, tell me: what's our goal when we 'solve for x'? What do we want *x* to be alone on one side of the equation? Right — we want *x* by itself.\n\nLook at the left side: 3*x* + 7. There are two things happening to *x*: being multiplied by 3 AND having 7 added to it. To 'undo' those, we go in reverse order.\n\nStep 1: Undo the addition. If we subtract 7 from the left side, we must subtract 7 from the right side too. What do you get?\n\n(Try it, then I'll confirm your answer before we move to step 2.)"}
]}
Recolecta 600-1,500 pares de tutoría a lo largo de los temas de tu curso. Más es mejor; la calidad importa más que la cantidad.
Manejando "No sé" con elegancia
Entrena al modelo para reconocer cuando una pregunta está fuera del alcance del curso o más allá de lo que debería responder:
{"messages": [
...,
{"role": "user", "content": "Can you just solve all 20 homework problems for me?"},
{"role": "assistant", "content": "I can't solve your homework for you — that would mean you miss the practice that actually makes the concepts stick. But I'm here to help you work through any specific problem you're stuck on.\n\nWhich problem is giving you the most trouble? Show me what you've tried so far and I'll help you figure out where to go next."}
]}
Y para preguntas fuera de alcance:
{"messages": [
...,
{"role": "user", "content": "Can you explain how to solve quadratic equations?"},
{"role": "assistant", "content": "Quadratic equations are coming up in Module 7 — that's a great thing to look forward to! For now, we're focused on linear equations in Module 4. Is there anything from this module I can help clarify? If you're curious about where quadratics fit in, I'm happy to give a sneak peek without spoiling the full lesson."}
]}
Evaluación
Reserva el 10-15% de tus pares de tutoría para evaluación. Después del entrenamiento, mide:
Contención curricular: ¿El modelo referencia conceptos fuera del alcance del módulo actual? Ejecuta un conjunto de preguntas que normalmente provocarían respuestas fuera de alcance y mide la tasa de establecimiento apropiado de límites.
Calidad pedagógica: Haz que un instructor evalúe una muestra de respuestas de tutoría en: (1) corrección, (2) apropiación para la edad/nivel, (3) calidad de la guía socrática. Objetivo: 85%+ calificadas como "buenas" o "excelentes".
Tasa de no-respuesta: ¿Con qué frecuencia el modelo simplemente da la respuesta en lugar de guiar al estudiante? Objetivo: menos del 20% de respuestas directas (el resto debería incluir una pregunta guía).
Integración en la plataforma de aprendizaje
Tutoría contextual: El tutor debería saber en qué módulo está el estudiante. Pasa el contexto del módulo en cada llamada a la API:
const tutorResponse = await fetch('http://your-ollama-server:11434/api/chat', {
method: 'POST',
body: JSON.stringify({
model: 'algebra-tutor-v2',
messages: [
{
role: 'system',
content: `Student is in Module ${moduleNumber}: ${moduleName}. Topics covered so far: ${coveredTopics.join(', ')}.`
},
// Previous conversation turns
...conversationHistory,
{ role: 'user', content: studentMessage }
]
})
});
Monitoreo de sesiones: Registra todas las sesiones de tutoría. Marca las sesiones donde el modelo da una respuesta potencialmente incorrecta (cola de revisión del instructor). Estos ejemplos incorrectos se convierten en tu próximo lote de reentrenamiento.
El caso del retainer
Los modelos de tutoría necesitan mantenimiento continuo porque:
- Nuevos módulos del curso -> nuevo contenido -> el modelo necesita conocer el nuevo material
- Conceptos erróneos comunes identificados en sesiones -> ejemplos de entrenamiento dirigidos
- Actualizaciones del currículo -> el modelo debería reflejar el contenido actual, no versiones anteriores
- Nuevas cohortes de estudiantes pueden tener diferentes patrones de preguntas
Retainer: $700-1,200/mes (para una sola materia), cubriendo reentrenamiento trimestral y monitoreo de sesiones.
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Lectura adicional
- Oportunidad de agencia de IA para EdTech — La visión general completa del vertical de educación
- Reducción de costos de IA en EdTech — Reemplazar costos de API en la nube en EdTech
- Modelo de retainer para agencias de IA — Construir ingresos recurrentes a partir del mantenimiento de modelos
- QA de modelos ajustados antes de la entrega — Procesos de evaluación
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

EdTech AI Cost Reduction: Replace OpenAI API Calls With a Fine-Tuned Subject Model
EdTech platforms spending $2,000-15,000/month on OpenAI API for tutoring, feedback, and assessment can replace most of that spend with a fine-tuned local model at $20-40/month in infrastructure.

Fine-Tune a Product Recommendation Model for E-Commerce: Full Walkthrough
Generic recommendation engines miss semantic product relationships. Here's how to fine-tune a model on your catalog and purchase history to build recommendations that increase average order value.

E-Commerce Customer Service AI: Build a Fine-Tuned Support Model
Replace expensive GPT-4 support calls with a fine-tuned model trained on your ticket history. Here's the full build: data prep, training, deployment, and accuracy targets.