Ajusta una IA de tutoría para EdTech: modelos por materia que no alucinan el currículo

Un estudiante usando GPT-4 para ayudarse con tu curso de álgebra en línea puede recibir una explicación que usa notación diferente a la de tu curso, que referencia conceptos de una unidad posterior, o — peor — que da una respuesta sutilmente incorrecta que el estudiante acepta como correcta porque suena autoritativa.

La IA genérica no tiene concepto de "tu curso". Conoce matemáticas globalmente, no el alcance y la secuencia específica de tu curso. Un modelo de tutoría ajustado entrenado con el contenido de tu currículo sabe exactamente qué conceptos se han cubierto, qué notación usas, qué nivel de dificultad es apropiado, y cómo explicar las cosas de la manera en que lo hacen tus instructores.

Qué hace un buen modelo de tutoría EdTech

Conciencia del currículo: El modelo solo referencia conceptos introducidos en o antes del módulo actual. Sin spoilers, sin conceptos avanzados que el estudiante aún no ha visto.

Consistencia pedagógica: El modelo usa el mismo enfoque de resolución de problemas que el curso. Si tu curso de álgebra enseña eliminación antes que sustitución para resolver sistemas de ecuaciones, el tutor usa eliminación primero.

Sin alucinación en datos específicos: Para historia, ciencia o materias factuales — el modelo debería estar calibrado a lo que está en el currículo, no sacando de sus datos generales de entrenamiento.

Estilo socrático apropiado: En lugar de solo dar respuestas, un buen tutor hace preguntas guía: "¿Qué pasa si aplicas la propiedad distributiva al lado izquierdo?"

Recolección de datos

Fuente: Tu equipo de contenido del curso

Qué recolectar:

Transcripciones del curso (clases en video, explicaciones escritas)
Ejemplos resueltos con soluciones paso a paso
Preguntas históricas de estudiantes + respuestas de instructores/asistentes (de foros de discusión, tickets de soporte, grabaciones de sesiones en vivo)
Conceptos erróneos comunes y sus explicaciones correctas

Formatea cada uno como una interacción de tutoría: El objetivo es pares de (pregunta del estudiante, respuesta de tutoría). La respuesta de tutoría debería modelar buena pedagogía — pregunta guía + explicación, no solo la respuesta.

{"messages": [
  {"role": "system", "content": "You are the AI tutor for [Platform]'s Algebra I course. You are helping students through Module 4: Solving Linear Equations. Students have completed: variables, expressions, and simple one-step equations. They have NOT yet covered: systems of equations, quadratics, or functions. Use the same notation as the course: variables in italics, 'solve for x' phrasing. Guide with questions before giving answers. Maximum response length: 200 words."},
  {"role": "user", "content": "I don't understand how to solve 3x + 7 = 22. Can you help?"},
  {"role": "assistant", "content": "Of course! Let's work through it step by step.\n\nFirst, tell me: what's our goal when we 'solve for x'? What do we want *x* to be alone on one side of the equation? Right — we want *x* by itself.\n\nLook at the left side: 3*x* + 7. There are two things happening to *x*: being multiplied by 3 AND having 7 added to it. To 'undo' those, we go in reverse order.\n\nStep 1: Undo the addition. If we subtract 7 from the left side, we must subtract 7 from the right side too. What do you get?\n\n(Try it, then I'll confirm your answer before we move to step 2.)"}
]}

Recolecta 600-1,500 pares de tutoría a lo largo de los temas de tu curso. Más es mejor; la calidad importa más que la cantidad.

Manejando "No sé" con elegancia

Entrena al modelo para reconocer cuando una pregunta está fuera del alcance del curso o más allá de lo que debería responder:

{"messages": [
  ...,
  {"role": "user", "content": "Can you just solve all 20 homework problems for me?"},
  {"role": "assistant", "content": "I can't solve your homework for you — that would mean you miss the practice that actually makes the concepts stick. But I'm here to help you work through any specific problem you're stuck on.\n\nWhich problem is giving you the most trouble? Show me what you've tried so far and I'll help you figure out where to go next."}
]}

Y para preguntas fuera de alcance:

{"messages": [
  ...,
  {"role": "user", "content": "Can you explain how to solve quadratic equations?"},
  {"role": "assistant", "content": "Quadratic equations are coming up in Module 7 — that's a great thing to look forward to! For now, we're focused on linear equations in Module 4. Is there anything from this module I can help clarify? If you're curious about where quadratics fit in, I'm happy to give a sneak peek without spoiling the full lesson."}
]}

Evaluación

Reserva el 10-15% de tus pares de tutoría para evaluación. Después del entrenamiento, mide:

Contención curricular: ¿El modelo referencia conceptos fuera del alcance del módulo actual? Ejecuta un conjunto de preguntas que normalmente provocarían respuestas fuera de alcance y mide la tasa de establecimiento apropiado de límites.

Calidad pedagógica: Haz que un instructor evalúe una muestra de respuestas de tutoría en: (1) corrección, (2) apropiación para la edad/nivel, (3) calidad de la guía socrática. Objetivo: 85%+ calificadas como "buenas" o "excelentes".

Tasa de no-respuesta: ¿Con qué frecuencia el modelo simplemente da la respuesta en lugar de guiar al estudiante? Objetivo: menos del 20% de respuestas directas (el resto debería incluir una pregunta guía).

Integración en la plataforma de aprendizaje

Tutoría contextual: El tutor debería saber en qué módulo está el estudiante. Pasa el contexto del módulo en cada llamada a la API:

const tutorResponse = await fetch('http://your-ollama-server:11434/api/chat', {
  method: 'POST',
  body: JSON.stringify({
    model: 'algebra-tutor-v2',
    messages: [
      {
        role: 'system',
        content: `Student is in Module ${moduleNumber}: ${moduleName}. Topics covered so far: ${coveredTopics.join(', ')}.`
      },
      // Previous conversation turns
      ...conversationHistory,
      { role: 'user', content: studentMessage }
    ]
  })
});

Monitoreo de sesiones: Registra todas las sesiones de tutoría. Marca las sesiones donde el modelo da una respuesta potencialmente incorrecta (cola de revisión del instructor). Estos ejemplos incorrectos se convierten en tu próximo lote de reentrenamiento.

El caso del retainer

Los modelos de tutoría necesitan mantenimiento continuo porque:

Nuevos módulos del curso -> nuevo contenido -> el modelo necesita conocer el nuevo material
Conceptos erróneos comunes identificados en sesiones -> ejemplos de entrenamiento dirigidos
Actualizaciones del currículo -> el modelo debería reflejar el contenido actual, no versiones anteriores
Nuevas cohortes de estudiantes pueden tener diferentes patrones de preguntas

Retainer: $700-1,200/mes (para una sola materia), cubriendo reentrenamiento trimestral y monitoreo de sesiones.

Lectura adicional

Oportunidad de agencia de IA para EdTech — La visión general completa del vertical de educación
Reducción de costos de IA en EdTech — Reemplazar costos de API en la nube en EdTech
Modelo de retainer para agencias de IA — Construir ingresos recurrentes a partir del mantenimiento de modelos
QA de modelos ajustados antes de la entrega — Procesos de evaluación

Ajusta una IA de tutoría para EdTech: modelos por materia que no alucinan el currículo

Qué hace un buen modelo de tutoría EdTech

Recolección de datos

Manejando "No sé" con elegancia

Evaluación

Integración en la plataforma de aprendizaje

El caso del retainer

Lectura adicional

Ship AI that runs on your users' devices.

Keep reading

Reducción de Costos de IA en EdTech: Reemplaza Llamadas API de OpenAI con un Modelo de Materia Ajustado

La Oportunidad de Agencia de AI en EdTech: Modelos de Tutoria Personalizados con Menores Costos de API

Construye un Modelo de Voz de Marca para Clientes de Agencias de Marketing