What is Domain Adaptation?

El proceso de ajustar un modelo entrenado con datos generales para que funcione bien en un dominio específico, como salud, legal o finanzas.

Definition

La adaptación de dominio es el proceso amplio de modificar un modelo de propósito general para que funcione efectivamente en un dominio específico — una industria particular, área temática o contexto de aplicación. Aunque el término se superpone con fine-tuning, la adaptación de dominio es más abarcadora: incluye no solo fine-tuning supervisado con datos etiquetados, sino también preentrenamiento continuo con texto no etiquetado específico del dominio, expansión de vocabulario para terminología del dominio y evaluación contra benchmarks específicos del dominio.

Para LLMs, la adaptación de dominio típicamente sigue un proceso de múltiples etapas. Primero, el preentrenamiento continuo expone al modelo a grandes volúmenes de texto no etiquetado del dominio (revistas médicas, expedientes legales, informes financieros), enseñándole vocabulario del dominio, convenciones de escritura y conocimiento factual. Segundo, el fine-tuning supervisado con pares instrucción-respuesta etiquetados enseña al modelo a aplicar este conocimiento del dominio a tareas específicas. Tercero, la optimización de preferencias (DPO o RLHF) alinea las salidas del modelo con las preferencias de los expertos del dominio. Cada etapa agrega un tipo diferente de conocimiento del dominio.

La efectividad de la adaptación de dominio depende en gran medida de la distancia entre el dominio fuente (texto general de la web) y el dominio objetivo. Los dominios con vocabulario especializado, convenciones de escritura únicas y requisitos de razonamiento a nivel experto (medicina, derecho, química) se benefician más de la adaptación. Los dominios bien representados en el texto general de la web (tareas empresariales comunes, conversación casual) pueden necesitar poca o ninguna adaptación más allá de una ingeniería de prompts cuidadosa.

Why It Matters

Los modelos de propósito general, aunque impresionantemente capaces, consistentemente tienen un rendimiento inferior a los modelos específicos del dominio en tareas especializadas. Un modelo general podría lograr un 65% de precisión en preguntas de exámenes médicos, mientras que un modelo adaptado al dominio logra un 85%. Para aplicaciones empresariales donde la precisión impacta directamente los resultados del negocio — soporte a decisiones clínicas, análisis de documentos legales, evaluación de riesgo financiero — esta brecha de rendimiento justifica la inversión en adaptación de dominio.

La adaptación de dominio también permite que los modelos usen terminología especializada correctamente, sigan convenciones específicas del dominio (formatos de citación, lenguaje regulatorio, estructuras de notas clínicas) y eviten comportamientos inapropiados para el dominio (hacer diagnósticos médicos definitivos, proporcionar asesoramiento legal específico sin calificaciones). Estas adaptaciones de comportamiento son tan importantes como la precisión bruta para el despliegue en producción en industrias reguladas.

How It Works

Un pipeline completo de adaptación de dominio tiene tres etapas. En el preentrenamiento continuo, el modelo procesa millones de tokens de texto no etiquetado del dominio usando el mismo objetivo de predicción del siguiente token que el preentrenamiento original, pero con una tasa de aprendizaje más baja. Esto enseña al modelo vocabulario del dominio y conocimiento factual sin capacidad de seguir instrucciones. El tokenizer también podría extenderse con tokens específicos del dominio para mejorar la eficiencia de codificación de terminología técnica.

En el fine-tuning supervisado, el modelo se entrena con pares instrucción-respuesta curados que demuestran el comportamiento deseado para tareas del dominio. La calidad de los datos en esta etapa es crítica — los ejemplos deben cubrir el rango de tareas que el modelo manejará en producción, incluir las coberturas y calificaciones apropiadas requeridas por el dominio, y representar el formato y estilo esperado por los usuarios finales. La etapa final de optimización de preferencias usa comparaciones de expertos del dominio para refinar la calidad de salida en dimensiones subjetivas que son difíciles de capturar en etiquetas supervisadas.

Example Use Case

Una empresa de tecnología legal adapta Llama 3 8B para revisión de contratos. Etapa 1: preentrenamiento continuo con 2 mil millones de tokens de texto legal (jurisprudencia, contratos, presentaciones regulatorias) durante 3 días en 4 GPU. Etapa 2: fine-tuning supervisado con 8,000 ejemplos de revisión de contratos (identificación de cláusulas, señalamiento de riesgos, generación de resúmenes). Etapa 3: entrenamiento DPO con 2,000 pares de preferencia donde abogados senior eligieron entre las salidas del modelo. El modelo resultante supera a GPT-4 en su benchmark interno de revisión de contratos por un 12%, mientras se ejecuta localmente en una sola GPU.

Key Takeaways

La adaptación de dominio modifica modelos de propósito general para industrias o áreas temáticas específicas.
Típicamente involucra preentrenamiento continuo, fine-tuning supervisado y optimización de preferencias.
Los dominios con vocabulario especializado y razonamiento experto se benefician más de la adaptación.
La adaptación de dominio aborda tanto requisitos de precisión como de comportamiento (convenciones, calificaciones, terminología).
La brecha entre modelos generales y adaptados al dominio justifica la inversión para aplicaciones empresariales.

How Ertas Helps

Ertas Studio soporta el pipeline completo de adaptación de dominio — desde preentrenamiento continuo hasta fine-tuning supervisado y optimización de preferencias. Ertas Data Suite prepara datos de entrenamiento específicos del dominio en cada etapa, desde la limpieza de corpus de dominio no etiquetados hasta la estructuración de pares instrucción-respuesta etiquetados.