Mistral Small 4
Accesibilidad para fine-tuning: Excelente
La arquitectura MoE de Mistral Small 4, con 6B parámetros activos, lo hace excepcionalmente eficiente de afinar en relación con sus 119B parámetros totales. QLoRA cabe cómodamente en una sola GPU de 24GB con longitudes de secuencia típicas — sustancialmente más accesible que afinar modelos densos de calidad equivalente en el rango de 30B-70B, que normalmente requieren GPUs de 48GB+. La arquitectura unificada (que cubre razonamiento, codificación y casos ajustados a instrucciones) significa que un solo fine-tune maneja tareas multidominio. La licencia Apache 2.0 no impone restricciones de uso ni requisitos de atribución.
Strengths
- El fine-tuning con QLoRA cabe en una sola GPU de 24GB con longitud de secuencia completa
- Inferencia con 6B parámetros activos para despliegue rápido de modelos afinados
- Licencia Apache 2.0 sin restricciones comerciales
- Un solo fine-tune cubre razonamiento, codificación y tareas ajustadas a instrucciones
Trade-offs
- El enrutamiento de expertos en MoE requiere configuración de fine-tuning consciente de la plataforma (gestionado automáticamente en Ertas Studio)
- La huella de despliegue en Q4_K_M (65GB) es mayor de lo que sugiere el número de parámetros activos