Hermes 4
Patrón de rechazo: Mínimo (por diseño)
Hermes 4 de Nous Research es la elección más clara para casos de uso legítimos bloqueados por el entrenamiento de seguridad convencional. El modelo está explícitamente «alineado de forma neutral»: Nous evitó deliberadamente el entrenamiento agresivo de rechazo por RLHF, produciendo un fine-tune que sigue instrucciones sin los patrones de rechazo excesivo comunes en otros lanzamientos contemporáneos. Construido sobre la base de Llama 3.1 con post-entrenamiento RL Atropos usando alrededor de 1.000 verificadores específicos de tarea, Hermes 4 también ofrece una sólida capacidad de razonamiento más allá de su postura de alineación. Para investigación de seguridad, evaluación de equipos rojos, escritura creativa para adultos y contenido educativo sobre temas sensibles, Hermes 4 es la opción destacada.
Strengths
- Alineado de forma explícitamente neutral: sin entrenamiento agresivo de rechazo
- Post-entrenamiento RL Atropos que aporta sólida capacidad de razonamiento
- Modo de razonamiento híbrido <think> para profundidad adaptativa
- Hereda el ecosistema de despliegue de Llama 3.1
Trade-offs
- Hereda los términos de la Llama Community License (no Apache)
- La variante más pequeña es de 14B (no hay opción de 8B)
- Requiere controles de seguridad a nivel de producto para aplicaciones orientadas al consumidor