October 7, 2025

Les recherches sur les États-Unis laissent tomber les modèles Hermes 4 AI qui surpassent le chatpt sans restrictions de contenu

0
hermes-4.jpg

Vous voulez des informations plus intelligentes dans votre boîte de réception? Inscrivez-vous à nos newsletters hebdomadaires pour obtenir uniquement ce qui compte pour les chefs d’IA en entreprise, les données et les chefs de sécurité. Abonnez-vous maintenant


Nous Research, une startup d’intelligence artificielle secrète qui est devenue une voix de premier plan dans le mouvement d’IA open source, a été tranquillement publié Hermes 4 lundi, une famille de modèles de grande langue qui, selon la société, peuvent correspondre aux performances des principaux systèmes propriétaires tout en offrant un contrôle des utilisateurs sans précédent et une restriction minimale de contenu.

La version représente une escalade importante dans la bataille entre les défenseurs de l’IA open source et les grandes sociétés technologiques sur qui devrait contrôler l’accès aux capacités avancées de l’intelligence artificielle. Contrairement aux modèles d’Openai, Google ou Anthropic, Hermes 4 est conçu pour répondre à presque toutes les demandes sans les garde-corps de sécurité qui sont devenus standard dans les systèmes d’IA commerciaux.

“Hermes 4 s’appuie sur notre héritage de modèles alignés par l’utilisateur avec des capacités de calcul de test élargies”, a annoncé des recherches sur X (anciennement Twitter). «Une attention particulière a été accordée à la création des modèles et intéressante avec lesquelles interagir, sans encombre par la censure, et à aligner neutre tout en maintenant les performances de mathématiques, de codage et de raisonnement de niveau d’art pour les modèles de poids ouvert.»

Comment le mode «raisonnement hybride» d’Hermes 4 surpasse Chatgpt et Claude sur les références mathématiques

Hermes 4 présente ce que les recherches nous appellent le «raisonnement hybride», permettant aux utilisateurs de basculer entre les réponses rapides et les processus de réflexion étape par étape plus profonds. Lorsqu’ils sont activés, les modèles génèrent leur raisonnement interne dans Special Tags avant de fournir une réponse finale – similaire aux modèles de raisonnement O1 d’OpenAI mais avec une transparence totale dans le processus de réflexion de l’IA.


L’échelle AI atteint ses limites

Les plafonds d’électricité, la hausse des coûts de jetons et les retards d’inférence remodèlent l’entreprise AI. Rejoignez notre salon exclusif pour découvrir à quel point les équipes sont les meilleures:

  • Transformer l’énergie en un avantage stratégique
  • Architecting Inférence efficace pour les gains de débit réels
  • Déverrouiller un retour sur investissement compétitif avec des systèmes d’IA durables

Sécurisez votre place pour rester en avance:


La réalisation technique est substantielle. Dans les tests, le plus grand modèle de paramètres de 405 milliards d’Hermes 4 a obtenu un score de 96,3% sur la référence MATH-500 en mode raisonnement et 81,9% sur la compétition de mathématiques difficiles de l’AIME’24 – des performances qui rivalisent ou dépassent de nombreux systèmes de propriété coûtant des millions de personnes pour se développer.

“Le défi consiste à rendre les traces de réflexion utiles et vérifiables sans raisonnement en fuite”, a noté le chercheur d’IA Rohan Paul sur X, mettant en évidence l’une des percées techniques du communiqué.

Peut-être plus particulièrement, Hermes 4 a obtenu le score le plus élevé parmi tous les modèles testés sur «Refusalbench», une nouvelle recherche de référence nous a créé pour mesurer la fréquence à laquelle les systèmes d’IA refusent de répondre aux questions. Le modèle a obtenu un score de 57,1% en mode de raisonnement, surpassant considérablement le GPT-4O (17,67%) et Claude Sonnet 4 (17%).

Les modèles Hermès 4 de la recherche de nous ont répondu beaucoup plus de questions que les systèmes d’IA concurrents sur Refusalbench, un test mesurant la fréquence à laquelle les modèles refusent de répondre aux demandes des utilisateurs. (Crédit: recherche de nous)

Inside dataforge et atropos: les systèmes de formation révolutionnaires derrière les capacités d’Hermes 4

Derrière les capacités d’Hermès 4 se trouve une infrastructure de formation sophistiquée que les recherches nous ont développées sur plusieurs années. Les modèles ont été formés à l’aide de deux nouveaux systèmes: Dataforge, un générateur de données synthétiques basé sur des graphiques et ATroPOS, un cadre d’apprentissage de renforcement open source.

Dataforge crée des données de formation à travers ce que l’entreprise décrit comme des «promenades aléatoires» à travers des graphiques dirigés, transformant des données simples pré-formation en exemples complexes de suivi de l’instruction. Le système peut, par exemple, prendre un article de Wikipedia et le transformer en une chanson de rap, puis générer des questions et des réponses en fonction de cette transformation.

ATROPOS, quant à lui, opère comme des centaines d’environnements de formation spécialisés où les modèles d’IA pratiquent des compétences spécifiques – des mathématiques, du codage, de l’utilisation des outils et de l’écriture créative – ne reçoit pas les commentaires que lorsqu’ils produisent des solutions correctes. Cette approche «échantillonnage de rejet» garantit que seules les réponses vérifiées et de haute qualité en font partie des données de formation.

“Dous a utilisé ces environnements pour générer l’ensemble de données pour Hermes 4!” a expliqué Tommy Shaughnessy, un capital-risqueur de Delphi Ventures qui a investi dans la recherche de nous. «Tout dans l’ensemble de données contient 3,5 millions d’échantillons de raisonnement et 1,6 million d’échantillons non renvoyants! Hermes a été formé sur les données RL, pas seulement des ensembles de données statiques de question et de réponse!»

Le processus de formation a nécessité 192 GPU NVIDIA B200 et 71 616 heures de GPU pour le modèle le plus important – un investissement informatique significatif mais pas sans précédent qui montre comment les techniques spécialisées peuvent rivaliser avec l’échelle massive des géants de la technologie.

Pourquoi la recherche sur les armes à la sécurité de l’IA est «ennuyeuse comme l’enfer» et nuise à l’innovation

Les recherches sur les États-Unis ont constitué sa réputation sur une philosophie qui met le contrôle des utilisateurs au-dessus des politiques de contenu d’entreprise. Les modèles de l’entreprise sont conçus pour être «orientables», ce qui signifie qu’ils peuvent être affinés ou invités à se comporter de manière spécifique sans les contraintes de sécurité rigides qui caractérisent les systèmes d’IA commerciaux.

“Hermès 4 n’est pas enchaîné par des avertissements, des règles et d’être trop prudent, ce qui est ennuyeux comme l’enfer et nuit à l’innovation et à la convivialité”, a écrit Shaughnessy dans un fil détaillé analysant la version. “Si son open source mais refuse tout ce qui demande son inutile. Pas un problème avec Hermes 4.”

Cette approche a rendu les recherches sur les États-Unis populaires parmi les chercheurs et les développeurs de l’IA qui veulent une flexibilité maximale, mais il place également l’entreprise au centre des débats en cours sur la sécurité et la modération du contenu de l’IA. Bien que les modèles puissent théoriquement être utilisés à des fins nuisibles, la recherche de nous soutient que la transparence et le contrôle des utilisateurs sont préférables au porte-parcours d’entreprise.

Le rapport technique de l’entreprise, publié aux côtés des modèles, fournit des détails sans précédent sur le processus de formation, les résultats de l’évaluation et même les sorties de texte réelles des tests de référence. “Nous pensons que ce rapport établit une nouvelle norme de transparence dans l’analyse comparative”, a déclaré la société.

Comment une petite startup avec 192 GPU est en concurrence avec les budgets d’IA d’un milliard de dollars de Big Tech

La sortie d’Hermès 4 arrive à un moment charnière de l’industrie de l’IA. Alors que les grandes sociétés technologiques ont versé des milliards dans le développement de systèmes d’IA de plus en plus puissants, un mouvement croissant open source soutient que ces capacités ne devraient pas être contrôlées par une poignée de sociétés.

Les derniers mois ont connu des progrès importants dans l’IA open source, avec des modèles comme Llama 3.1 de Meta, de Deepseek et R1 et la série QWEN d’Alibaba, réalisant des performances qui rivalisent avec les systèmes propriétaires. Hermès 4 représente une autre étape de cette progression, en particulier dans le domaine du raisonnement – considéré comme une force de systèmes fermés comme l’O1 d’Openai.

“Tout d’abord, nous est une startup avec des dizaines de personnes extrêmement talentueuses”, a noté Shaughnessy. «Ils n’ont pas les dépenses annuelles de 100 milliards de dollars + CAPEX d’un hyperscaleur ni des 1 000 employés et malgré cela, ils continuent de publier des modèles et des recherches innovants à un rythme fou.»

La startup, qui a levé 65 millions de dollars de financement plus tôt cette année, dirigé par Paradigm, a également développé Psyché Network, un système de formation distribué qui vise à coordonner la formation d’IA sur des ordinateurs connectés à Internet en utilisant la technologie Blockchain.

Le correctif technique qui a empêché Hermes 4 de penser dans des boucles sans fin

L’une des contributions techniques les plus importantes d’Hermès 4 aborde un problème qui afflige les modèles de raisonnement: les processus de réflexion trop longs. Les chercheurs ont constaté que leur modèle de paramètres plus petit de 14 milliards atteindrait une longueur de contexte maximale 60% du temps où le raisonnement, se coince essentiellement dans des boucles de pensée sans fin.

Leur solution impliquait une deuxième étape de formation qui enseigne aux modèles à arrêter le raisonnement à exactement 30 000 jetons, réduisant la génération trop longue de 65 à 79% tout en conservant la plupart des performances de raisonnement. Cette technique de «contrôle de la longueur» pourrait s’avérer précieuse pour la communauté de recherche plus large de l’IA.

“Les modèles plus petits (<14b) ont tendance à trop penser lorsqu'ils sont distillés, mais les modèles plus grands", a observé le chercheur d'IA Muyu He sur X, mettant en évidence les informations du rapport technique.

Cependant, Hermes 4 fait toujours face à des limitations communes aux modèles open source. Malgré des performances de référence impressionnantes, les modèles nécessitent des ressources informatiques importantes pour s’exécuter et ne peuvent pas correspondre à la facilité d’utilisation ou à la fiabilité des services d’IA commerciaux pour de nombreuses applications.

Où essayer Hermes 4 et ce que cela coûte par rapport à Chatgpt et à Claude

Les recherches sur les États-Unis ont rendu Hermes 4 disponibles sur plusieurs canaux, reflétant la philosophie open source. Les poids du modèle sont librement téléchargeables sur les câlins, tandis que la société offre également un accès API via son interface de chat remaniée et ses partenariats avec des fournisseurs d’inférence comme Chutes, Nebius et Luminal.

“Vous pouvez essayer Hermes 4 dans la nouvelle interface utilisateur de discussion sur le monde”, a annoncé la société, mettant en évidence des fonctionnalités telles que des interactions parallèles et un système de mémoire.

Pour les utilisateurs et les chercheurs de l’entreprise, les modèles représentent une alternative potentiellement attrayante au paiement de l’accès à l’API aux systèmes propriétaires, en particulier pour les applications nécessitant des niveaux élevés de personnalisation ou de manipulation de contenu sensible.

La vue d’ensemble: ce que Hermes 4 signifie pour l’avenir du développement de l’IA

La sortie d’Hermes 4 représente plus qu’un simple lancement du modèle d’IA – c’est une déclaration sur qui devrait contrôler l’avenir de l’intelligence artificielle. Dans une industrie de plus en plus dominée par une poignée de géants de la technologie avec des ressources pratiquement illimitées, la recherche nous a démontré que l’innovation peut encore provenir de endroits inattendus.

L’approche de l’entreprise soulève des questions fondamentales sur les compromis entre la sécurité et les capacités, entre le contrôle des entreprises et la liberté des utilisateurs. Alors que les grandes sociétés technologiques soutiennent que la modération minutieuse du contenu et les garde-corps de sécurité sont essentielles pour le déploiement responsable de l’IA, la recherche sur les États-Unis soutient que la transparence et l’agence d’utilisateurs sont plus importantes que les restrictions imposées par l’entreprise.

Il reste à voir que cette philosophie s’avérera finalement bénéfique ou problématique. Mais une chose est certaine: Hermes 4 a montré que l’avenir de l’IA ne sera pas déterminé uniquement par les entreprises avec les poches les plus profondes.

Dans un domaine où les impossibilités d’hier deviennent les produits de demain, les recherches de nous ont simplement prouvé que la seule chose plus dangereuse qu’une IA qui dit que non pourrait être celle qui est prête à dire oui.


https://venturebeat.com/wp-content/uploads/2025/08/hermes-4.jpg?w=1024?w=1200&strip=all

About The Author

Leave a Reply

Your email address will not be published. Required fields are marked *