Quoi de neuf dans l’IA #2 : Claude 3.7 Sonnet
Anthropic dévoile Claude 3.7 Sonnet, son premier modèle d’IA hybride capable d’adapter sa vitesse de raisonnement en fonction des besoins de l’utilisateur. Présenté comme une avancée majeure, ce modèle veut simplifier l’expérience utilisateur en offrant un équilibre entre rapidité et réflexion approfondie. Mais est-ce suffisant pour s’imposer face aux modèles d’OpenAI et DeepSeek ?
Anthropic a officiellement lancé Claude 3.7 Sonnet, une intelligence artificielle conçue pour offrir deux modes de fonctionnement : des réponses instantanées pour des questions simples et une réflexion approfondie pour les tâches complexes. L’objectif est de permettre aux utilisateurs de choisir le niveau de raisonnement de l’IA selon leurs besoins, une approche qui tranche avec les modèles traditionnels de type « raisonnement » qui prennent plus de temps mais offrent des réponses plus précises.
Contrairement aux IA concurrentes comme OpenAI o3-mini ou DeepSeek R1, qui se concentrent uniquement sur le raisonnement approfondi, Claude 3.7 Sonnet intègre cette capacité directement dans un seul et même modèle. Anthropic espère ainsi éviter aux utilisateurs la complexité du choix entre différents modèles et optimiser leur expérience.
Disponible dès aujourd’hui via l’application Claude et les plateformes Amazon Bedrock et Google Cloud Vertex AI, Claude 3.7 Sonnet est accessible aux développeurs et aux utilisateurs premium d’Anthropic. Les abonnés gratuits auront accès à la version standard, sans les capacités de raisonnement avancé.
Des performances en hausse, mais à quel prix ?
Anthropic affirme que Claude 3.7 Sonnet surpasse son prédécesseur, Claude 3.5 Sonnet, en matière de mathématiques, de programmation et d’interaction avec les API. Sur le benchmark SWE-Bench, qui évalue les capacités des modèles sur des tâches de programmation, Claude 3.7 Sonnet obtient une précision de 62,3 %, contre 49,3 % pour OpenAI o3-mini. Sur le TAU-Bench, qui mesure l’aptitude d’une IA à interagir avec des utilisateurs simulés dans un contexte commercial, il atteint 81,2 %, dépassant OpenAI o1 (73,5 %).
Cependant, cette montée en performance a un coût. Le modèle est facturé 3 dollars par million de tokens d’entrée et 15 dollars par million de tokens de sortie. C’est nettement plus cher que ses rivaux : OpenAI o3-mini coûte 1,10 dollar pour 1 million de tokens d’entrée et 4,40 dollars pour 1 million de tokens de sortie, tandis que DeepSeek R1 affiche des tarifs encore plus bas (0,55 dollar et 2,19 dollars respectivement). Reste à voir si la flexibilité de Claude 3.7 Sonnet justifiera cette différence de prix auprès des entreprises et développeurs.
Un modèle conçu pour des tâches réelles
Si les modèles d’IA ont souvent été optimisés pour des compétitions académiques en mathématiques et en informatique, Anthropic adopte une approche différente avec Claude 3.7 Sonnet. L’entreprise déclare avoir davantage axé son entraînement sur des tâches pratiques, comme la programmation logicielle, la finance et le droit.
Dans cette logique, Anthropic introduit également Claude Code, un nouvel outil agentique permettant aux développeurs d’exécuter directement des tâches de codage depuis un terminal. L’IA peut ainsi analyser un projet, modifier son code, effectuer des tests et même pousser les modifications sur GitHub.
Cette fonctionnalité, encore en phase de test et disponible sur invitation, pourrait marquer une avancée significative dans l’automatisation du développement logiciel. Anthropic espère que Claude Code deviendra un assistant capable d’accompagner les programmeurs dans des tâches complexes, de la correction de bugs à l’optimisation de performances.
Vers une IA encore plus autonome
L’un des objectifs à long terme d’Anthropic est de rendre Claude encore plus autonome dans sa gestion du temps de réflexion. Actuellement, c’est l’utilisateur qui doit choisir si l’IA doit répondre rapidement ou prendre le temps d’analyser une question en profondeur. À l’avenir, Claude pourrait déterminer lui-même le temps de raisonnement nécessaire en fonction du contexte.
Une autre amélioration concerne la réduction des refus inutiles. Claude 3.7 Sonnet refuserait 45 % de requêtes en moins que Claude 3.5 Sonnet, grâce à une meilleure distinction entre les demandes légitimes et celles jugées potentiellement nuisibles. Cette évolution s’inscrit dans une tendance plus large, où plusieurs entreprises d’IA, dont xAI avec Grok 3, revoient leurs politiques de filtrage des réponses.
Une avancée suffisante pour devancer OpenAI et DeepSeek ?
Avec ce modèle hybride, Anthropic propose une approche originale qui pourrait séduire un large public, des utilisateurs occasionnels aux professionnels. En simplifiant l’interaction avec l’IA tout en offrant des performances accrues, Claude 3.7 Sonnet se positionne comme un concurrent sérieux dans la course à l’intelligence artificielle.
Cependant, la concurrence ne reste pas immobile. OpenAI prépare déjà son propre modèle hybride, qui pourrait être lancé dans les prochains mois. De son côté, DeepSeek continue d’améliorer ses modèles à moindre coût, mettant la pression sur des entreprises comme Anthropic qui misent sur des solutions plus haut de gamme.