TOOLS

Quel modèle Claude choisir ? Haiku, Sonnet et Opus, choisis en fonction de la tâche de santé — et non du battage médiatique.

Tous les quelques mois, les noms changent et les annonces de lancement insistent sur le fait que le nouveau modèle est le plus intelligent jamais créé. Pour l'analyse de vos propres données de santé, ce n'est pas la bonne question à se poser. Il n'y a pas sept modèles à mémoriser — il y a une seule échelle, et une règle simple pour savoir quel échelon correspond à quelle tâche. Voici la version sereine : ce que sont réellement Haiku, Sonnet et Opus, et lequel choisir lorsque vous analysez vos propres résultats d'analyses, votre sommeil et vos notes.

By Sabin · Wellness & AI9 minRead in English →

Tous les quelques mois, un nouveau Claude débarque. L'annonce de son lancement le qualifie de modèle le plus performant jamais conçu, et une nouvelle vague de carrousels apparaît pour expliquer la 'nouvelle gamme' comme si c'était un tableau périodique à mémoriser. Haiku, Sonnet, Opus — et quels que soient les noms plus grands et plus audacieux qui suivront. On pourrait croire qu'il y a sept choses à apprendre. Ce n'est pas le cas.

C'est une seule et même échelle. Les échelons vont du plus rapide et économique, au plus puissant et coûteux, en passant par un modèle équilibré. Une fois que vous comprenez cette échelle, vous n'aurez plus jamais à la réapprendre quand les noms changeront — et ils changeront. La compétence durable n'est pas de connaître le produit phare du moment. C'est de savoir de quel échelon votre tâche a réellement besoin. C'est ce que le battage médiatique est conçu pour vous faire oublier, car 'utilisez toujours le plus puissant' est un meilleur argument de vente que 'la plupart du temps, vous n'en avez pas besoin'.

L'échelle, en termes simples

Ignorez les numéros de version un instant. À tout moment, la famille se divise en trois types de tâches. Les noms changent ; les tâches, non.

  • Haiku — le rapide. Le plus petit, le plus vif, le moins cher. Conçu pour les tâches simples à grande vitesse et à grande échelle : nettoyer cet export, extraire les chiffres de ce PDF, classer ces notes, donnez-moi un résumé d'une ligne. Pensez-y comme au stagiaire qui répond en deux secondes — brillant pour le volume, mais pas celui à qui vous confiez une décision critique.
  • Sonnet — le polyvalent. Le juste milieu équilibré de la famille : assez intelligent pour la plupart des vraies tâches, tout en restant modéré en temps et en coût. C'est le choix par défaut pour l'écrasante majorité des tâches de santé quotidiennes. Le partenaire fiable de tous les jours — sans fioritures, et presque toujours la bonne réponse.
  • Opus — le poids lourd. Le modèle phare, conçu pour la réflexion véritablement complexe et multi-étapes. Plus de puissance, un coût plus élevé, plus de lenteur. Vous l'utilisez lorsqu'un problème est réellement complexe et que la qualité du raisonnement importe plus que la vitesse ou la facture — pas par réflexe.

Une image mentale utile : c'est comme les tailles de café. Petit, moyen, grand — et parfois 'vous êtes sûr ?'. La plupart du temps, vous voulez le moyen. Apprenez l'échelle une bonne fois pour toutes et vous ne vous sentirez plus perdu chaque fois que le menu est réimprimé.

Appliquez maintenant cela à votre propre AI Health Stack

C'est ici que ça cesse d'être une simple information pour commencer à vous faire économiser de l'argent et de la frustration. Voici les tâches que les gens effectuent réellement lorsqu'ils analysent leurs propres données — associées à l'échelon qui convient.

  1. Extraction et nettoyage — extraire des valeurs d'un PDF d'analyses, transformer un export Oura ou Apple Health en un tableau propre, transcrire une note en désordre. C'est un travail rapide, structuré, qui ne demande que peu de jugement. Le niveau rapide s'en charge très bien, et il n'y a aucune raison de payer le prix du modèle phare pour de la saisie de données.
  2. Votre bilan hebdomadaire — 'voici mon sommeil, mon entraînement et mon humeur de la semaine ; qu'est-ce qui a changé, qu'est-ce qui dérive, que devrais-je surveiller ?' C'est l'essentiel d'un carnet de santé personnel, et c'est typiquement le travail du modèle polyvalent. Optez pour l'échelon intermédiaire et restez-y pour la plupart de vos tâches.
  3. Croiser plusieurs mois de données — 'analyse les quatre derniers mois de fréquence cardiaque au repos, d'alcool et de VFC et dis-moi où les schémas se rejoignent.' C'est un raisonnement plus difficile, multifactoriel, sur un contexte large. C'est là que passer au poids lourd devient rentable.
  4. Une question véritablement complexe — réconcilier deux bilans d'analyses contradictoires, raisonner sur une chronologie complexe de médicaments et de compléments, ou tester la robustesse d'un protocole avant de le présenter à un praticien. Réflexion poussée, enjeux élevés. Utilisez le modèle phare, puis présentez le résultat à un humain.

La question des garde-fous — et pourquoi 'le plus puissant' n'explique pas tout

Les annonces de lancement adorent les tableaux de benchmarks : ce modèle surpasse les grands noms sur tel ou tel critère. Traitez ces chiffres avec le même scepticisme que vous accorderiez à n'importe quelle donnée publiée par une entreprise sur son propre produit. Ils sont mesurés sur des tâches choisies par ceux qui vendent le modèle, et un point de pourcentage sur un benchmark de codage agentique ne vous dit presque rien sur la capacité du modèle à analyser vos données de sommeil de manière sensée.

Ce qui compte vraiment pour la santé est quelque chose que les classements ne montrent pas : comment le modèle se comporte lorsqu'une question frôle le domaine médical. Un modèle grand public bien conçu devrait devenir plus prudent, et non moins, lorsque vous lui posez une question qui ressemble à un diagnostic — en émettant des réserves, en citant l'incertitude, en vous conseillant de consulter. Cette retenue est une qualité, pas une faiblesse. Méfiez-vous de toute configuration ou variante 'déverrouillée' vendue avec la promesse de supprimer les garde-fous. Pour votre propre corps, le modèle qui sait quand s'arrêter a plus de valeur que celui qui a toujours une réponse.

Le modèle qui dit 'Je ne suis pas sûr — vérifiez ceci avec un clinicien' fait son travail. Celui qui vous diagnostique avec confiance à partir d'une capture d'écran est celui dont il faut s'inquiéter.

La compétence qui survivra au prochain lancement

Voici la partie qui dérange pour quiconque espère atteindre la maîtrise en mémorisant : les noms que vous apprenez aujourd'hui ont une durée de vie de quelques mois. De nouveaux niveaux arrivent, les anciens sont renommés, la couronne du 'meilleur modèle au monde' change de mains régulièrement. Si votre compétence se résume à 'Je sais qu'Opus est le bon', elle expirera à la prochaine version.

Ce qui n'expire pas, c'est le jugement sous-jacent : savoir ce que votre tâche requiert réellement, l'associer à l'échelon le moins cher qui fait bien le travail, et garder un humain dans la boucle pour tout ce qui touche à votre santé. C'est tout l'intérêt de construire votre propre système au lieu de louer l'avis d'une autre application. Les outils s'améliorent constamment et les noms ne cessent de changer — la règle pour choisir entre eux, et le jugement qui la sous-tend, restent les vôtres.

Si vous souhaitez transformer cette échelle en une configuration fonctionnelle — le bon niveau de Claude connecté à vos propres analyses, exports et notes, avec un bilan hebdomadaire qui s'exécute sur l'échelon le moins cher et n'escalade que lorsque c'est nécessaire — c'est exactement ce que notre guide Claude for Health et la configuration Setup en dix minutes vous expliquent. Rien de tout cela n'est un mode secret. C'est simplement la version sereine qui continuera de fonctionner après la sortie du prochain modèle.

Traduction assistée par IA. En cas d'ambiguïté, la version anglaise fait foi.