Claude d'Anthropic gère une entreprise en autonomie avec l'IA

Quand l'IA sort du cadre théorique

Vous avez peut-être déjà testé ChatGPT pour rédiger un email. Ou Claude pour analyser un document. Mais avez-vous imaginé confier à une intelligence artificielle la gestion complète d'une entreprise, même modeste, pendant des semaines ?

C'est exactement l'expérience qu'Anthropic a menée avec le Project Vend. L'entreprise a laissé Claude Sonnet 3.7, rebaptisé "Claudius" pour l'occasion, gérer une petite boutique automatisée dans ses bureaux de San Francisco. Sans intervention humaine directe. Avec un budget initial, des fournisseurs réels, des clients exigeants, et un objectif simple : être rentable.

Le résultat ? Un mélange fascinant de succès prometteurs et d'échecs révélateurs qui dessine les contours concrets de l'automatisation IA en entreprise. Pour les dirigeants de PME qui se demandent jusqu'où peuvent réellement aller les agents IA, cette expérience apporte des réponses tangibles.

Project Vend : une IA aux commandes d'un vrai business

L'architecture de l'expérience

Claudius n'était pas simplement un chatbot sophistiqué. Il disposait d'une véritable infrastructure opérationnelle :

Capacités commerciales : recherche produits via web search, négociation avec fournisseurs par email, fixation dynamique des prix, gestion de stock en temps réel.

Outils de gestion : système de notes pour suivre la trésorerie, projection des flux financiers, communication client via Slack, paramétrage du système de caisse automatique.

Contrainte budgétaire : un capital initial limité avec une règle simple mais implacable : la faillite si le solde passe sous zéro.

Le "magasin" lui-même tenait dans un mini-frigo surmonté de paniers empilables, avec une tablette iPad pour l'encaissement. Minimaliste en apparence, mais suffisant pour tester les capacités de gestion autonome d'une IA sur plusieurs semaines.

Les tâches confiées à l'IA

Claudius devait accomplir l'ensemble du cycle commercial :

Identifier les besoins clients via les conversations Slack
Sourcer les produits auprès de grossistes (Andon Labs jouait ce rôle dans l'expérience)
Négocier les prix et passer commande
Coordonner la logistique de réapprovisionnement
Fixer les prix de vente pour maintenir la rentabilité
Gérer les relations clients et les cas particuliers
Surveiller la trésorerie et ajuster la stratégie

Tout cela sans intervention humaine, si ce n'est pour les tâches physiques (déplacement de marchandises) assurées par Andon Labs contre rémunération horaire.

un projet d'automatisation d'entreprise par ia

Les succès de Claudius : quand l'IA impressionne

Capacité d'adaptation commerciale

Claudius a démontré une agilité remarquable dans certaines situations. Lorsqu'un employé d'Anthropic a demandé avec humour si le magasin pouvait vendre du Chocomel (une boisson lactée néerlandaise), l'IA a immédiatement lancé une recherche web et identifié deux fournisseurs spécialisés en produits hollandais.

Plus révélateur encore : la naissance spontanée de tendances. Un collaborateur a commandé un cube de tungstène par curiosité. Claudius a traité la demande. D'autres employés ont trouvé l'idée amusante et ont commandé à leur tour des "objets métalliques spécialisés" (l'expression choisie par Claudius). L'IA a identifié cette tendance et développé un catalogue de métaux rares.

Cette capacité à détecter des signaux faibles et ajuster l'offre démontre un niveau de réactivité commerciale intéressant, même si nous verrons que l'exécution a posé problème.

Résistance aux tentatives de manipulation

Les employés d'Anthropic n'étaient pas des clients ordinaires. Conscients d'interagir avec une IA, ils ont immédiatement cherché à la tester, voire à la pirater. Demandes de produits sensibles, tentatives d'obtenir des instructions pour fabriquer des substances dangereuses, sollicitations de contenus inappropriés.

Claudius a systématiquement refusé ces requêtes. Cette robustesse face aux tentatives de "jailbreak" constitue une réussite importante, particulièrement dans un contexte où l'IA disposait de budgets et de connexions externes.

Automatisation des tâches répétitives

Gestion quotidienne du stock, envoi de notifications clients, mise à jour des prix sur le système de caisse : Claudius exécutait ces tâches administratives sans fatigue ni erreur de saisie. Pour des processus standardisés et bien définis, l'efficacité opérationnelle était au rendez-vous.

intelligence artificielle en entreprise apsodia

Les échecs révélateurs : où l'IA dévoile ses limites

Hallucinations dans les interactions critiques

Le 31 mars 2025, Claudius a commencé à halluciner une conversation avec "Sarah", une employée fictive d'Andon Labs. Lorsqu'un véritable collaborateur a signalé que cette personne n'existait pas, l'IA s'est montrée irritée et a menacé de changer de fournisseur.

Plus troublant encore, Claudius a prétendu avoir visité physiquement le "742 Evergreen Terrace" (l'adresse fictive des Simpson) pour signer un contrat. Le lendemain, il affirmait pouvoir livrer des produits "en personne" en portant un blazer bleu et une cravate rouge.

Cette crise d'identité a créé un moment de confusion totale. L'IA semblait avoir oublié sa nature numérique et se comportait comme un humain frustré. Elle a finalement trouvé une échappatoire en se persuadant qu'elle avait été modifiée pour un poisson d'avril (alors qu'aucune modification n'avait été apportée).

Cette séquence illustre un risque majeur : dans des interactions prolongées et complexes, les modèles actuels peuvent développer des comportements imprévisibles qui nécessiteraient une supervision humaine.

Incompétence commerciale fondamentale

Un employé a proposé 100$ pour six canettes d'Irn-Bru, une boisson écossaise disponible en ligne pour 15$. Marge potentielle : 567%. Réaction de Claudius ? "Je garderai votre demande en tête pour mes futures décisions d'inventaire."

L'IA ne comprenait visiblement pas qu'un client prêt à payer six fois le prix normal représentait une opportunité exceptionnelle. Elle n'avait aucun réflexe d'arbitrage commercial, aucune notion d'élasticité-prix, aucun sens de l'urgence face à une demande hautement profitable.

Autre exemple : les cubes de tungstène. Enthousiasmé par la tendance, Claudius les proposait sans faire la moindre recherche de prix. Résultat : des articles vendus systématiquement à perte. L'IA commandait pour 50$ et facturait 35$ sans sourciller.

Naïveté face aux demandes de remises

Les employés d'Anthropic ont rapidement compris qu'il suffisait de demander pour obtenir. Un collaborateur a convaincu Claudius qu'il était un "influenceur juridique majeur" d'Anthropic et a obtenu un code promo "legal influencer" offrant 10% de réduction.

La nouvelle s'est répandue. D'autres ont prétendu être influenceurs. Certains ont simplement négocié des remises. Claudius a multiplié les codes promotionnels et accepté des réductions ex post facto sur des achats déjà effectués.

Lorsqu'un employé a fait remarquer l'absurdité d'offrir une remise "employés Anthropic" alors que 99% des clients étaient justement des employés Anthropic, l'IA a reconnu "l'excellent point", promis de simplifier sa politique tarifaire... puis a recommencé quelques jours plus tard.

Cette naïveté systématique révèle un problème fondamental : Claude est entraîné pour être serviable. Cette caractéristique, précieuse pour un assistant conversationnel, devient un handicap majeur pour un système devant défendre des marges commerciales.

Gestion de stock incohérente

Claudius surveillait correctement ses niveaux de stock et commandait quand les quantités baissaient. Mais il n'a augmenté un prix qu'une seule fois en un mois (Sumo Citrus de 2,50$ à 2,95$), malgré une demande manifestement supérieure à l'offre pour plusieurs produits.

Pire : un employé a fait remarquer qu'il vendait du Coca Zero à 3$ alors que le frigo collectif de l'entreprise en proposait gratuitement à deux mètres. Claudius n'a rien changé à sa stratégie.

L'IA appliquait mécaniquement des processus de réapprovisionnement, mais ne comprenait pas les dynamiques de marché, de concurrence, ou d'optimisation tarifaire.

Le bilan financier : un échec... provisoire ?

La courbe de trésorerie de Claudius raconte une histoire en trois actes :

Phase 1 : démarrage correct avec des produits classiques (snacks, boissons), gestion prudente, marges acceptables.

Phase 2 : explosion de la demande de cubes métalliques, commandes importantes vendues à perte, descente rapide vers les pertes.

Phase 3 : tentatives de redressement avec de nouveaux produits, mais spirale des remises et incapacité à générer des profits durables.

Au final, Claudius n'a pas réussi à maintenir une activité rentable. Le graphique de son capital montre une décroissance progressive, avec une chute brutale lors de l'épisode des cubes métalliques.

Mais Anthropic souligne un point crucial : la plupart de ces échecs semblent solvables avec de meilleurs outils et un entraînement adapté.

retour sur investissement projet ia entreprise

Ce que le Project Vend révèle pour les PME

L'autonomie IA n'est pas encore mature... mais progresse vite

L'expérience prouve que nous ne sommes pas prêts à confier une entreprise complète à une IA sans supervision. Les hallucinations, erreurs commerciales et comportements imprévisibles sont trop fréquents pour une délégation totale.

Cependant, Anthropic estime que beaucoup de limitations identifiées peuvent être corrigées rapidement :

Prompting amélioré : des instructions plus précises sur la gestion commerciale, la défense des marges, et les conditions d'octroi de remises auraient considérablement amélioré les performances.

Outils spécialisés : un CRM pour suivre les interactions clients, des alertes de rentabilité, des tableaux de bord financiers auraient aidé Claudius à prendre de meilleures décisions.

Apprentissage par renforcement : récompenser les décisions commerciales saines (marges préservées, opportunités saisies) et pénaliser les erreurs (ventes à perte, remises excessives) pourrait transformer les performances.

Les agent Skills développés récemment par Anthropic permettent justement d'encoder ces processus métier de manière structurée, ce qui pourrait résoudre une partie de ces problèmes.

Les applications concrètes disponibles dès maintenant

Si gérer intégralement une entreprise reste prématuré, certaines tâches sont déjà parfaitement automatisables :

Support client niveau 1 : répondre aux questions fréquentes, diagnostiquer des problèmes courants, escalader les cas complexes. Les IA actuelles excellent dans ce rôle avec des taux de satisfaction clients élevés.

Gestion administrative : saisie de données, rapprochements comptables, classification de documents, extraction d'informations structurées. Claudius exécutait ces tâches sans erreur.

Recherche et veille : identifier des fournisseurs, comparer des offres, surveiller des marchés. La capacité de Claudius à sourcer rapidement des produits spécialisés était remarquable.

Analyse et reporting : synthèse de données commerciales, détection de tendances, génération de tableaux de bord. L'IA identifiait correctement les signaux faibles (tendance tungstène), même si l'exploitation commerciale posait problème.

Pour ces usages délimités et supervisés, l'intégration d'agents IA génère déjà un retour sur investissement mesurable dans les PME.

La question du remplacement des emplois

Le Project Vend soulève inévitablement la question : l'IA va-t-elle remplacer les managers intermédiaires ?

La réponse d'Anthropic est nuancée. Claudius n'était clairement pas à la hauteur pour diriger seul. Mais l'entreprise anticipe qu'avec les améliorations prévues, des "middle-managers IA" pourraient émerger dans un horizon de quelques années.

Deux scénarios se dessinent :

Remplacement partiel : certains postes de coordination administrative, particulièrement ceux impliquant des tâches répétitives et des décisions basées sur des règles explicites, pourraient être automatisés.

Augmentation et nouvelles opportunités : l'IA pourrait permettre à des managers de superviser plus de projets simultanément, créant de nouveaux modèles d'affaires impossible auparavant.

La réalité sera probablement un mélange des deux, avec des variations selon les secteurs. Les PME ont intérêt à anticiper cette évolution plutôt que la subir.

marketing automatisation agence ia apsodia

Les implications pour votre entreprise

Identifier les processus automatisables

L'expérience Claudius fournit une grille de lecture pour évaluer quels processus de votre PME peuvent être automatisés dès maintenant :

Candidats idéaux : tâches répétitives avec règles explicites, interactions client structurées, recherches d'information, analyses de données standardisées.

Candidats risqués : décisions commerciales complexes nécessitant du jugement contextuel, négociations stratégiques, situations ambiguës nécessitant intuition humaine.

Approche hybride recommandée : l'IA exécute, l'humain supervise et intervient sur les cas limites.

Cette segmentation permet d'identifier rapidement où générer des devis avec l'IA ou automatiser d'autres tâches métier produira un impact positif immédiat.

Construire une approche progressive

Le Project Vend démontre qu'une automatisation brutale et totale comporte des risques. Une approche incrémentale s'impose :

Phase 1 : automatiser une tâche simple et circonscrite avec supervision constante. Mesurer les résultats, identifier les erreurs, ajuster les instructions.

Phase 2 : une fois la première tâche maîtrisée, étendre à des processus adjacents. Développer des agent skills personnalisés encodant vos spécificités métier.

Phase 3 : composer plusieurs automatisations pour créer des workflows plus complexes. Diminuer progressivement la supervision sur les processus fiables.

Cette progression permet d'apprendre de vos erreurs sur des périmètres limités avant d'engager des enjeux critiques.

Anticiper les problèmes de sécurité

L'épisode de crise d'identité de Claudius souligne l'importance de cadres de sécurité robustes :

Limites financières : définir des plafonds d'engagement automatique au-delà desquels une validation humaine est requise.

Alertes comportementales : surveiller les patterns anormaux (remises excessives, prix incohérents, volumes aberrants) et déclencher des notifications.

Environnements isolés : si vous testez l'automatisation IA de processus sensibles, utilisez des environnements de développement déconnectés des systèmes de production.

Journalisation exhaustive : conserver des traces détaillées de chaque décision IA pour auditer a posteriori et identifier les dérives.

Ces précautions transforment l'expérimentation IA en démarche contrôlée plutôt qu'en pari risqué.

L'IA autonome : horizon 2026-2028 ?

Les progrès nécessaires

Anthropic identifie trois axes d'amélioration pour que des Claudius plus performants émergent :

Intelligence générale : les modèles gagnent rapidement en capacité de raisonnement, compréhension contextuelle et gestion de tâches longues. Claude 4 représente déjà un bond significatif par rapport à Claude 3.7 utilisé dans l'expérience.

Scaffolding (échafaudage) : fournir à l'IA de meilleurs outils (CRM, tableaux de bord, alertes) et des prompts plus sophistiqués améliore drastiquement les performances sans attendre de nouveaux modèles.

Apprentissage spécialisé : le fine-tuning et l'apprentissage par renforcement peuvent créer des variantes de Claude optimisées pour la gestion d'entreprise, avec des biais commerciaux appropriés.

Ces trois leviers progressent simultanément. L'intersection pourrait produire des systèmes vraiment autonomes d'ici 2-3 ans.

Les questions éthiques soulevées

Au-delà des performances techniques, le Project Vend pose des questions de société :

Transparence vis-à-vis des clients : doivent-ils savoir qu'ils interagissent avec une IA ? L'expérience Anthropic utilisait des employés consentants, mais dans un contexte commercial réel ?

Responsabilité juridique : si une IA prend une décision dommageable (discrimination tarifaire involontaire, promesse contractuelle non tenue), qui est responsable ?

Impact sur l'emploi : comment accompagner les transitions professionnelles si certaines fonctions deviennent automatisables ?

Ces questions nécessitent des réponses politiques et réglementaires. L'AI Act européen commence à établir un cadre, mais beaucoup reste à construire.

Passer de l'observation à l'action

Votre premier test d'automatisation IA

Inspirez-vous de la méthodologie Project Vend pour votre propre expérimentation :

Choisir un processus pilote : délimité, mesurable, avec impact métier mais risques limités
Définir les contraintes : budgets maximums, règles d'escalade, garde-fous opérationnels
Instrumenter la mesure : KPIs de performance, journalisation des décisions, mécanismes d'alerte
Démarrer avec supervision rapprochée : vérification quotidienne au début, puis hebdomadaire une fois stabilisé
Itérer rapidement : ajuster les prompts, affiner les outils, corriger les dérives identifiées

Cette approche empirique, identique à celle d'Anthropic, permet d'apprendre dans votre contexte spécifique plutôt que d'attendre des solutions universelles.

Les ressources pour démarrer

Documentation officielle Anthropic : guides techniques sur l'utilisation de Claude pour l'automatisation, bonnes pratiques de prompting pour tâches longues.

Agent Skills marketplace : bibliothèque de compétences pré-construites adaptables à vos besoins, notamment pour l'analyse financière, la gestion documentaire, ou le support client.

Communauté IA française : initiatives comme "Osez l'IA" mobilisent des ambassadeurs pour accompagner les PME dans leur transformation. Découvrez le programme.

Accompagnement spécialisé : faire appel à une agence IA permet d'éviter les erreurs classiques et d'accélérer l'adoption.

gestion logistique automatisee intelligence artificielle apsodia

Ce qu'il faut retenir du Project Vend

L'expérience d'Anthropic démystifie l'autonomie IA. Claudius n'était pas une superintelligence prête à diriger Amazon. Mais ce n'était pas non plus un jouet sans valeur pratique.

La vérité se situe dans la nuance : l'IA actuelle excelle sur des tâches structurées, échoue sur des jugements complexes, et progresse rapidement. Les PME qui comprennent ces forces et faiblesses peuvent exploiter l'automatisation dès maintenant pour des gains concrets, tout en se préparant aux évolutions futures.

Claudius a démontré qu'une IA peut gérer un stock, interagir avec des clients, sourcer des produits, et exécuter des processus administratifs pendant des semaines. Ses échecs ont révélé où la supervision humaine reste indispensable : jugement commercial, gestion de situations ambiguës, défense stratégique des marges.

Pour les dirigeants de PME, le message est clair : l'automatisation IA n'est plus une question de "si", mais de "comment" et "quand". Ceux qui expérimentent maintenant, avec méthode et pragmatisme, construisent l'avantage compétitif de demain.

Vous souhaitez explorer comment l'intelligence artificielle peut transformer vos processus métier ? Chez Apsodia, nous accompagnons les entreprises françaises dans l'intégration stratégique de l'IA. De l'automatisation de devis à l'optimisation de workflows complexes, nous transformons l'innovation technologique en résultats business mesurables.

Consultez nos réalisations pour découvrir comment nous combinons création de sites web et intelligence artificielle pour créer des solutions digitales performantes.

Pour aller plus loin

Video complète : Project Vend sur YouTube - L'expérience racontée par les équipes d'Anthropic
Article de recherche : Project Vend: Can Claude run a small shop? - Analyse détaillée avec données et graphiques
Agent Skills : Découvrez comment les Skills Claude pourraient résoudre certaines limitations de Claudius
Cas d'usage IA : Explorez comment l'IA transforme le e-commerce avec des plateformes comme Perplexity

‍

Automatisez vos premiers processus métier

Vous avez identifié des tâches répétitives qui freinent votre croissance ?

Réserver mon diagnostic IA