Repenser l'infrastructure

L’autonomie des IA n’est pas le futur. C’est un chantier d’infrastructure qui a déjà commencé.

L’IA agentique, c’est un peu comme si votre SI avait décidé de se mettre au parkour.

Hier encore, il marchait sagement sur les trottoirs des workflows classiques. Aujourd’hui, il bondit d’un service à l’autre, escalade les API, et traverse des pipelines sans prévenir. Et comme tout athlète improvisé, il réclame soudain plus de muscles, plus de souffle, plus de supervision. Les CTO, eux, doivent assurer que cette nouvelle gymnastique ne casse pas les murs porteurs.

Dans ce grand cirque numérique, les agents IA ne sont pas de simples modèles qui répondent poliment à des prompts. Ce sont des exécutants autonomes, capables d’enchaîner des tâches complexes, de déclencher des actions réelles, et de consommer votre infrastructure comme un marathonien en crise de boulimie. Et à mesure que les organisations s’emballent pour ce nouvel eldorado, la tension monte dans les data centers.

Car pendant que les dirigeants parlent de "réinvention" et de "nouveaux modèles d’autonomie", les faits sont là : 23 % des organisations déploient déjà l’IA agentique à grande échelle, 39 % expérimentent, et 69 % des dirigeants estiment que c’est maintenant que se joue la transformation profonde de leurs systèmes.

Bienvenue dans l’ère où l’architecture réseau, les plateformes internes et les pipelines de données deviennent le garde-fou indispensable pour éviter que les agents ne transforment votre SI en circuit chaotique.

Quand les agents passent en production, l’infrastructure transpire

Si vous cherchez une démonstration concrète de ce que peut faire l’IA agentique, regardez du côté des entreprises qui ont déjà plongé dans le bain. Les cas d’usage ne sont plus des prototypes de laboratoire.

FinTech, retail, industrie, IT Ops : tout le monde a commencé à déléguer des opérations autonomes à des agents. Et les résultats donnent autant de raisons d’être impressionné que de transpirer.

Prenons Klarna, par exemple. L’entreprise a déployé un agent d’assistance client qui gère désormais 2,3 millions de conversations. L’équivalent de plus de 853 agents humains. Temps de résolution divisé par cinq. Coût par transaction en chute libre, passant de 0,32 dollar à 0,19 en deux ans. Résultat : 60 millions d’économies. Un cas parfait pour démontrer qu’un agent peut scaler plus vite qu’une équipe de support en pleine campagne de remboursement.

Mais ce genre de performance n’est pas magique. Il dépend d’un SI qui encaisse les chocs. Car derrière chaque requête traitée en quelques secondes, il y a une orchestration de données, de modèles et de micro-services qui tourne vite, fort et longtemps. Et la moindre faiblesse dans les fondations peut entraîner une avalanche de problèmes : saturation des API, explosion des logs, files d’attente qui s’allongent et métriques qui s’affolent.

Siemens, de son côté, illustre parfaitement la bascule vers le support IT autonome à l’échelle industrielle. Son agent IA, déployé avec Moveworks, répond aux besoins de plus de 250 000 employés répartis sur près de 200 pays. Réinitialisation automatique de caches, diagnostics d’incidents, scripts de correction : l’IA agit avant même que les équipes n’aient levé les yeux. Et tout cela repose sur une architecture pensée pour absorber un afflux permanent de requêtes distribuées. On parle ici de latence maîtrisée à l’échelle globale, de pipelines de données multilingues et de supervision temps réel.

Les cas IBM AIOps montrent quant à eux que l’IA agentique peut contrecarrer le fléau historique des équipes IT : le tsunami d’alertes. En filtrant, corrélant et priorisant automatiquement les signaux, l’IA redonne de l’oxygène aux équipes. Mais là encore, tout repose sur une infrastructure capable de traiter des millions d’événements et d’exécuter des automatismes fiables sans effet domino.

Et pendant que Walmart optimise ses stocks en temps réel ou qu’H&M améliore le panier moyen de ses visiteurs, une réalité devient évidente : plus l’IA prend d’autonomie, plus le SI doit être robuste.

Le nouveau visage du DevOps : plus d’automatisation, plus de risques

Les CTO le sentent venir : la montée des agents autonomes, c’est l’arrivée d’un colocataire hyperactif dans leur stack. Il produit du code. Il déclenche des scripts. Il crée des workflows. Il parle à des APIs que personne n’avait touchées depuis 2014. Et il ne dort jamais.

Selon Harness, ce flux de code généré par l’IA va créer un paradoxe très 2025 : plus de productivité, mais aussi plus de dette technique et de surface d’attaque. Certaines équipes voient déjà des agents capables de générer plusieurs centaines de commits par jour, obligeant à revoir les processus de revue, la gouvernance des pipelines CI/CD et la définition même de la qualité logicielle. Des organisations ont créé des « safety modes » où, durant les 30 premiers jours, tout commit issu d’un agent doit être validé par un humain, comme un permis de conduire supervisé.

Dans certains groupes, des dashboards Grafana dédiés permettent désormais de tracer chaque action agentique : appels API, modifications de configuration, accès aux secrets, génération de code. On voit même émerger des « diffs intelligents » qui résument automatiquement les changements produits par l’agent pour aider les reviewers.

La réponse stratégique ? Un renforcement massif du Platform Engineering. Kubernetes devient l’arène dans laquelle les agents sont isolés, surveillés et soumis à des quotas stricts. Les Internal Developer Platforms orchestrent l’authentification, la gouvernance, les permissions, les limites de ressources et les validations. OPA/Open Policy Agent fixe les règles, LangGraph ou CrewAI gèrent les workflows agentiques, Weights & Biases ou WhyLabs assurent le monitoring des comportements.

Autrement dit : l’autonomie, oui. Mais sous contrôle, traçable, contextualisée, et surtout bornée.

Les pièges à éviter : le vrai retour d’expérience des early adopters

Les entreprises qui ont sauté tôt dans l’aventure de l’IA agentique l’ont appris parfois brutalement : l’autonomie sans gouvernance crée plus de chaos que d’efficacité. Klarna, malgré ses performances spectaculaires, a constaté que certains cas complexes étaient mal gérés par l’agent, nécessitant un rééquilibrage entre automatisation et intervention humaine. D’autres organisations ont sous-estimé le coût de supervision nécessaire : logs multipliés, dashboards en surcharge, équipes obligées de créer des rôles d’« AI wranglers » chargés de corriger les dérives en continu.

Et puis, il y a les entreprises qui ont joué à l’apprenti sorcier, en remplaçant des équipes entières par des IA avant même d’avoir compris comment les agents se comporteraient en production. Beaucoup ont fait machine arrière. Car l’autonomie, lorsqu’elle n’est pas cadrée, peut entraîner des comportements inattendus : réponses violant la confidentialité, décisions illégitimes, ou impossibilité de gérer les cas non standards. Certaines situations ont même viré au burlesque : lorsqu’un service critique tombe — pensez à un acteur majeur du cloud victime d’une panne mondiale — et que les agents, privés de leurs API, se retrouvent à errer comme des robots de séries B, incapables de répondre aux clients.

C’est exactement pour cela que les early adopters convergent désormais vers la même pratique : déployer un agent comme on introduit une recrue junior hyperactive — avec des limites, une montée progressive en autonomie, et des procédures de rollback rapides.

Choisir entre développer sa propre solution ou suivre la course aux LLM

Entre deux réunions, un CTO en 2025 ressemble souvent à un commentateur sportif qui surveille plusieurs championnats en même temps. Un jour, c’est Gemini qui affole les compteurs. La semaine suivante, c’est OpenAI qui sort un modèle qui pulvérise les benchmarks. Puis Anthropic surgit avec une mise à jour « plus fiable », avant que Mistral ne balance un modèle open source qui surprend tout le monde. Cette volatilité rend la prise de décision presque comique : ce que vous choisissez aujourd’hui peut être dépassé vendredi.

Mais dans la pratique, la règle n’est pas de courir derrière le modèle du moment. La règle est beaucoup plus terre-à-terre : choisir ce qui fonctionne pour votre usage, à moindre coût, avec un contrôle maximal sur les dérives.

Développer sa propre solution offre une maîtrise totale… mais demande des compétences rares, une architecture sur-mesure, et une supervision continue. S’appuyer sur des LLM externes réduit le time-to-market, mais expose votre SI à des aléas de performances, de coûts, et de comportements parfois imprévisibles. Et chaque erreur coûte des tokens. Beaucoup de tokens.

C’est là que l’ingénierie sérieuse commence : limiter les hallucinations via des garde-fous, optimiser la consommation, protéger les requêtes sensibles, et empêcher un agent enthousiaste de répondre à une question piégée du type : « Qui va être viré dans l’entreprise ? ». Imaginons un instant un chatbot connecté à un RAG mal filtré, qui tombe sur un document marketing interne évoquant une réduction d’effectifs prévue pour Q4. Catastrophe assurée.

L’enjeu n’est donc pas de savoir quel modèle gagnera la bataille des benchmarks, mais d’établir l’architecture qui évite les dérives, minimise les coûts, et assure la confidentialité.

Les questions que tout CTO devrait se poser

Avant de lâcher un agent autonome dans la nature, les organisations les plus mûres passent systématiquement par un petit examen de conscience technique. Pas un audit complet, juste cinq questions simples — mais implacables — qui permettent de savoir si l’entreprise est prête.

La première : l’infrastructure tiendra-t-elle la cadence ? Pas seulement en montée en charge, mais aussi en imprévisibilité. Ensuite vient la gouvernance : chaque action agentique est-elle traçable, bornée, réversible ? Troisième point : que se passe-t-il quand quelque chose casse — une API, une dépendance externe, ou un cloud entier qui trébuche ? La quatrième question touche au portefeuille : les tokens, le GPU et la supervision sont-ils dimensionnés pour éviter l’effet « facture surprise » ? Enfin, l’humain : les équipes sont-elles formées, rassurées, organisées pour travailler avec un acteur autonome qui ne pense pas comme elles ?

Les cinq questions essentielles :

1

Notre infrastructure tiendra-t-elle la cadence ? L’architecture est-elle suffisamment scalable et résiliente pour encaisser des charges irrégulières et des workflows autonomes ?
2

La gouvernance est-elle solide ? Chaque action d’un agent est-elle tracée, limitée, et réversible en cas de dérive ?
3

Que se passe-t-il quand quelque chose casse ? Panne d’API, dépendance externe qui s’écroule, cloud en vrac : l’entreprise est-elle prête au rollback instantané ?
4

Le modèle économique est-il sous contrôle ? Les coûts de tokens, de supervision, de compute ou de GPU sont-ils anticipés pour éviter les mauvaises surprises ?
5

Les équipes sont-elles prêtes ? Formées, alignées, rassurées — capables de collaborer avec un acteur autonome qui ne raisonne pas comme un humain.

Le défi énergétique et financier : l’éléphant dans la salle serveur

Tandis que les agents se multiplient, un autre paramètre grimpe en flèche : la consommation d’infrastructure. Les projections annoncent un investissement mondial pouvant atteindre 6 700 milliards de dollars entre 2025 et 2030 pour permettre aux entreprises de suivre la demande croissante liée à l’IA.

Ce chiffre paraît irréel, mais il reflète une réalité simple : plus d’agents signifie plus de modèles, plus de GPU, plus de bande passante, plus de stockage et plus de redondance. Et à l’échelle d’un groupe du Fortune 500, la facture ressemble vite à une négociation de rachat d’entreprise.

Si l’adoption accélère — 51 % d’entreprises ont déjà des agents en production et 35 % prévoient de suivre dans les deux ans —, c’est parce que le retour sur investissement donne le vertige. 62 % des dirigeants s’attendent à un ROI supérieur à 100 %. Certains, selon les analyses Forrester, visent même une rentabilité entre 200 et 400 %. Et 74 % affirment avoir déjà observé un retour dès la première année.

Cet appétit pour l’IA est donc soutenu par des résultats convaincants, mais il force les CTO à revoir leur stratégie économique : architecture, énergie, contrats cloud, modèles d’approvisionnement, arbitrages entre GPU et CPU, entre hyperscalers et edge computing.

C’est toute la géographie de l’infrastructure qui se redessine.

Ce que les CTO doivent retenir : l’IA agentique n’est pas une fonctionnalité, c’est une refonte

Lorsque les agents deviennent autonomes, les architectures doivent changer. Pas un peu. Pas symboliquement. En profondeur.

Les CTO doivent désormais penser en termes de flux continus, de supervision automatisée, de plateformes intégrées et de contraintes énergétiques. Ils doivent arbitrer entre performance et soutenabilité. Ils doivent intégrer la sécurité dès le design. Et surtout, ils doivent préparer leurs équipes à collaborer avec des systèmes proactifs, pas réactifs.

Nous n’entrons plus dans l’ère où l’IA vient épauler des humains. Nous entrons dans l’ère où l’IA agit, déclenche, exécute. Et où l’humain orchestre.

La question n’est plus "Faut-il adopter l’IA agentique ?". Elle est : "Votre infrastructure est-elle prête à supporter ce nouveau mode opératoire ?".

Les organisations qui répondront oui seront celles qui auront transformé leur SI en véritable écosystème résilient, capable d’accueillir des essaims d’agents autonomes sans perdre en sécurité, en performance ou en lisibilité.

L’IA agentique n’est pas une révolution technologique. C’est un nouveau modèle opératoire. Et il est en train de redéfinir le rôle des CTO.

À eux désormais d’ouvrir la voie et d’explorer les architectures qui permettront à leurs agents de courir vite, longtemps… et sans détruire la piste au passage.

Sources & Références

McKinsey – State of AI Accenture – Tech Vision 2025 WebProNews – AI 2025 Harness – DevOps Predictions 2025