Cloudflare Agents est une plateforme de développement d'agents IA construite sur le réseau mondial de Cloudflare. Avec Durable Objects pour l'exécution avec état, Workers AI pour l'inférence serverless et une tarification flexible à l'utilisation, les développeurs peuvent créer des agents intelligents avec un état persistant et des capacités en temps réel.




Le développement d'agents IA représente l'un des défis les plus complexes auxquels font face les développeurs modernes. Contrairement aux applications web traditionnelles, les agents conversationnels nécessitent une gestion étatisée sophistiquée, des connexions persistantes et une orchestration intelligente d'outils externes. Ces exigences techniques dépassent souvent les capacités des architectures sans serveur conventionnelles, créant une friction significative dans le processus de développement.
Cloudflare Agents répond à ces défis en construisant sur l'infrastructure mondiale de Cloudflare, présente dans 330 villes à travers plus de 125 pays. Cette plateforme traite quotidiennement en moyenne 93 millions de requêtes HTTP et代理约 20% du trafic Web mondial. Cette envergure mondiale garantit une latence minimale pour les utilisateurs finaux, quel que soit leur emplacement géographique.
La proposition de valeur de Cloudflare Agents repose sur trois piliers technologiques fondamentaux. Premièrement, Durable Objects fournit une exécution persistante véritablement étatisée, où chaque agent fonctionne comme un micro-serveur autonome avec un état qui survit aux déploiements et aux périodes d'inactivité. Deuxièmement, Workers AI permet une inférence sans serveur sur GPU,支持Llama、Claude、Gemini等主流模型,按需调用,无需基础设施管理。 Troisièmement, le modèle de facturation au的使用详情透明,无 egress 费用。
Un cas d'utilisation concret illustre ces capacités : Knock a utilisé Cloudflare Agents SDK pour construire un serveur MCP distant, démontrant la capacité de la plateforme à intégrer des flux de travail complexes dans des environnements de production.
@callable() pour définir le comportement des agentsLa plateforme propose un ensemble complet de fonctionnalités conçues pour simplifier le développement d'agents IA tout en offrant une flexibilité technique maximale. Chaque composant a été pensé pour résoudre des problèmes spécifiques rencontrés par les développeurs d'applications conversationnelles.
Le SDK Agent repose sur une approche Orientée Objet familière aux développeurs TypeScript. Les agents sont définis comme des classes héritant de la classe de base Agent, avec des méthodes exposées via le décorateur @callable(). Cette architecture permet une intégration naturelle avec les outils de développement existants et offre une expérience de débogage supérieure. La prise en charge des connexions WebSocket avec hibernation réduit significativement les coûts d'exploitation en停止计费 lorsque les connexions sont inactives mais maintenues.
Chaque agent bénéficie d'une base de données SQLite intégrée et d'un système de gestion d'état clé-valeur. L'état persiste automatiquement à travers les déploiements et les cycles d'hibernation, éliminant le besoin de solutions de stockage externes. Cette fonctionnalité s'avère particulièrement précieuse pour les applications nécessitant une mémoire conversationnelle ou le suivi de préférences utilisateur complexes.
Pour les cas d'utilisation standard, AIChatAgent fournit une implémentation prête à l'emploi intégrant le SDK ai de Vercel. Le support natif de streamText permet des réponses en streaming, tandis que le hook React useAgentChat accélère le développement d'interfaces utilisateur conversationnelles. La reconnexion automatique après les interruptions réseau garantit une expérience utilisateur fluide.
La plateforme offre une flexibilité totale dans le choix des modèles IA. Workers AI intègre nativement des modèles tels que Llama 3.1/3.2/3.3, Mistral, DeepSeek R1, Gemma et Qwen. Pour les besoins spécifiques, l'AI Gateway permet une connexion unifiée aux modèles tiers comme OpenAI GPT-4, Anthropic Claude et Google Gemini.
Les méthodes décorées avec @callable() deviennent automatiquement des outils invocables par les agents. Cette approche simplifie l'intégration avec des services externes et le protocole MCP (Model Context Protocol) permet d'exposer des agents comme serveurs pour d'autres agents, créant un écosystème d'agents interconnectés.
L'API WebSocket des Durable Objects combinée à l'hibernation offre une solution élégante pour les applications temps réel. Pendant les périodes d'inactivité, l'agent entre en hibernation,停止计费 durée mais maintient la connexion active. Cette optimisation réduit considérablement les coûts pour les applications avec des pics d'activité imprévisibles.
Le Scheduler API intégré prend en charge les expressions cron, les exécutions différées et la planification récurrente. Cette fonctionnalité permet d'automatiser des workflows complexes nécessitant des actions périodiques sans infrastructure supplémentaire.
L'API de rendu de navigateur permet de lancer des navigateurs headless pour le scraping web, la capture d'écrans et l'automatisation d'interactions网页动态内容提取。
L'architecture de Cloudflare Agents repose sur l'intégration synergique de plusieurs services Cloudflare, créant une plateforme cohérente pour le développement et le déploiement d'agents IA.
Au cœur de la plateforme, Durable Objects fournit des micro-serveurs avec état qui persistent automatiquement. Chaque agent s'exécute au sein d'un Durable Object, garantissant un isolat exclusif avec une mémoire propre. Cette architecture élimine les problèmes de concurrence et simplifie considérablement le développement d'applications stateful. L'état est automatiquement synchronisé à travers les déploiements et survit aux redémarrages, offrant une durabilité quasi-absolue sans configuration complexe.
Workers AI permet l'exécution de modèles de langage sur l'infrastructure GPU de Cloudflare sans gestion de serveurs. Le système de facturation par Neurons garantit que seuls les ressources de calcul effectivement utilisées sont facturées. Les modèles_SUPPORTED incluent Llama 3.1 70B, DeepSeek R1, Mistral 7B, avec des mises à jour régulières du catalogue. L'optimisation de l'utilisation GPU permet des performances de Inference compétitives avec les providers cloud traditionnels.
Vectorize fournit des capacités de recherche sémantique essentielles pour les applications RAG (Retrieval-Augmented Generation). L'intégration native avec Workers AI permet des pipelines de recherche vectorielle efficaces, réduisant les hallucinations des modèles et améliorant la pertinence des réponses.
D1 offre une base de données SQL SQLite serverless avec synchronisation d'état automatique vers les clients. Cette solution intégrée élimine la nécessité de configurer des connexions de base de données externes et simplifie l'architecture des applications.
Workflows garantit l'exécution fiable de processus métier complexes avec support natif pour les retries automatiques, la persistance d'état et la reprise après échec. Cette fonctionnalité permet de traiter des tâches s'étendant sur plusieurs jours, avec une visibilité complète sur l'avancement et les points de défaillance.
L'architecture supporte une échelle massive, avec une capacité démontrée de dizaines de millions d'instances simultanées. L'optimisation de la facturation GPU ne facture que le temps CPU effectif, pas le wall time. Pour les WebSockets, l'hibernation停止计费 durée tout en maintenant les connexions actives.
Pour les applications de production, combinez Durable Objects pour la persistance, D1 pour les données relationnelles, et Vectorize pour la recherche sémantique. Cette组合 offre un équilibre optimal entre performance, coût et maintenabilité.
Cloudflare Agents propose un flux de configuration rationalisé permettant aux développeurs de créer un agent fonctionnel en quelques minutes.
确保具备以下环境:Node.js 18+、npm 和 Cloudflare 账户。wrangler CLI 可通过 npm 全局安装。
npm i agents
npx create-cloudflare@latest --template cloudflare/agents-starter
cd agents-starter && npm install
npm run dev
Ces trois commandes génèrent un projet complet incluant un agent de démonstration fonctionnel avec chat IA, appels d'outils et planification de tâches.
L'exemple Lunch Agent illustre les concepts fondamentaux :
export class LunchAgent extends Agent<Env, LunchState> {
@callable()
async nominateRestaurant(restaurantName: string) {
// Logique de nomination de restaurant
}
@schedule('weekdays at 11:30pm')
async chooseLunch() {
// Sélection quotidienne du déjeuner
}
}
Cet exemple démontre la définition de méthodes appelables, la gestion d'état et la planification de tâches cron.
Pour le déploiement en production :
npx wrangler deploy
La commande wrangler gère automatiquement le provisionnement de l'infrastructure et la configuration du domaine.
Utilisez npm run dev pour le développement local avec rechargement à chaud. Pour la production, privilégiez toujours le déploiement via Wrangler pour bénéficier de l'infrastructure mondiale de Cloudflare et des optimisations automatiques.
Le modèle de tarification Cloudflare Agents suit une approche transparente avec des forfaits gradués adaptés aux différents stades de développement et aux exigences de production.
| Fonctionnalité | Free | Payant |
|---|---|---|
| Requêtes | 10万/jour | 1000万/mois |
| Temps CPU | 10ms/requête | 30 millions ms/mois |
| Workers KV | 100K lectures/jour | 10 millions/mois |
| D1 lectures | 5 millions/jour | 25 milliards/mois |
| Durable Objects | 100K requêtes/jour | 1 million/mois |
| Abonnement | Offert | 5 $/mois |
Les dépassements sont facturés à 0,30 $/million de requêtes et 0,02 $/million de ms CPU.
| Modèle | Entrée (par million tokens) | Sortie (par million tokens) |
|---|---|---|
| Llama 3.2 1B | 0,027 $ | 0,201 $ |
| Llama 3.2 3B | 0,051 $ | 0,335 $ |
| Llama 3.1 8B | 0,282 $ | 0,827 $ |
| Llama 3.1 70B | 0,293 $ | 2,253 $ |
| DeepSeek R1 | 0,497 $ | 4,881 $ |
La plateforme offre 10 000 Neurons quotidiens gratuits, idéal pour le développement et les tests. Les dépassements coûtent 0,011 $/millier de Neurons.
Plusieurs mécanismes réduisent automatiquement les coûts d'exploitation. La facturation du temps CPU uniquement (sans temps d'attente I/O) et l'hibernation WebSocket (arrêt de la facturation durée en inactivité) sont incluses par défaut. L'absence de frais d'egress pour R2 et D1 élimine les surprises sur les coûts de bande passante.
Commencez avec le forfait Free pour valider votre cas d'utilisation. Les 10 000 Neurons quotidiens et les 100 000 requêtes suffisent pour le développement initial. Migrez vers le forfait Payant (5 $/mois) uniquement lorsque les limites Free deviennent restrictives.
L'écosystème Cloudflare Agents s'intègre profondément avec l'infrastructure Cloudflare existante et les outils tiers, créant une plateforme ouverte et extensible.
Le protocole Model Context Protocol permet l'intégration avec une variété de serveurs MCP pour Slack, GitHub, bases de données et services cloud. Les développeurs peuvent construire des serveurs MCP distants hébergés sur Cloudflare, comme démontré par le cas Knock, et les exposer à d'autres agents pour une collaboration inter-services.
L'AI Gateway fournit une interface unifiée pour connecter les modèles OpenAI, Anthropic Claude et Google Gemini. Cette abstraction permet de basculer entre les providers sans modification du code applicatif, facilitant l'optimisation des coûts et la conformité.
L'écosystème inclut Workers Playground pour les tests interactifs, la CLI Wrangler pour le déploiement et l'intégration avec Chrome DevTools pour le débogage. Le support TypeScript complet avec types générer offre une autocomplete et une vérification de types excellentes.
Le dépôt GitHub contient des exemples fonctionnels 包括 Lunch Agent、Chat Agent 和 Slack Agent。开发者社区 Discord 拥有数万名成员,提供支持和交流平台。
La plateforme maintient les certifications SOC 2 et la conformité GDPR, avec un centre de ressources complet pour les exigences réglementaires. L'intégration avec les systèmes enterprise existants est supportée via les API REST et les webhooks.
Pour étendre rapidement les capacités de votre agent, commencez par l'intégration MCP. La protocole标准化的特性使得连接 Slack、GitHub 等外部服务变得简单,无需大量自定义代码。
Cloudflare Agents构建在Durable Objects之上,提供真正的有状态执行。每个Agent是持久化的微服务器,状态自动跨部署和休眠持久化,无需外部状态管理。相比传统无状态框架,这简化了架构并提高了可靠性。
使用 npx create-cloudflare@latest --template cloudflare/agents-starter 三行命令即可启动,包含AI聊天、工具调用、任务调度的完整功能。详见文档:https://developers.cloudflare.com/agents/getting-started/quick-start/
支持Workers AI内置模型(Llama、Mistral、DeepSeek、Gemma等)和通过AI Gateway连接的OpenAI、Anthropic Claude、Google Gemini等第三方模型。具体模型列表和定价见:https://developers.cloudflare.com/workers-ai/platform/pricing/
Workers Paid计划$5/月起,包含1000万请求和3000万CPU ms。Workers AI按Neurons计费,$0.011/千神经元,每日免费10,000 Neurons。详细定价:https://developers.cloudflare.com/workers/platform/pricing/
可以。Durable Objects支持长时间运行,CPU时间上限5分钟/请求(可配置),定时任务可达15分钟。配合Workflows可处理数天甚至数周的任务,支持企业级可靠性要求。
Workflows提供自动重试、持久状态、保证执行。配合告警和可观测性工具(Logs、Traces)可实现企业级可靠性。详见:https://developers.cloudflare.com/workers/platform/workflows/
完全支持。可以构建MCP服务器供其他Agent调用,也可以作为MCP客户端连接外部MCP服务器。详见文档:https://developers.cloudflare.com/agents/
Découvrez les derniers outils IA et boostez votre productivité dès aujourd'hui.
Parcourir tous les outilsCloudflare Agents est une plateforme de développement d'agents IA construite sur le réseau mondial de Cloudflare. Avec Durable Objects pour l'exécution avec état, Workers AI pour l'inférence serverless et une tarification flexible à l'utilisation, les développeurs peuvent créer des agents intelligents avec un état persistant et des capacités en temps réel.
Photos de rencontre IA qui vous procurent réellement des matches
Plateforme complète de génération vidéo par IA
Plus de 1000 modèles sans code sélectionnés en un seul endroit
Une app. Votre business de coaching entier
Constructeur de sites web IA pour tous
Nous avons testé les meilleurs outils d'écriture IA pour blogs et trouvé les 5 meilleurs pour le SEO. Comparez Jasper, Frase, Copy.ai, Surfer SEO et Writesonic — avec tarifs, fonctionnalités et avis honnêtes.
Comparez les principaux frameworks d'agents IA : LangGraph, CrewAI, AutoGen, OpenAI Agents SDK et LlamaIndex. Trouvez le meilleur framework pour construire des systèmes multi-agents.