Cloudflare Agents es una plataforma para desarrolladores de IA construida sobre la red global de Cloudflare. Con Durable Objects para ejecución con estado, Workers AI para inferencia serverless y precios flexibles por uso, los desarrolladores pueden crear agentes inteligentes con estado persistente y capacidades en tiempo real.




Desarrollar AI Agents robustos y escalables sigue siendo un desafío significativo para los equipos de ingeniería. Los desarrolladores enfrentan problemas recurrentes: la ejecución sin estado complica la gestión del contexto, mantener conversaciones largas requiere soluciones externas complejas, y los WebSockets permanente generan costos elevados durante períodos de inactividad. Estas limitaciones técnicas ralentizan la innovación y aumentan la complejidad operativa.
Cloudflare Agents emerge como una solución nativa de edge computing diseñada específicamente para construir Agents inteligentes. La plataforma está construida sobre la red global de Cloudflare, que abarca 330 ciudades en más de 125 países y procesa un promedio de 93 millones de solicitudes HTTP diarias. Esta infraestructura de borde permite ejecutar Agents con latencia mínima en cualquier ubicación geográfica, ofreciendo una experiencia fluida para usuarios distribuidos globalmente.
La propuesta de valor central de Cloudflare Agents combina tres pilares tecnológicos fundamentales. Primero, Durable Objects proporciona ejecución con estado real: cada Agent opera como un microservidor persistente donde el estado se mantiene automáticamente entre despliegues y períodos de hibernación, eliminando la necesidad de bases de datos externas para gestionar contexto. Segundo, Workers AI ofrece inferencia sin servidor con GPU, soportando modelos como Llama, Claude, Gemini y DeepSeek con facturación por Neurons utilizados. Tercero, el modelo de precios por uso garantiza que solo se paga por los recursos realmente consumidos, sin costos fijos ni cargos por capacidad inactiva.
Un caso de éxito concreto demuestra las capacidades de la plataforma: Knock utilizó Cloudflare Agents SDK para construir un servidor MCP remoto, lográndolo en tiempo récord y entregándolo directamente a sus clientes. Este ejemplo ilustra cómo la plataforma acelera el desarrollo de Agents complejos con integración de protocolos estándar.
@callable() para definir comportamiento de AgentsLa plataforma proporciona un conjunto completo de funcionalidades diseñadas para resolver los desafíos técnicos que enfrentan los desarrolladores de Agents. Cada característica está optimizada para integrarse con el ecosistema Cloudflare y ofrecer rendimiento de nivel de producción.
El Agent SDK representa el núcleo del framework. Construido sobre TypeScript, permite definir Agents mediante clases que heredan de la clase base Agent. Los métodos expuestos utilizan el decorador @callable() para crear endpoints RPC accesibles desde clientes y otros Agents. Esta arquitectura permite que los Agents mantengan estado interno mientras exponen interfaces limpias para interacción externa. El soporte nativo para WebSockets permite conexiones de larga duración, y la característica de Hibernation pausa la facturación cuando no hay actividad, manteniendo la conexión activa sin costos adicionales.
Cada Agent incluye almacenamiento SQLite integrado y estado clave-valor que se sincroniza automáticamente con el cliente. Esta funcionalidad elimina la necesidad de configurar bases de datos externas para gestionar contexto conversacional o estado de aplicación. El estado persiste entre despliegues y survives a los períodos de hibernación del Agent, proporcionando continuidad operativa sin configuración adicional.
Para casos de uso comunes, AIChatAgent ofrece una implementación lista para producción. Este Agent especializado proporciona chat AI con persistencia de mensajes, soporta streaming de respuestas mediante streamText, e incluye hooks de React como useAgentChat para integración directa con interfaces de usuario. La recuperación automática ante desconexiones garantiza una experiencia de usuario fluida.
La compatibilidad con múltiples modelos asegura flexibilidad arquitectónica. Workers AI incluye modelos como Llama 3.1, 3.2 y 3.3, Mistral, DeepSeek R1, Gemma y Qwen. Para requisitos específicos, la plataforma permite integrar modelos de terceros como OpenAI GPT-4, Anthropic Claude y Google Gemini mediante AI Gateway, proporcionando una capa unificada de abstracción.
El sistema de herramientas extiende las capacidades de los Agents más allá de la inferencia AI. Cualquier método decorado con @callable() puede invocarse como herramienta, permitiendo que Agents interactúen con APIs externas, operen bases de datos o ejecuten procesos de negocio complejos. La integración con MCP (Model Context Protocol) permite exponer herramientas para otros Agents y conectar con el ecosistema de servidores MCP disponibles.
La arquitectura técnica de Cloudflare Agents está diseñada para escalar a millones de instancias mientras mantiene latencia mínima y costos predecibles. Comprender estos componentes técnicos permite a los equipos arquitectónicos tomar decisiones informadas sobre integración.
Durable Objects constituye el fundamento de la ejecución con estado. Cada Agent se ejecuta dentro de un Durable Object, que es una instancia de servidor con estado propia. A diferencia de funciones serverless tradicionales que son efímeras, los Durable Objects persisten entre invocaciones. El estado se almacena en almacenamiento local SQLite y se sincroniza automáticamente con clientes conectados. Esta arquitectura permite que un Agent mantenga contexto conversacional, preferencias de usuario o estado de negocio sin recurrir a bases de datos externas.
Workers AI proporciona inferencia de modelos con GPU a través de una API serverless. Los modelos se ejecutan en infraestructura GPU optimizada de Cloudflare, con facturación basada en Neurons—una unidad que representa el procesamiento de tokens de manera eficiente. El modelo de precios esgranular: solo se paga el tiempo de CPU realmente utilizado, no el tiempo de pared (wall time). Esto permite optimización significativa de costos comparado con proveedores que cobran por duración de instancia.
Vectorize es la base de datos vectorial nativa para búsqueda semántica y aplicaciones RAG (Retrieval-Augmented Generation). Permite almacenar embeddings y realizar búsquedas de similitud con baja latencia, fundamental para construir Agents que necesitan acceder a conocimiento contextualizado.
D1 ofrece bases de datos SQL serverless con compatibilidad SQLite. La integración con Agents es directa: cada Durable Object puede acceder a su instancia D1 asociada para almacenamiento relacional estructurado.
Workflows extiende las capacidades más allá de ejecuciones de corta duración. Esta característica permite coordinar tareas de múltiples pasos con garantías de ejecución: reintentos automáticos ante fallos, estado persistente entre pasos, y soporte para tareas que duran días o semanas. Es ideal para procesos de negocio complejos que requieren intervención humana o ejecución prolongada.
La integración con MCP permite construir生态系统 de Agents cooperativos. Los servidores MCP exponen herramientas que pueden invocarse desde cualquier Agent, habilitando arquitecturas distribuidas donde diferentes Agents especializados colaboran para completar tareas complejas.
Para aplicaciones nuevas, comienza con Workers AI + Vectorize para RAG básico. Agrega D1 cuando necesites datos estructurados persistentes. Usa Workflows cuando los procesos de negocio requieran múltiples pasos o larga duración. Para arquitecturas multi-Agent, implementa Service Bindings para comunicación entre Agents con baja latencia.
Comenzar con Cloudflare Agents requiere mínimo setup y permite ver resultados en minutos. El ecosistema está diseñado para desarrolladores familiarizados con Node.js y TypeScript, ofreciendo una experiencia de desarrollo fluida desde el IDE hasta producción.
Requisitos previos: Node.js 18 o superior, npm, y una cuenta de Cloudflare. No se requiere configuración de infraestructura adicional.
La instalación se completa en cuatro comandos que bootstrapean un proyecto completo con ejemplos funcionales:
npm i agents
npx create-cloudflare@latest --template cloudflare/agents-starter
cd agents-starter && npm install
npm run dev
Este scaffold proporciona un Lunch Agent funcional que demuestra las capacidades principales del framework. El código ejemplo muestra la definición de un Agent como clase TypeScript:
export class LunchAgent extends Agent<Env, LunchState> {
@callable()
async nominateRestaurant(restaurantName: string) {
// Lógica de提名餐厅
}
}
El Agent de ejemplo incluye implementación completa de chat con IA, herramientas invocables, scheduler para tareas programadas, y estado persistente. Sirve como plantilla para cualquier caso de uso, desde chatbots hasta sistemas de automatización.
Para desarrollo local, npm run dev inicia un servidor de desarrollo con hot reload. Los logs detallados y el debugging integrado facilitan la identificación de problemas durante la construcción.
Despliegue a producción se realiza con Wrangler CLI:
npx wrangler deploy
El comando automáticamente configura Workers, Durable Objects y cualquier recurso adicional requerido. La URL pública queda disponible inmediatamente, lista para recibir tráfico de producción.
Durante desarrollo, usa npm run dev para testing local rápido. Para debugging avanzado, integra con Chrome DevTools o VS Code debugger. Antes de producción, configura environment variables para diferentes stages (dev, staging, prod). Implementa logging estructurado desde el inicio para facilitar troubleshooting.
El modelo de precios de Cloudflare Agents está diseñado para escalar desde experimentación gratuita hasta producción empresarial, con facturación granular que solo carga recursos efectivamente consumidos.
Workers Plan Comparison
| Plan | Requests | CPU Time | Monthly Cost |
|---|---|---|---|
| Free | 100,000/day | 10ms/request | $0 |
| Paid | 10M/month | 30M CPU ms/month | From $5/month |
El plan Free incluye 100,000 solicitudes diarias con 10ms de CPU por request—suficiente para desarrollo, testing y proyectos personales. El plan Paid comienza en $5/mes con 10 millones de solicitudes y 30 millones de CPU ms mensuales, con cargos adicionales por uso excedente: $0.30 por millón de requests y $0.02 por millón de CPU ms.
Workers AI Pricing (por millón de tokens)
| Model | Input | Output |
|---|---|---|
| Llama 3.2 1B | $0.027 | $0.201 |
| Llama 3.1 8B | $0.282 | $0.827 |
| Llama 3.1 70B | $0.293 | $2.253 |
| DeepSeek R1 | $0.497 | $4.881 |
Todos los modelos incluyen 10,000 Neurons gratuitos diarios para desarrollo y experimentación. Excedentes se facturan a $0.011 por cada 1,000 Neurons. El modelo de facturación por Neurons—en lugar de tiempo de ejecución—asegura costos predecibles independientemente de la eficiencia del modelo.
Durable Objects Pricing
| Resource | Free | Paid |
|---|---|---|
| Requests | 100K/day | 1M/month |
| Duration | 13K GB-s/day | 400K GB-s/month |
Esta estructura permite optimización de costos significativa. Un Agent con WebSocket que permanece inactivo por horas solo facturará los momentos de actividad real, mientras la conexión se mantiene abierta mediante hibernación sin costo adicional.
Comienza con el plan Free para validar tu caso de uso. Una vez que el tráfico alcance consistentemente los límites gratuitos, migra a Paid. Para optimizar costos, implementa hibernación en Agents con patrones de uso irregular y selecciona modelos apropiados para cada caso de uso—modelos más pequeños son significativamente más económicos.
Cloudflare Agents no es una plataforma aislada—está diseñado para integrarse con el ecosistema más amplio de herramientas y servicios que las équipes de desarrollo ya utilizan.
La compatibilidad con MCP (Model Context Protocol) abre puertas a integraciones profundas. El ecosistema MCP incluye conectores para Slack, GitHub, bases de datos PostgreSQL, MySQL, y muchos más. Los desarrolladores pueden construir servidores MCP personalizados que exponen herramientas específicas del negocio, permitiendo que cualquier Agent—ya sea construido en Cloudflare o externamente—invoque estas capacidades mediante el protocolo estándar.
La integración con AI Gateway proporciona abstracción sobre proveedores de modelos externos. Esto permite conectar con OpenAI, Anthropic Claude, y Google Gemini sin modificar código de aplicación. AI Gateway maneja autenticación, rate limiting, y logging centralizado, simplificando la operación de arquitecturas multi-proveedor.
El ecosistema de herramientas para desarrolladores incluye: Wrangler CLI para deployment y gestión, Workers Playground para experimentación sin setup, integración nativa con Chrome DevTools para debugging, y soporte completo para TypeScript con tipos generados automáticamente.
Los recursos comunitarios aceleran el aprendizaje: el repositorio GitHub incluye ejemplos como Lunch Agent, Chat Agent, y Slack Agent que demuestran patrones de implementación. La comunidad de Discord de Cloudflare—con decenas de miles de miembros—proporciona soportepeer-to-peer y discusión técnica activa.
Para implementaciones empresariales, la plataforma cuenta con certificaciones SOC 2 y cumplimiento GDPR, facilitando la adopción en entornos regulados. La integración con sistemas existentes se simplifica mediante APIs REST y webhooks.
Para expandir rápidamente las capacidades de tu Agent, comienza integrando con MCP servers existentes. Slack, GitHub, y databases son puntos de entrada comunes. Para casos de uso que requieren modelos específicos no disponibles en Workers AI, AI Gateway proporciona integración sin código con proveedores externos manteniendo una interfaz unificada.
Cloudflare Agents está construido sobre Durable Objects, proporcionando ejecución verdaderamente con estado. Cada Agent es un microservicio persistente donde el estado se mantiene automáticamente entre despliegues y períodos de hibernación—no requiere configuración de bases de datos externas ni soluciones de estado personalizadas. Esta arquitectura elimina la complejidad operacional de gestionar estado distribuido.
Usa el comando npx create-cloudflare@latest --template cloudflare/agents-starter. En tres líneas de terminaltendrás un Agent funcional completo con chat AI, herramientas invocables, y scheduler de tareas. El template incluye código de ejemplo documentado que sirve como punto de partida personalizable.
Workers AI incluye modelos propios: Llama 3.1, 3.2 y 3.3, Mistral, DeepSeek R1, Gemma, y Qwen. Para modelos de terceros, AI Gateway permite integrar OpenAI GPT-4, Anthropic Claude, y Google Gemini manteniendo una interfaz unificada. La selección de modelo depende del caso de uso—modelos más pequeños ofrecen menor latencia y costo.
El plan Workers Paid comienza en $5/mes con 10 millones de requests y 30 millones de CPU ms. Workers AI factura por Neurons consumidos—$0.011 por cada 1,000 Neurons con 10,000 gratuitos diariamente. Los costos son totalmente proporcionales al uso real sin cargos fijos por capacidad.
Sí. Durable Objects soporta ejecuciones de larga duración con límite de CPU de 5 minutos por request (configurable). Tareas programadas pueden ejecutarse hasta 15 minutos. Para procesos que duran días o semanas, Workflows proporciona coordinación de múltiples pasos con reintentos automáticos y estado persistente.
Workflows ofrece garantías de ejecución: reintentos automáticos ante fallos, estado persistente entre intentos, y observabilidad integrada mediante Logs y Traces. Para requisitos empresariales, puedes configurar alertas y dashboards de monitoreo para mantener SLAs establecidos.
Totalmente. Puedes construir servidores MCP que exponen herramientas para otros Agents, o actuar como cliente MCP conectando a servidores externos. El protocolo estándar permite arquitecturas distribuidas donde múltiples Agents colaboran mediante interfaces definidas.
Descubre las últimas herramientas de IA y mejora tu productividad hoy.
Explorar todas las herramientasCloudflare Agents es una plataforma para desarrolladores de IA construida sobre la red global de Cloudflare. Con Durable Objects para ejecución con estado, Workers AI para inferencia serverless y precios flexibles por uso, los desarrolladores pueden crear agentes inteligentes con estado persistente y capacidades en tiempo real.
Plataforma integral de generación de video con IA
Fotos de citas con IA que realmente consiguen matches
Más de 1000 plantillas sin código curadas en un solo lugar
Una app. Tu negocio de coaching completo
Constructor web con IA para todos
Cursor vs Windsurf vs GitHub Copilot — comparamos funciones, precios, modelos de IA y rendimiento real para ayudarte a elegir el mejor editor de código con IA en 2026.
Compara los principales frameworks de agentes IA incluyendo LangGraph, CrewAI, AutoGen, OpenAI Agents SDK y LlamaIndex. Encuentra el mejor framework para construir sistemas multi-agente.