Cloudflare, Inc. ha annunciato che il 2 aprile 2024 Workers AI è generalmente disponibile, fornendo l'infrastruttura end-to-end necessaria per scalare e distribuire modelli AI in modo efficiente e conveniente per la prossima era di applicazioni AI. Cloudflare dispone ora di GPU distribuite in oltre 150 città a livello globale, con il recente lancio a Città del Capo, Durban, Johannesburg e Lagos per le prime località in Africa, oltre che ad Amman, Buenos Aires, Città del Messico, Mumbai, Nuova Delhi e Seoul, per fornire un'inferenza a bassa latenza in tutto il mondo. Workers AI si sta espandendo anche per supportare i pesi dei modelli con una regolazione fine, consentendo alle organizzazioni di costruire e distribuire applicazioni più specializzate e specifiche per il dominio.

Oltre a Workers AI, AI Gateway di Cloudflare offre un piano di controllo per le applicazioni AI, consentendo agli sviluppatori di valutare e instradare dinamicamente le richieste a diversi modelli e provider, permettendo infine agli sviluppatori di utilizzare i dati per creare ottimizzazioni ed eseguire i lavori ottimizzati direttamente sulla piattaforma Workers AI.