Cloudflare, Inc. a annoncé le 2 avril 2024 la disponibilité générale de Workers AI, qui fournit l'infrastructure de bout en bout nécessaire pour mettre à l'échelle et déployer des modèles d'IA de manière efficace et abordable pour la prochaine ère d'applications d'IA. Cloudflare a maintenant déployé des GPU dans plus de 150 villes à travers le monde, et les a récemment lancés au Cap, à Durban, à Johannesburg et à Lagos pour les premiers sites en Afrique, ainsi qu'à Amman, Buenos Aires, Mexico, Mumbai, New Delhi et Séoul, afin de fournir une inférence à faible latence dans le monde entier. Workers AI s'étend également à la prise en charge de poids de modèles finement ajustés, permettant aux entreprises de créer et de déployer des applications plus spécialisées et spécifiques à un domaine.

En plus de Workers AI, Cloudflare AI Gateway offre un plan de contrôle pour les applications d'IA, permettant aux développeurs d'évaluer et d'acheminer dynamiquement les demandes vers différents modèles et fournisseurs, permettant éventuellement aux développeurs d'utiliser les données pour créer des réglages fins et exécuter les travaux de réglage fin directement sur la plateforme Workers AI.