為執行大型 LLM 建立基礎
2026-04-16
我們建置了自訂技術堆疊,以在 Cloudflare 的基礎架構上執行高速的大型語言模型。本文探討了為了實現高可用、高效能的 AI 推斷,所涉及的工程權衡取捨與技術最佳化。...

Senior Manager, Engineering
2026-04-16
我們建置了自訂技術堆疊,以在 Cloudflare 的基礎架構上執行高速的大型語言模型。本文探討了為了實現高可用、高效能的 AI 推斷,所涉及的工程權衡取捨與技術最佳化。...
2026-03-19
Kimi K2.5 現已登陸 Workers AI,可協助您完全在 Cloudflare 的開發人員平台上為智慧體提供支援。瞭解我們如何最佳化推斷堆疊,並降低內部智慧體使用案例的推斷成本。 ...