Skip to contentCloudflareのRust製推論エンジンとロスレス圧縩22%圧縮技術、AlibabaのZhenwu M890チップとQwen3.7-Maxによる35時間自律コーディングデモを解説する。
非トランスフォーマー型LLMの商用登場、欧米主権AI連合の誕生、エッジ推論の進化、そして企業向けエージェントの本番移行が同時進行する激動の5月を概観する。
DeepSeek V4がMITライセンスでオープンソース化され、推論コストの構造が激変。Cloudflareはエージェント専用インフラ「Infire」で分散推論の基盤を整備。モデルの賢さより“動かす地盤”の設計が競争軸になりつつあります。