【AIニュース】推論コスト6分の1と無料展開──TurboQuant・Gemma 4・Muse Sparkが示すAI民主化の現在地GoogleのTurboQuantがKVキャッシュを最大6分の1に圧縮しLLM推論を刷新。Gemma 4はスマホで動く高性能オープンモデルを実現し、MetaのMuse SparkはSNS34億人へフロンティアAIを無料開放した。