<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>MiniMax on hagizo.io</title><link>https://ha.gizwoo.com/tags/minimax/</link><description>Recent content in MiniMax on hagizo.io</description><generator>Hugo -- gohugo.io</generator><language>en</language><lastBuildDate>Sat, 06 Jun 2026 08:10:06 +0900</lastBuildDate><atom:link href="https://ha.gizwoo.com/tags/minimax/index.xml" rel="self" type="application/rss+xml"/><item><title>【AIニュース】オープンフロンティアと物理AIの台頭——MiniMax M3・Cosmos 3・ハイブリッド推論の衝撃</title><link>https://ha.gizwoo.com/minimax-cosmos-hybrid-inference-kpwmrnbxtz/</link><pubDate>Fri, 05 Jun 2026 00:00:00 +0900</pubDate><guid>https://ha.gizwoo.com/minimax-cosmos-hybrid-inference-kpwmrnbxtz/</guid><description>&lt;p&gt;2026年6月第1週、AI業界では「オープンモデルがクローズドの牙城を崩す」「ロボットと自動運転のためのAI基盤が整う」「デバイス上の推論が本格化する」という三つの潮流が同時に動いた。いずれも単なるスペック競争ではなく、AIの使われ方そのものを変えうる構造的な変化だ。&lt;/p&gt;
&lt;h2 id="minimax-m3オープン陣営がフロンティアの壁を突き破る"&gt;MiniMax M3：オープン陣営がフロンティアの壁を突き破る
&lt;/h2&gt;&lt;p&gt;6月1日、中国のスタートアップMiniMaxは&lt;a class="link" href="https://www.minimax.io/blog/minimax-m3" target="_blank" rel="noopener"
 &gt;M3&lt;/a&gt;を公開した。オープンウェイト（重みが公開されているためだれでも自由に使えるモデル）として初めて、&lt;strong&gt;100万トークンのコンテキストウィンドウ&lt;/strong&gt;・フロンティア級のコーディング性能・ネイティブな画像と動画の理解を一つのモデルに統合した。&lt;/p&gt;
&lt;p&gt;「100万トークン」とは、文庫本にして約700冊分のテキストを一度に参照できる長さだ。従来のGPT-4oクラスのモデルが扱う文脈の約100倍に相当する。&lt;/p&gt;
&lt;p&gt;アーキテクチャはMoE（Mixture-of-Experts：問題の種類によって使う回路を動的に切り替える方式）で、総パラメータ数は2299億だが、1トークンを処理するときに実際に動くのは98億分だけだ。新設計のMSA（MiniMax Sparse Attention：間引いた注意機構）により、100万トークンを処理するときの計算コストを従来比で1/20に抑えた。これは「2倍の長さで4倍の計算が必要」になる従来のアテンション（全トークン間の相関をまとめて計算する処理）の問題を実用的に解決したことを意味する。&lt;/p&gt;
&lt;p&gt;結果として、SWE-Bench Pro（GitHubのリアルなissueを自動解決するベンチマーク）で59.0%を達成し、GPT-5.5やGemini 3.1 Proを上回るスコアを記録した。&lt;/p&gt;
&lt;h3 id="実務上の示唆"&gt;実務上の示唆
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;コードレビューや長大なドキュメント分析など、「全体を見通しながら推論する」タスクで試す価値のある新しい選択肢が増えた&lt;/li&gt;
&lt;li&gt;オープンウェイトなのでオンプレミス（自社サーバー）やプライベートクラウドに展開できる。機密性の高い用途でフロンティア性能を使えるようになる&lt;/li&gt;
&lt;li&gt;MoEの特性上、推論時の実メモリ使用量は総パラメータ数よりずっと小さい。H100数枚程度のセットアップで動作する可能性がある&lt;/li&gt;
&lt;li&gt;コーディングエージェントや長文書分析ツールを開発・評価している場合、M3をベースラインとして比較対象に加える価値がある&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="nvidia-cosmos-3ロボットと自動運転のための世界モデルが開く"&gt;NVIDIA Cosmos 3：ロボットと自動運転のための「世界モデル」が開く
&lt;/h2&gt;&lt;p&gt;NVIDIAは6月1日のComputex/GTC Taipeiで&lt;a class="link" href="https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-3-the-open-frontier-foundation-model-for-physical-ai" target="_blank" rel="noopener"
 &gt;Cosmos 3&lt;/a&gt;を発表した。テキスト・画像・動画・環境音・ロボットの行動データを20兆トークン分（画像約10億枚・動画約4億本）で学習した、物理AIのための基盤モデルだ。&lt;/p&gt;
&lt;p&gt;「物理AI」とは、デジタルの言語だけでなく、重力・摩擦・衝突といった現実世界の物理法則を理解し、それに従って行動を生成できるAIのことを指す。ロボットアームが「このコップをそっと置く」という動作を正確に実行するには、言語理解だけでは不十分だ。「物理的な感覚」をデータから学んだモデルが必要になる。&lt;/p&gt;
&lt;p&gt;アーキテクチャはTwo-Tower Mixture-of-Transformersと呼ばれる設計で、高精度な訓練用の「Super」モデルとリアルタイム近傍推論用の「Nano」モデルの2種類が即座に公開された。Runway、Skild AI、Black Forest Labsなどとのコズモス連合（Cosmos Coalition）も同時に発足し、エコシステムの形成が始まっている。&lt;/p&gt;
&lt;p&gt;最大の意義は&lt;strong&gt;ロボットの訓練期間を月単位から日単位に圧縮できる可能性&lt;/strong&gt;だ。物理シミュレーションで大量の合成データを生成し、実機でのファインチューニングを最小化できれば、ロボット開発のコストと速度が根本から変わる。&lt;/p&gt;
&lt;h3 id="実務上の示唆-1"&gt;実務上の示唆
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;ロボティクスや自律走行に関わる開発者にとって、シミュレーションパイプラインの中核候補として評価する価値がある&lt;/li&gt;
&lt;li&gt;モデルがオープンウェイトで公開されているため、NVIDIA以外のハードウェアでも動かせる。研究機関にとってアクセスのハードルが大きく下がった&lt;/li&gt;
&lt;li&gt;世界モデル（World Model：環境の状態と変化を内部でシミュレートするモデル）という概念が研究フェーズから実用インフラへと移行しつつある。品質検査・設備保全・3D空間理解といった隣接領域への応用も視野に入る&lt;/li&gt;
&lt;li&gt;Cosmos 3とMiniMax M3が同日発表されたことは、オープンウェイトによるAI基盤の民主化が一気に加速したことを象徴している&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="perplexityデバイスかクラウドかを自動で判断するハイブリッド推論"&gt;Perplexity：「デバイスかクラウドか」を自動で判断するハイブリッド推論
&lt;/h2&gt;&lt;p&gt;6月5日のComputex 2026でPerplexity AIはIntelと共同開発した&lt;a class="link" href="https://venturebeat.com/technology/perplexity-ai-unveils-hybrid-local-cloud-inference-system-at-computex-2026" target="_blank" rel="noopener"
 &gt;ハイブリッドローカル・クラウド推論オーケストレーター&lt;/a&gt;を発表した。&lt;/p&gt;
&lt;p&gt;エッジ推論（ユーザーのPCやスマートフォン上でAIを処理すること）は近年急速に普及しているが、従来は「どのモデルを使うか」「クラウドに送るかどうか」をユーザーや開発者が手動で設定する必要があった。Perplexityのシステムはこれを自動化する。タスクの内容・データの機密度・必要な精度水準をリアルタイムで推定し、サブタスク単位で、しかも実行の途中でもクラウドと端末の間で処理先を切り替える。&lt;/p&gt;
&lt;p&gt;デモではIntelのCore Ultra Series 3搭載PCで「Personal Computer」エージェントを動作させた。カレンダーの予定確認や個人的なメモの参照はオンデバイスで処理し、複雑な計画立案やWebリサーチはクラウドモデルに委ねる、という動きを一つの会話フロー内で自動的に実現した。Nvidiaハードウェアのサポートも予定されている。&lt;/p&gt;
&lt;p&gt;プライバシー・レイテンシ（応答までの遅延）・コストのトレードオフを人間が判断しなくてよくなるとすれば、AIアシスタントの設計思想が根本から変わる。特に医療・法律・財務など機密性の高い領域での活用が広がる可能性がある。&lt;/p&gt;
&lt;h3 id="実務上の示唆-2"&gt;実務上の示唆
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;AIアシスタントや社内ツールを設計する際、「何をオンプレに置くか」という判断をユーザーに委ねないアーキテクチャが標準になりうる&lt;/li&gt;
&lt;li&gt;プライバシー要件の厳しい業界（医療・法務・金融）では、ハイブリッド設計がコンプライアンス上の武器になる&lt;/li&gt;
&lt;li&gt;現時点では一般公開前だが、「ローカルLLMとクラウドLLMを透過的に切り替えるミドルウェア」の需要が2026年後半に具体化するかもしれない&lt;/li&gt;
&lt;li&gt;アプリ開発者はオフラインファーストな設計とクラウド活用を両立させるアーキテクチャパターンの検討を今から始めると先手を打てる&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="まとめ"&gt;まとめ
&lt;/h2&gt;&lt;p&gt;今週の三つのニュースに共通するテーマは「オープン化と自律化の加速」だ。MiniMax M3はクローズドモデルだけのものとされてきたフロンティア性能をオープン陣営が手にしたことを示した。Cosmos 3はロボット・自動運転向けの物理AI基盤をオープンに解放し、訓練コストを劇的に下げる可能性を切り開いた。そしてPerplexityのハイブリッド推論は、端末とクラウドの境界を意識させずにAIを使える未来を具体的な形で示した。&lt;/p&gt;
&lt;p&gt;「どのモデルを選ぶか」「どこで処理するか」「何のデータで学習させるか」という問いへの答えが、2026年下半期に向けて大きく書き換えられようとしている。&lt;/p&gt;</description></item></channel></rss>