2026年6月第1週、AI業界では「オープンモデルがクローズドの牙城を崩す」「ロボットと自動運転のためのAI基盤が整う」「デバイス上の推論が本格化する」という三つの潮流が同時に動いた。いずれも単なるスペック競争ではなく、AIの使われ方そのものを変えうる構造的な変化だ。
MiniMax M3:オープン陣営がフロンティアの壁を突き破る
6月1日、中国のスタートアップMiniMaxはM3を公開した。オープンウェイト(重みが公開されているためだれでも自由に使えるモデル)として初めて、100万トークンのコンテキストウィンドウ・フロンティア級のコーディング性能・ネイティブな画像と動画の理解を一つのモデルに統合した。
「100万トークン」とは、文庫本にして約700冊分のテキストを一度に参照できる長さだ。従来のGPT-4oクラスのモデルが扱う文脈の約100倍に相当する。
アーキテクチャはMoE(Mixture-of-Experts:問題の種類によって使う回路を動的に切り替える方式)で、総パラメータ数は2299億だが、1トークンを処理するときに実際に動くのは98億分だけだ。新設計のMSA(MiniMax Sparse Attention:間引いた注意機構)により、100万トークンを処理するときの計算コストを従来比で1/20に抑えた。これは「2倍の長さで4倍の計算が必要」になる従来のアテンション(全トークン間の相関をまとめて計算する処理)の問題を実用的に解決したことを意味する。
結果として、SWE-Bench Pro(GitHubのリアルなissueを自動解決するベンチマーク)で59.0%を達成し、GPT-5.5やGemini 3.1 Proを上回るスコアを記録した。
実務上の示唆
- コードレビューや長大なドキュメント分析など、「全体を見通しながら推論する」タスクで試す価値のある新しい選択肢が増えた
- オープンウェイトなのでオンプレミス(自社サーバー)やプライベートクラウドに展開できる。機密性の高い用途でフロンティア性能を使えるようになる
- MoEの特性上、推論時の実メモリ使用量は総パラメータ数よりずっと小さい。H100数枚程度のセットアップで動作する可能性がある
- コーディングエージェントや長文書分析ツールを開発・評価している場合、M3をベースラインとして比較対象に加える価値がある
NVIDIA Cosmos 3:ロボットと自動運転のための「世界モデル」が開く
NVIDIAは6月1日のComputex/GTC TaipeiでCosmos 3を発表した。テキスト・画像・動画・環境音・ロボットの行動データを20兆トークン分(画像約10億枚・動画約4億本)で学習した、物理AIのための基盤モデルだ。
「物理AI」とは、デジタルの言語だけでなく、重力・摩擦・衝突といった現実世界の物理法則を理解し、それに従って行動を生成できるAIのことを指す。ロボットアームが「このコップをそっと置く」という動作を正確に実行するには、言語理解だけでは不十分だ。「物理的な感覚」をデータから学んだモデルが必要になる。
アーキテクチャはTwo-Tower Mixture-of-Transformersと呼ばれる設計で、高精度な訓練用の「Super」モデルとリアルタイム近傍推論用の「Nano」モデルの2種類が即座に公開された。Runway、Skild AI、Black Forest Labsなどとのコズモス連合(Cosmos Coalition)も同時に発足し、エコシステムの形成が始まっている。
最大の意義はロボットの訓練期間を月単位から日単位に圧縮できる可能性だ。物理シミュレーションで大量の合成データを生成し、実機でのファインチューニングを最小化できれば、ロボット開発のコストと速度が根本から変わる。
実務上の示唆
- ロボティクスや自律走行に関わる開発者にとって、シミュレーションパイプラインの中核候補として評価する価値がある
- モデルがオープンウェイトで公開されているため、NVIDIA以外のハードウェアでも動かせる。研究機関にとってアクセスのハードルが大きく下がった
- 世界モデル(World Model:環境の状態と変化を内部でシミュレートするモデル)という概念が研究フェーズから実用インフラへと移行しつつある。品質検査・設備保全・3D空間理解といった隣接領域への応用も視野に入る
- Cosmos 3とMiniMax M3が同日発表されたことは、オープンウェイトによるAI基盤の民主化が一気に加速したことを象徴している
Perplexity:「デバイスかクラウドか」を自動で判断するハイブリッド推論
6月5日のComputex 2026でPerplexity AIはIntelと共同開発したハイブリッドローカル・クラウド推論オーケストレーターを発表した。
エッジ推論(ユーザーのPCやスマートフォン上でAIを処理すること)は近年急速に普及しているが、従来は「どのモデルを使うか」「クラウドに送るかどうか」をユーザーや開発者が手動で設定する必要があった。Perplexityのシステムはこれを自動化する。タスクの内容・データの機密度・必要な精度水準をリアルタイムで推定し、サブタスク単位で、しかも実行の途中でもクラウドと端末の間で処理先を切り替える。
デモではIntelのCore Ultra Series 3搭載PCで「Personal Computer」エージェントを動作させた。カレンダーの予定確認や個人的なメモの参照はオンデバイスで処理し、複雑な計画立案やWebリサーチはクラウドモデルに委ねる、という動きを一つの会話フロー内で自動的に実現した。Nvidiaハードウェアのサポートも予定されている。
プライバシー・レイテンシ(応答までの遅延)・コストのトレードオフを人間が判断しなくてよくなるとすれば、AIアシスタントの設計思想が根本から変わる。特に医療・法律・財務など機密性の高い領域での活用が広がる可能性がある。
実務上の示唆
- AIアシスタントや社内ツールを設計する際、「何をオンプレに置くか」という判断をユーザーに委ねないアーキテクチャが標準になりうる
- プライバシー要件の厳しい業界(医療・法務・金融)では、ハイブリッド設計がコンプライアンス上の武器になる
- 現時点では一般公開前だが、「ローカルLLMとクラウドLLMを透過的に切り替えるミドルウェア」の需要が2026年後半に具体化するかもしれない
- アプリ開発者はオフラインファーストな設計とクラウド活用を両立させるアーキテクチャパターンの検討を今から始めると先手を打てる
まとめ
今週の三つのニュースに共通するテーマは「オープン化と自律化の加速」だ。MiniMax M3はクローズドモデルだけのものとされてきたフロンティア性能をオープン陣営が手にしたことを示した。Cosmos 3はロボット・自動運転向けの物理AI基盤をオープンに解放し、訓練コストを劇的に下げる可能性を切り開いた。そしてPerplexityのハイブリッド推論は、端末とクラウドの境界を意識させずにAIを使える未来を具体的な形で示した。
「どのモデルを選ぶか」「どこで処理するか」「何のデータで学習させるか」という問いへの答えが、2026年下半期に向けて大きく書き換えられようとしている。