【AIニュース】Microsoft初の推論モデル登場、GitHub Copilot課金刷新で波紋、MIT発の訓練高速化

2026年6月、AIインフラをめぐる三つの動きが同時進行している。Microsoftが年次開発者カンファレンス「Build 2026」でついに自社推論モデルを世界に示し、GitHubはCopilotの料金体系を刷新した。そしてMIT発の研究が推論モデルの訓練コストという根本課題に楔を打ち込もうとしている。

Microsoft Build 2026——MAI-Thinking-1、自社推論モデルの初陣

6月2日に開幕したMicrosoft Build 2026のキーノートで、Microsoftは同社初の推論特化モデル「MAI-Thinking-1」を発表した。

推論モデル（難問を解くために回答前に「考えるステップ」を積み重ねるAI）の競争はOpenAIのo系シリーズ、AnthropicのClaude Opus 4.8が先行してきたが、ここにMicrosoftが自前のモデルを引っさげて参入した形だ。

MAI-Thinking-1の主な特徴は次のとおりだ。

サイズと文脈長: アクティブパラメータ（実際の推論に使われる重み）は350億で、モデルとしては中規模に当たる。文脈ウィンドウは25.6万トークン（文庫本約500冊分）に対応する。

性能: コーディング能力を測るSWE-Bench Pro（実際のGitHubイシューを自力で修正する能力を評価するベンチマーク）でAnthropicのClaude Opus 4.6と同等の結果を示した。数学的推論ではAIME 2025（全米最難関の高校数学コンテスト問題集）で97.0%、AIME 2026で94.5%という水準に達している。

訓練方針: 第三者モデルからの知識蒸留（大きなモデルの出力を学習データに使う手法）を一切行わず、商用利用可能な独自データセットのみで訓練されたと明言している。企業導入時のライセンスリスクを意識した姿勢だ。

現時点ではMicrosoft Foundry（Microsoftのモデル開発・提供プラットフォーム）のプライベートプレビューとして提供が始まっており、Fireworks AI・Baseten・OpenRouterなどのサービス経由でも間もなく利用可能になる見通しだ。

実務上の示唆

中規模モデルがClaude Opus 4.6に匹敵するコーディング性能を出せるとすれば、推論コストを抑えた自動コードレビューや静的解析パイプラインの構築コストが下がる可能性がある。
商用データのみ訓練という点は、AIシステムの著作権リスクを重視する法務・調達部門にとって評価材料になる。ライセンスの透明性を重視する組織は優先的に検討する価値がある。
Foundryが基盤になることで、AzureやMicrosoft 365と密接に統合されたエージェントワークフローが組みやすくなると予想される。Microsoftエコシステムを既に使っている組織は早めに試用を検討したい。

GitHub Copilot AI Credits課金——1日で使い切った開発者たち

6月1日を境に、GitHub Copilotの全プランが「AI Credits（AIクレジット）」ベースの従量課金に切り替わった。1 AIクレジット＝0.01ドルで、チャット・コードレビューなどの機能が使用量に応じてクレジットを消費する仕組みだ。

プラン別の月間クレジット上限は以下のとおりだ。Copilot Pro+（月39ドル）には39ドル分のAIクレジットが含まれる。Copilot Business（ユーザーあたり月19ドル）には19ドル分、Copilot Enterprise（ユーザーあたり月39ドル）には39ドル分が付与される。上限を超えた分は追加購入で使い続けられる。

問題はその消費速度だ。The Registerの報道によると、Copilot Pro+を使う開発者がわずか2時間で月間クレジットの約8%を使い切ったと報告している。単純計算すると、フル稼働で約25時間で月額分を消費することになる。GitHubコミュニティには「以前と同じ使い方なのに大幅に値上がりする」「月の途中で機能が使えなくなる」という声が相次いでいる。

なお、コード補完（インラインでの次のコード提案）と「Next Edit Suggestions（次の編集候補）」は引き続きAIクレジットの対象外で、全有料プランで無制限に使える。大きく影響を受けるのはチャット機能とAgent Mode（複数ファイルを横断してコードを書き直すエージェント動作）だ。

実務上の示唆

Agent Mode（ファイル横断で大規模なコード変更を自律的に実行する機能）は消費量が特に大きいとされる。チームで多用している場合は月次コストが予算を超えるリスクがある。まず組織内の使用量モニタリング設定を確認することを勧める。
GitHubは組織・企業向けに「ユーザーレベルの予算設定」機能を提供している。部門ごとにクレジット上限を設けてコストを管理する運用設計が必要になってくる。
競合のCursor・Windsurf・JetBrains AI Assistantは固定料金モデルを維持しているケースも多い。コスト構造を比較した上でツール選定を再評価するタイミングかもしれない。

MITの推論モデル訓練高速化——遊休プロセッサ問題を解消

推論モデル（ステップごとに論理を展開して難問を解くAI）の訓練には膨大な計算コストがかかる。その原因のひとつが「遊休プロセッサ問題」だ。複雑な問題を処理しているGPUが全力稼働している一方で、簡単な問題を担当するGPUが手待ち状態になる。クラスタ全体では大量の計算資源が無駄になっている。

MITの研究チーム（MIT・NVIDIA・ETH Zurichの共同研究、主著者はMITポスドクのQinghao Hu氏）は、この問題を「スペキュレーティブ訓練（推測的訓練）」と呼ぶ手法で解決した。

仕組みはこうだ。大きな推論モデルの出力を「予測」する小型の補助モデルをもう1つ訓練し、大型モデルはその予測を検証することに集中する。小型モデルが高精度な予測を出してくれれば、大型モデルが全ステップを自力で計算しなくて済む。遊休状態のプロセッサが小型モデルの推測を担当するため、クラスタ全体の稼働率が上がる仕組みだ。

実験では訓練速度が70〜210%向上し（モデルにより差がある）、最終的な精度は維持された。さらに嬉しい副産物として、訓練で生まれた小型モデルは、本番推論時のスペキュレーティブデコーディング（大型モデルの出力を小型モデルで先読みして高速化する既存手法）にそのまま再利用できることも確認された。訓練と推論の両方のコストを下げられる一石二鳥の効果だ。

実務上の示唆

この手法が実用化されれば、推論モデルの訓練コストが大幅に削減される可能性がある。訓練コスト低下は最終的にAPIの利用料金にも波及するため、LLMを活用したサービスのコスト見通しを見直す材料になりうる。
副産物の小型モデルをそのまま推論高速化に使えることは、クラウドコストが支配的なLLMアプリケーション運営者にとって大きなインパクトになりうる。自社でモデルをホストしている組織は特に注目したい。
エネルギー効率の改善はAIシステムのCO2排出量報告にも関わる。サステナビリティ要件を重視する組織にとっても、今後のモデル選定・訓練戦略の参考になる研究だ。

まとめ

今週のAI業界は、モデルの性能向上よりも「コストと経済圏」への注目が高まった。MicrosoftのMAI-Thinking-1は「自前で推論モデルを持つ」時代の始まりを告げ、GitHub Copilotの課金変更は開発ツールの経済設計が転換点を迎えていることを示した。そしてMITの研究は、将来の推論モデル訓練コストを根本から変える可能性を示唆している。AIを「いかに安く・効率よく使うか」という問いが、2026年後半の最重要テーマになりそうだ。

hagizo.io