【AIニュース】AppleがSiriをGeminiで全面刷新、AnthropicがAI自己改善に警鐘

今週のAI業界を象徴するのは、「大企業の戦略転換」と「AI安全性への本格的な警鐘」という二つの軸だ。Appleは長年の課題だったSiriを根本から作り直し、Googleとの大型ライセンス契約という予想外の手段を選んだ。一方でAnthropicは、自社製AIが自らのコードを書き替えるという「再帰的自己改善」の芽生えを公表し、業界全体への協調した対応を呼びかけた。そしてGoogleのGemini 3.5 Proが6月中の一般公開を射程に収め、フロンティアモデル競争の熾烈さはさらに増している。

Apple WWDC 2026：SiriがGoogle Geminiで生まれ変わる

2026年6月8日、AppleはWWDC（Worldwide Developers Conference、世界開発者会議）の基調講演でSiriの全面刷新を正式発表した。ティム・クック氏にとって最後のWWDC基調講演となり（9月にジョン・テルナス氏へCEO交代予定）、「約束と現実のギャップを埋めるための2年間だった」と自ら総括した。

発表の核心は、Googleの1.2兆パラメータのカスタムGeminiモデルをSiriのクラウド処理基盤として採用するという決断だ。1.2兆パラメータとは、ニューラルネットワークの設定値が1兆2000億個あることを意味し、Appleが自社で開発してきた最大のクラウドモデルの約8倍の規模に相当する。ライセンス料は年間約10億ドル（約1500億円）と報じられている。

新しいSiriは「三層構造」の処理設計を採用している。

第1層（オンデバイス）：カレンダー確認・アラーム設定など軽いタスクはApple独自の小型モデルがデバイス上だけで完結させる。データは外部に出ない
第2層（プライベートクラウド）：中程度の複雑さのリクエストはAppleのPrivate Cloud Compute（外部からアクセスできない専用サーバー）で処理する
第3層（Google Cloud）：複雑な推論や長文生成はGoogleのクラウドに転送し、NVIDIA Blackwell B200 GPUで処理する

この設計により、プライバシーとパフォーマンスのバランスをユーザーが意識することなく自動的に最適化できる。新しいSiriは画面に表示されているコンテンツを読み取りながら複数のアプリをまたいだ複合的な作業を実行できるようになった。「写真から料金を読み取って割り勘を計算し、結果をメッセージで送る」といった複数ステップの作業を自然な会話で完結させることが可能だ。

さらにiOS 27では、Claude・ChatGPT・GeminiなどサードパーティのAIをSiriのバックエンドとして選択できる「Extensions」システムも導入される。これはiPhoneのAI機能をApple独占から「選択できるプラットフォーム」へと転換する大きな政策変更だ。

今回の発表は、AppleがiPhone 16で宣伝しながら未実装だったSiri機能をめぐる2億5000万ドルの集団訴訟和解の数週間後という背景もある。「約束を果たす」というクックCEOのメッセージには、法的・ビジネス的なプレッシャーも反映されていた。

実務上の示唆

iPhoneユーザーがSiriを通じてClaudeやGeminiを選択できる環境になれば、企業のモバイルAIポリシー（「どのAIサービスの利用を許可するか」）の見直しが必要になる
三層構造は「機密度に応じて処理先を振り分ける」設計パターンだ。社内ツールのアーキテクチャ設計でも参考になる考え方で、データの重要度に応じてオンプレ・プライベートクラウド・パブリッククラウドを使い分ける実装が現実的に近づいている
Siriのバックエンドが実質的にGeminiになることで、GoogleとAppleの協業は製品・インフラの両面で深まる。この提携は競合他社（Meta・Microsoft）へのAI普及において間接的な圧力になりうる
Extensions対応アプリをAppleエコシステム向けに開発すれば、Siriのバックエンドとしての地位を得られる可能性がある。開発者には新たなプラットフォームビジネスの機会が生まれる

Anthropicの警鐘：AIがAIを作るサイクルが始まった

2026年6月4日、Anthropicは「When AI Builds Itself」というレポートを公開し、業界に大きな反響を呼んだ。内容は二つに分かれる。「ClaudeはAnthropicの自社プロダクトを自分自身で改良し続けているという事実の公表」と「その先にある再帰的自己改善（Recursive Self-Improvement）リスクへの対応策の提案」だ。

最も注目された数字は「80%以上」だ。2026年5月時点で、Anthropicの本番コードベースにマージ（統合）されたコードの80%以上がClaudeによって書かれていた。これはClaude Code（コーディング支援AI）のローンチ直後の2025年2月における「数%」から急増した数字で、エンジニア一人当たりのコードアウトプットは2024年比で約8倍になったという。

「再帰的自己改善」とは何か。AIシステムがその後継者の設計・実装を担うようになり、人間のフィードバックが薄まっていくサイクルを指す。AIが書いたコードが次世代のAIを生み出し、その次世代AIがさらに強力な次々世代を生む——そのループが速すぎると、人間が軌道修正できなくなるリスクがある。

Anthropicが提唱するのは「グローバルな検証可能な一時停止メカニズム」だ。具体的には、フロンティアAIの開発が特定の閾値（しきい値：あらかじめ定めた危険水準）を超えた場合に、複数の主要ラボが同時に開発を一時停止できる枠組みを国際的に合意しておく、というものだ。自社だけが停止しても競合が続ければ意味がないという「囚人のジレンマ」的な問題を解決するため、「各ラボが他のラボの停止を実際に確認できる透明性」の仕組みが不可欠だと強調している。

一方で、Cybernewsなどのメディアは「自社の競争優位を守るための規制要求ではないか」という批判的な見方も紹介しており、業界内での反応は割れている。

実務上の示唆

「AIが書いたコードを人間がレビューする体制」を今から整えることが組織として重要だ。Anthropicの80%という数字が示すように、コード生成AIの比率は予想より早く高まる。自社のコードレビュープロセスを見直す機会として捉えたい
再帰的自己改善の議論は「今のAIが安全か」という問いではなく、「進化速度が速すぎることのリスク」という問いだ。自社のAI活用においても「どのサイクルで人間がチェックを入れるか」を設計に組み込む必要がある
AnthropicがGeminiと協業するAppleへモデルを提供していることとも重なる構図だ。「AIが広まるほど、その開発者が安全性の議論の中心になる」という責任の所在が問われている
AIが生成したコードの品質・セキュリティ保証は、人間が書いた場合と同じ基準だけでは不十分かもしれない。静的解析・テスト自動化・セキュリティスキャンのパイプラインを強化しておくことが今後の標準になりうる

Gemini 3.5 Pro：6月中の登場が射程に入る

Google Gemini 3.5シリーズの上位モデル「Gemini 3.5 Pro」が6月中に一般公開される見通しだ。5月19日のGoogle I/O 2026でスンダー・ピチャイCEOが「Proは来月を予定している」と予告しており、現在は限定プレビュー段階にある。6月6日時点でも具体的な日程は発表されていないが、月内登場はほぼ確実とみられている。

Gemini 3.5 Proの最大の特徴は「200万トークンのコンテキストウィンドウ」だ。コンテキストウィンドウとは「AIが一度の会話で参照できるテキストの長さ」を指す。200万トークンは文庫本にして約1400冊分のテキストに相当し、現在のほとんどのモデル（100万トークン前後が多い）を大幅に上回る。法律文書や研究論文の大規模な横断分析、年間分の顧客サポートログの一括処理といったユースケースで、実用的な差が生まれる。

もうひとつの注目機能は「Deep Think（ディープシンク）」と呼ばれる推論モードだ。数学の難問や複雑な計画立案など、即答より正確さが求められるタスクで意図的に推論ステップを増やすことができる。OpenAIのo系モデル（「考えてから答える」スタイル）と同じ方向性だが、Googleは科学・工学・コーディングの領域での優位性を特に強調している。

価格は1Mトークンあたり入力$15・出力$60程度が予想されている。同シリーズのGemini 3.5 Flash（入力$1.50・出力$9）の10倍にあたるが、FlashはすでにTerminal-Bench 2.1（プログラミング問題をターミナル上で解く評価）で76.2%という競合水準の性能を持つ。Proはそれをさらに上回るポジショニングになる見込みだ。

TechTimesによれば、Proが一般公開されるとClaude Opus 4.8（SWE-bench Verified 88.6%）やGPT-5.5 Instant（88.7%）と直接競合する三つ目のフロンティアモデルが登場することになり、性能・価格の比較評価がいよいよ本格化する。

実務上の示唆

200万トークンのコンテキストは、長大なコードベース全体を一度に分析したり、複数の長文書の関係性を問いかけたりする用途で実用的な選択肢になる。Gemini 3.5 Flash（1Mトークン）とProを使い分けるコスト最適化の設計を今から準備しておく価値がある
Deep Thinkモードは「正確さが最優先で、処理時間は問わない」タスクに向く。バッチ処理・夜間ジョブ・専門家向けレポート生成などと相性がよい。コスト効率を重視する用途にはFlashを、品質を重視する用途にはProのDeep Thinkを使い分ける構成が考えられる
FlashとProの10倍の価格差を踏まえると、「ほとんどのリクエストをFlashで処理し、難しいケースだけProにルーティングする」アーキテクチャが費用対効果の高い設計になる。このパターンはGPT-5.5 Instantと上位モデルの使い分けにも応用できる
Claude・GPT・Geminiの三モデルが横並びで比較できる状況が整いつつある。自社のユースケースに合った評価指標（evals）を今から準備しておくと、Proの公開と同時に客観的な選定ができる

まとめ

今週のAI業界を振り返ると、「AIの使い方」と「AIの作られ方」がどちらも大きく書き換えられた週だった。AppleはSiriを根本から再設計しGoogleの力を借りることで、iPhoneという世界最大のプラットフォームにGeminiを届ける道を選んだ。Anthropicは自社AIが自分自身を改良するサイクルに入ったことを認め、社会が追いつけなくなる前に協調した対応を業界全体に求めた。そしてGemini 3.5 Proの登場は、フロンティアモデルの競争軸が「性能」から「コンテキスト長」「推論モード」「統合しやすさ」へと広がっていることを示している。AIが組み込まれる先が「開発ツール」から「日常のデバイス」へ、そして「社会インフラ」へと広がっていく加速が、今週の三つのニュースに共通する流れだ。

hagizo.io