AI業界の今週のキーワードは「移動」だ。世界最高の研究者が職場を変え、最強モデルが政府の承認を経て企業のもとに戻り、巨大オープンソースモデルが一切の秘密なく公開された。能力競争の最前線は、あらゆる意味で流動している。
Google DeepMind、わずか6日で4人の幹部が離脱——Anthropicはノーベル賞受賞者を獲得
6月18日から24日のわずか6日間に、Google DeepMindから四人の上位幹部が次々と離脱した。最も注目を集めたのはジョン・ジャンパー(John Jumper)のAnthropicへの移籍だ。ジャンパーはAI創薬の世界を変えた「AlphaFold(アルファフォールド)」の共同開発者で、2024年のノーベル化学賞をDeepMind CEO デミス・ハサビスとともに受賞した。AlphaFoldは2億以上のタンパク質構造を予測し、医薬品研究の時間を何年も短縮した実績を持つ。
ジャンパーに加え、Geminiモデルのコーディング担当リードだったジョナス・アドラー(Jonas Adler)と、Geminiの事前学習とAlphaFoldにも貢献したアレクサンダー・プリッツェル(Alexander Pritzel)も6月24日に同じくAnthropicへ移籍した。この移籍ラッシュは、18日にOpenAIへ移ったTransformer論文の共著者ノアム・シャジール(Noam Shazeer)の離脱とほぼ同時期に重なっている。
Alphabetの株価はジャンパーの移籍発表直後に下落した。Fortuneの報道は、DeepMindがAI研究の最前線を維持し続けられるかという問いを業界に投げかけている。
なぜAnthropicに優秀な研究者が集まっているのか。背景にあるのはAnthropicの「AI-for-science(科学向けAI)」戦略だ。同社は今年に入り、実際の実験設備(ウェットラボ)を開設し、生物学的な研究ワークフロー専用のAIエージェントを発表し、アレン研究所やハワード・ヒューズ医学研究所との提携も締結した。ジャンパーの移籍は個人の転職にとどまらず、Anthropicが「AI×生命科学」を次の主戦場と定めていることを明確に示す動きだ。
実務上の示唆
- AI-for-scienceは今後数年のAI投資の主要テーマになる可能性が高い。創薬・材料科学分野の事業者はAnthropicモデルを軸に据えることを検討する価値がある。
- 優秀な研究者の移籍ラッシュはGoogle DeepMindの将来的なモデル競争力へ影響しうる。Gemini製品に依存度が高い企業は代替オプションを視野に入れておきたい。
- AI研究人材が一社に集中することは、研究の視点を均質化するリスクも孕む。多様な研究機関との関与を分散させる判断が長期的に重要になる。
Anthropic Mythos 5、輸出規制から2週間で約100社・政府機関に部分解禁
Anthropicの最高性能モデル「Claude Mythos 5」が6月26〜27日、米商務省の書簡によって約100社と政府機関への限定提供を認められた。
経緯を振り返ると、Mythos 5とFable 5は6月9日にリリースされたが、6月12日に商務省がECRA(輸出管理改革法)に基づく規制をかけ、両モデルの世界向け提供を停止させた。停止の背景には「ジェイルブレイク(安全制限を無力化して悪用する手法)によって危険な用途に使われる恐れ」があるとの懸念があったとされる。Fable 5はその後6月22日に安全制限を強化して復活したが、より高性能なMythos 5は停止が続いていた。
今回のハワード・ラトニック商務長官の書簡は、「Annex A(附属書A)」と呼ばれるリストに載った企業とその外国籍従業員に対して、Mythos 5へのアクセスにライセンスが不要になると明記した。ただしリスト外の組織への制限は継続中で、書簡は「状況が変化した場合、ライセンス要件を再評価・調整する権利を留保する」と明示している。つまり解禁は恒久的なものではなく、政府が随時撤回しうる条件付き措置だ。
この一連の経緯は、AIの最先端モデルを「国家安全保障の管轄下に置く」という実例を初めて大規模に作った。AIプロバイダーにとって、政府との交渉能力とコンプライアンス体制の整備が競争力の一部になり始めたことを意味する。
実務上の示唆
- 日本企業がMythos 5を業務利用する場合、Annex A掲載企業経由でのアクセスが現実的な経路となる可能性が高い。自社が契約するクラウドベンダーや代理店がリストに含まれるか確認が急務だ。
- 今後のAI利用計画において、政府規制リスクを「低確率だが影響大」ではなく「現実の運用課題」として扱う必要がある。サービス停止リスクを織り込んだ冗長設計(複数モデルの併用など)が現実的な対策になる。
- 最強モデルへのアクセスが政府承認を経る体制は、Anthropicだけでなく他のAIプロバイダーにも波及しうる。AI調達を担う法務・調達チームがガバナンス体制に関与する必要性が高まっている。
NVIDIA Nemotron 3 Ultra 550B——エージェント向けに設計された完全オープンな巨大モデル
NVIDIA Nemotron 3 Ultraは6月4日に公開された。重みファイル・学習データ・学習レシピのすべてを含む完全なオープンソースで、Linuxファウンデーションのライセンス下で提供される。
パラメータ数の構造を正確に理解しておく必要がある。「550B(5,500億)」は総パラメータ数だが、常に動くのは「55B(550億)」のみだ。これはMoE(Mixture of Experts、混合専門家)と呼ばれる構造で、入力内容に応じて専門分野の異なるサブモデルを選んで処理する仕組みだ。大型モデルの能力を保ちながら計算コストを下げられるのがMoEの利点だ。
アーキテクチャの特徴は、TransformerとMamba(長文処理に強い次世代構造)を組み合わせたハイブリッド設計だ。コンテキストウィンドウ(一度に処理できる文章の長さ)は最大100万トークンで、文庫本換算で数十冊分に相当する。同クラスの他のオープンモデルと比べてスループット(処理速度)は最大5倍高く、エージェントタスクのコストを最大30%削減できるとNVIDIAは発表している。
学習には「Multi-Teacher On-Policy Distillation(複数教師型知識蒸留)」という手法を採用している。10以上のドメイン特化型教師モデルから知識を継続的に取り込む仕組みで、特定分野への専門化や継続学習がしやすい。主な対象ユースケースは長時間稼働するAIエージェントで、コードベースの自律的な解析・修正、研究論文の長時間読み込みと要約、複数ステップにわたる計画・実行サイクルなどが挙げられている。
NVIDIAが完全オープンのモデルを出す戦略的意図は明快だ。AIエージェントはデータセンターのGPUをより長く・より重く使う存在になる。モデルを無料で広く普及させることで、NVIDIAのGPU(特にBlackwellシリーズ)の需要ごとエコシステムを育てる狙いがある。
実務上の示唆
- 100万トークンのコンテキストウィンドウは、大規模コードベースの一括解析や長大な法務・契約文書の通読など、これまで分割処理が必要だったタスクを一回で完結させられる可能性を開く。
- 完全オープンのライセンスのため、プライベートクラウドや自社データセンターでの内製運用が可能だ。データを外部のAPIに送れない業種(医療・金融・法務)に特に有効な選択肢になる。
- 「550Bだから高性能」と短絡する前に、55Bしか常時稼働しないMoE構造を理解した上でベンチマーク比較を行うこと。タスクの種類によっては小型のdense(密な)モデルのほうが速く・安く動く場合もある。
まとめ
今週のAI業界は、「誰がどこで何を動かすか」を巡る再編が加速した一週間だった。ノーベル賞受賞者がAI-for-scienceを掲げるAnthropicに移籍し、最高性能モデルMythos 5が政府の審査を経て一部解禁され、NVIDIAは550Bの巨大モデルを秘密なくオープンに公開した。競争の軸が「モデルの性能」から「信頼・規制・エコシステムの構築」へと広がっていることを象徴する出来事が重なった週だった。