エージェントAI on hagizo.io

【AIニュース】非トランスフォーマーの胎動と主権AI連合の形成

Mon, 18 May 2026 10:00:00 +0900

2026年5月、AI業界では「今までの常識が変わるかもしれない」という出来事がいくつも重なっている。これまでAIの主流だった「トランスフォーマー」という仕組みに代わる新モデルが商業デビューし、欧州では米国のAI大手に対抗する連合が生まれた。AIをより速く・安く動かす技術も進歩しており、企業の現場ではAIエージェントが実験から本番稼働へと移り始めている。

SubQ登場――「重い計算」を劇的に減らす新しいAI

マイアミのスタートアップSubquadratic社は2026年5月5日、新しいAIモデル「SubQ」を発表した。CEO Justin Dangel氏とCTO Alexander Whedon氏（元Meta GenAIヘッド）が率いる同社は、約29億円（2,900万ドル）の資金調達に成功し、会社の評価額は500億円規模とされる。

SubQの最大の特徴は「Subquadratic Sparse Attention（SSA）」と呼ぶ独自の仕組みだ。従来のトランスフォーマーは、扱う文章が長くなるほど計算量が急激に増える（2倍の長さで4倍の計算が必要になる）という欠点があった。SubQはこの増え方をほぼ「長さに比例する」レベルに抑えることができると主張している。

その結果、最大1,200万トークン（小説数百冊分に相当）という巨大なコンテキストを扱いながら、コストは同クラスのモデルの約5分の1になるという。注意計算の速度は最大52倍に達したとも主張しているが、これらの数値はあくまで自社発表のものだ。VentureBeatも報じているように、第三者による独立した検証はまだ行われていない。

過去にもMamba、RWKV、DeepSeek Sparse Attentionなど「計算を減らす」試みは多くあったが、実際のベンチマークで最前線の性能には届かないことが多かった。SubQが商業資金を背景にそこへ挑んでいる点は注目に値するが、まずは独立した性能評価を待ちたい。

実務上の示唆

長い文書やコードを丸ごと読ませるような使い方は、独立ベンチマークが出た後に比較検討する価値がある
モデルを選ぶ際は性能だけでなく、コスト構造（文章が長くなるほど割高になるか？）も確認する習慣をつけよう
「画期的な新技術」を名乗る製品は、第三者の検証が出てから本番に採用するのが安全だ

CohereとAleph Alphaが合併――「データを自国で管理したい」欧州の反撃

2026年4月下旬、カナダのCohere（評価額約1兆円）とドイツのAleph Alphaが合併を発表した。新会社の評価額は約3兆円規模で、ドイツの大手小売グループSchwarz Groupが約800億円（5億ユーロ）を出資して後押しする。

TechCrunchの記事によれば、この合併の狙いは単純な技術の足し算ではない。「AIに使うデータを国外に出したくない」という欧州政府・銀行・病院などへの訴求が核心だ。Aleph Alphaは欧州の防衛・公共分野に強く、Cohereは多言語対応と企業向けAPIの運用実績がある。組み合わせることで、GDPRなどの厳しいデータ規制に対応した「自国完結型」のAIサービスを提供できる稀有な存在になりうる。

これは「主権AI」と呼ばれる考え方――自分の国や組織でデータとAIを管理したい、という志向の広がりを示している。同時期にOpenAIはGPT-5.5をAPIで公開し、Grok 4.3（xAI）やGemini 3.1 Flash Lite（Google）もリリースされ、最前線モデルの競争は続いている。しかし欧州での動きは、その"外側"で起きている地域ごとの構造変化を示すものだ。

実務上の示唆

欧州でのAI活用を検討している日本企業は、この主権AI連合を選択肢の一つとして把握しておくとよい
米国のAIサービスだけに頼るリスクを減らしたい場合、欧州系の選択肢が実質的に広がった
日本でも「自国でデータを管理できるAI調達」の議論が進む可能性があり、早めに方針を考える価値がある

CloudflareがAI推論を改善――「遠くのサーバー」に頼らなくなる時代へ

Cloudflareは2026年5月、公式ブログでAI推論インフラの技術詳細を公開した。同社のWorkers AIは世界300以上の拠点でモデルを動かすサービスで、「ユーザーの近くで処理する」ことでレスポンスを速くする設計になっている。最近はオープンソースモデルKimi K2.5をプラットフォームに組み込み、速度を3倍に改善したという。

注目の技術は「Disaggregated Prefill（分離型プリフィル）」だ。AIが回答を生成する処理は大きく二段階に分かれる。最初の「入力を読み込んで整理する段階」（プリフィル）は計算量が多く、次の「実際に文字を出力する段階」（デコード）はメモリ使用量が多い。この二つは必要なリソースが異なるのに、従来は同じハードウェアで処理していたため効率が悪かった。Cloudflareはこれを別々の最適化されたシステムに分けることで、GPU（AI処理チップ）の使い方を大幅に改善した。

これが意味するのは「AIを使うのにビッグテックの巨大データセンターに頼らなくて済む」未来が近づいているということだ。医療や金融のように「データを外に出せない」業界でも、近くの拠点でAIを動かしやすくなる。

実務上の示唆

「応答が速いAIが必要」なアプリ（音声対話やリアルタイム翻訳など）は、エッジ推論（近くの拠点での処理）の採用を検討する価値が出てきた
大手クラウドだけでなく、エッジ型のAIインフラも選択肢に入れておくとアーキテクチャの幅が広がる
こうした効率化技術が広まれば、AI利用のコスト削減につながる可能性がある

AIエージェントが「実験」から「実際の仕事」へ

2026年5月、企業でのAIエージェント活用がPoC（試作・実証実験）の段階を超えて、本番の業務システムに組み込まれる事例が増えてきた。

ServiceNowとAccentureは共同プログラムを発表し、企業の既存システムにエージェントAIのワークフローを直接組み込む取り組みを開始した。金融インフラ企業Broadridgeも、後処理業務やクライアント対応で発生する「例外ケース」の処理をエージェントが自動でこなす機能を正式リリースしている。

Google CloudのAIエージェントレポートは「2026年末までに企業アプリの40%に専門エージェントが搭載される」と予測している。一方で同レポートは「既存の業務フローにそのままエージェントを重ねても、多くは失敗している」という厳しい現実も伝えている。うまくいくには業務フロー自体を見直すことが必要だという認識が、業界全体で共有されつつある。

技術トレンドとして「コンテキストエンジニアリング」という考え方が注目されている。AIへの指示文（プロンプト）をうまく書くことより一歩進んで、「エージェントにどのデータをどのタイミングで渡すか」という情報設計の全体を考える手法だ。エージェントの信頼性は、指示の巧みさよりも情報設計の質で決まるという見方が広まっている。

実務上の示唆

エージェントを本番に移すときは、業務の流れ自体を見直さないと効果が半減する
「どの情報をいつエージェントに渡すか」の設計（コンテキストエンジニアリング）を、導入計画の早い段階で考えることが重要だ
ServiceNow/Accentureのように既存の業務システムに直接組み込むパターンが増えれば、SaaSツールとの連携設計が競争力の差になってくる

まとめ

2026年5月のAI業界は、技術・地政学・インフラ・現場活用という四つの面で同時に大きな変化が起きている。SubQはトランスフォーマー一強の時代に初めて商業規模の挑戦状を叩きつけ、Cohere＋Aleph Alphaの合体は「データを自分たちで管理したい」という世界的な流れを形にした。Cloudflareの推論技術改善はAIをより身近な場所で動かせる環境を整え、企業の現場ではエージェントが「試してみる段階」から「毎日使うインフラ」へと変わりつつある。それぞれの変化はつながり合っており、AIとどう向き合うかを考えるうえで欠かせない視点を提供している。

【AIニュース】マルチモーダルAIエージェントと専門職自動化の加速―Thinking Machines・Google Android・Microsoft Legal Agent

Fri, 15 May 2026 12:00:00 +0900

2026年5月中旬、AIは「チャットボット」という枠組みを完全に脱皮しつつある。リアルタイムで音声・映像・テキストを同時処理する協働型AIが登場し、スマートフォンはアプリをまたいで自律的に操作するエージェントになり、法律実務のような高度専門職にもAIが入り込んでいる。能力の拡張と応用領域の深化が同時に加速している一週間だった。

Thinking Machines：Mira MuratiがリアルタイムHuman-AI協働モデルを発表

元OpenAI CTOのMira Muratiが率いるThinking Machinesが、「インタラクションモデル（Interaction Models）」と呼ぶ新しいAIアーキテクチャの概要を公開した。従来のチャット型モデルが入力→処理→出力という逐次的なフローで動作するのに対し、インタラクションモデルは音声・映像・テキストを連続的かつ並列に解釈しながら、リアルタイムで動的に応答を生成する。

このアプローチは、人間との「対話」ではなく「協働」を設計の出発点としている点が特徴的だ。ユーザーが話し始めると同時にAIは聴取・推論・応答を並行して行い、途中で方向を変えたり補足を加えたりしても、AIが文脈を追い続ける。デモでは複数人が同時に会話するシナリオでも破綻なく動作しており、コールセンター・教育・医療現場など、人間の自然な会話が価値を持つ領域への応用が期待される。

Thinking Machinesはまだ製品の正式ローンチには至っていないが、このアーキテクチャの発表は、GPT系のチャット型UIとは異なる方向性でのフロンティアモデル競争が始まったことを示している。

実務上の示唆

リアルタイム音声インタフェースの設計では、従来のターンベース型ではなく連続ストリーム型への移行を検討する段階に入った
コールセンター・教育支援・医療問診など、「会話の自然さ」がKPIになる領域では、このアーキテクチャが既存ソリューションを大きく上回る可能性がある
Thinking Machinesへの人材・資本の流入は今後加速すると見られ、採用市場・競合動向のモニタリングが必要

Google Android：GeminiがOSレベルのマルチステップエージェントに

GoogleはGoogle I/O 2026に向けた発表の一環として、AndroidにGemini搭載のOSレベルエージェント機能を統合すると発表した。これにより、Androidスマートフォンは単なるAIアシスタント端末を超え、複数のアプリをまたいでマルチステップのタスクを自律的に実行するエージェントとして機能する。

具体的な機能として発表されているのは、Webブラウジング・フォーム入力・音声ディクテーション・カスタムウィジェット作成を自然言語の指示で実行すること、そして複数アプリを横断する複合タスクの自動化だ。例えば「旅行の予約をして、カレンダーに追加して、家族に連絡して」というような指示を一つのプロンプトで処理できる。

さらに、GoogleはGeminiをベースにした動画生成システム「Gemini Omni」のデモも準備中とされており、会話型プロンプトだけで動画の生成・リミックス・編集が可能になると報じられている。Androidのエージェント化とマルチモーダル生成の組み合わせは、スマートフォンの使い方そのものを再定義する可能性を秘めている。

実務上の示唆

Androidエージェント対応のアプリ設計では、「エージェントから呼ばれることを想定したUI/API」が新たな設計要件になる
旅行・EC・業務ツールなど複数サービスをまたぐユースケースは、Androidエージェントの早期統合先として検討価値が高い
動画生成が会話UIに統合されると、マーケティング・教育コンテンツ制作のコストが劇的に下がる可能性があり、制作ワークフローの見直しが必要

Gemini 3.1 Flash-Lite：超低コスト・高速推論の新たな商用基準

5月8日、GoogleはGemini 3.1 Flash-Liteの一般提供（GA）を発表した。このモデルはGemini 3シリーズの中で最も高速かつコスト効率に優れた位置づけで、価格は入力約36円/100万トークン（$0.25）・出力約218円/100万トークン（$1.50）と、前世代の2.5 Flashより大幅に低い。

Artificial Analysisのベンチマークでは、応答開始までの時間（Time to First Answer Token）が2.5 Flash比で2.5倍高速化、出力速度は45%向上しながら品質は同等以上を維持している。p95レイテンシ（100件中95番目に遅い応答時間）は完全な応答生成で約1.8秒、分類・ツール呼び出しではサブセコンドを達成している。

実際の本番導入事例では、高ボリューム・低レイテンシ要件のユースケース―チャットボット、リアルタイム分類、ドキュメント処理パイプラインなど―でGemini 3.1 Flash-Liteが大幅なコスト削減と応答性改善をもたらすことが確認されている。OpenAIのGPT-5.5 Instantと比較すると、高精度が必要な場面ではGPT-5.5が優位だが、スループット最優先のバッチ処理ではFlash-Liteが圧倒的に有利だ。

実務上の示唆

APIコストが課題になっているサービスでは、精度要件を満たす範囲でGemini 3.1 Flash-Liteへの切り替えを試験する価値がある
ツール呼び出し・分類・ルーティングなど「速度優先の短タスク」には、Flash-Liteがデファクト候補になりうる
Vertex AI上での利用なら他のGoogle Cloudサービスとの統合がシームレスで、エンタープライズ導入の摩擦が少ない

Microsoft Legal Agent：専門職AIエージェントが法律実務に本格参入

Microsoftは、Word内で動作するLegal Agentを発表した。現在は米国のFrontierプログラム参加者限定での提供だが、契約書のリスク・義務・交渉履歴の追跡、変更追跡（Track Changes）が含まれる文書との連携など、法律実務の中核タスクをカバーする機能が実装されている。

Legal Agentは単なるAI補助ではなく、契約書を条項ごとに精読し、潜在的なリスクを検出し、過去の交渉履歴と照合しながら修正案を提示する「エージェント型」の設計をとる。Wordというユビキタスなプラットフォームに組み込まれることで、弁護士や法務担当者が既存のワークフローを変えずにAIの恩恵を受けられる点が重要だ。

このリリースは、AIが単に「人間の補助をする」段階から「専門職の業務フローに組み込まれたエージェントとして動作する」段階への移行を示す象徴的な事例と言える。医療・会計・コンプライアンスなど他の専門職分野でも同様の展開が続くことは想像に難くない。

実務上の示唆

法務部門・法律事務所は、Legal Agentの早期アクセスプログラムへの参加を検討し、自社の契約管理プロセスへの適合性を評価すべき
AIが契約リスクを自動検出するようになると、法務レビューの所要時間と人件費が大幅に削減される一方、最終的な判断責任の所在をどう定めるかのガバナンス整備が急務
Microsoft 365を基幹ツールとする企業は、Legal Agentを皮切りに他のCopilot専門職エージェントが次々と追加される可能性を見越して、AI活用戦略を立案しておく必要がある

まとめ

2026年5月15日時点で、AIの進化は「より賢いチャットbot」という方向性から「専門職・デバイス・業務フローに深く統合されたエージェント」へと明確にシフトしている。Thinking Machinesのリアルタイム協働モデル、GoogleのAndroidエージェント化、超低コスト推論のGemini Flash-Lite、そしてMicrosoftの法律実務エージェントは、それぞれ異なる切り口でこの転換を示している。実務者にとっては、個別のモデルの性能比較にとどまらず、「自社のワークフローにどのエージェントが接続されるか」を設計する視点が今後の競争優位を左右する。

GPT-5リリースから約8ヶ月：統合モデルが変えたChatGPTとエージェントAIの現在地

Tue, 28 Apr 2026 19:25:00 +0900

GPT-5は2026年8月ではなく、確認できる主要報道では2025年8月7日に公開されたOpenAIの旗艦モデルです TechCrunch Wired。2026年4月時点では、リリースから約8ヶ月が経過し、GPT-5は単なる新モデルではなく、ChatGPTの体験を「モデル選択」から「目的達成」へ寄せる起点になりました。本記事では、GPT-5が何を変えたのかを、統合モデル、コーディング、幻覚低減、エージェント化の観点から振り返ります。

初の「統合モデル」という意味

TechCrunchはGPT-5を、OpenAI初の「統合」AIモデルだと報じました TechCrunch。これは、従来のGPTシリーズの高速応答と、oシリーズの推論能力を組み合わせる方向性を示すものです TechCrunch。

ユーザーから見ると、統合モデルの価値は「どのモデルを選べばよいか」を意識する負担が減ることです。簡単な質問には素早く返し、複雑な依頼では内部的に推論を深める。この発想は、後のGPT-5.4やChatGPT内のエージェント機能にもつながっています。

コーディングモデルとしての存在感

GPT-5は、コーディング領域で強い性能を示したモデルとして報じられました。TechCrunchによると、GPT-5はSWE-bench Verifiedで初回74.9%を記録し、Claude Opus 4.1の74.5%やGemini 2.5 Proの59.6%を上回ったとされています TechCrunch。

この数字が重要なのは、SWE-bench Verifiedが実際のGitHub課題に近いコード修正を測るためです。単発の関数生成よりも、既存コードを読み、バグを理解し、修正する能力に近い評価です。GPT-5が「vibe coding」やアプリ生成の文脈で語られたのは、コード生成だけでなく、仕様から成果物までを一気通貫で扱う方向へ進んだからです。

幻覚低減と実務利用

GPT-5は、幻覚率の低下も大きな売りになりました。TechCrunchは、HealthBench Hard HallucinationsでGPT-5 thinkingが1.6%の幻覚率を示し、GPT-4oの12.9%やo3の15.8%を下回ったと報じています TechCrunch。同記事は、ChatGPTプロンプトへの応答でもGPT-5 thinkingの誤情報率が4.8%で、o3の22%やGPT-4oの20.6%から大きく改善したと伝えています TechCrunch。

ただし、幻覚が減ったことは、事実確認が不要になったことを意味しません。むしろ、AIがより自然に、より自信ありげに答えるほど、外部ソースや社内データとの接続が重要になります。GPT-5以降のOpenAIがエンタープライズ接続、Codex、workspace agentsを強化しているのは、モデル単体ではなく、検証可能な業務環境でAIを動かす必要があるからです。

APIとChatGPTの二面展開

GPT-5はChatGPTの無料ユーザーにもデフォルトモデルとして提供され、PlusやProではより高い利用上限が用意されました TechCrunch。APIではgpt-5、gpt-5-mini、gpt-5-nanoの3サイズが提供され、開発者は用途に応じて推論量やコストを選べるようになりました TechCrunch。

この展開は、AIサービスの二極化を示しています。一方では、一般ユーザー向けに「モデル名を意識しないChatGPT」を提供する。もう一方では、開発者向けにサイズ、価格、推論量、出力の長さを細かく制御できるAPIを用意する。GPT-5は、その両方を同時に進めたモデルでした。

まとめ

GPT-5の本質は、単に前世代より賢くなったことではありません。統合モデルとして、速い応答と深い推論を同じ体験にまとめ、ChatGPTをエージェント的な作業環境へ近づけた点にあります TechCrunch。2026年4月時点で見ると、GPT-5はOpenAIのモデル戦略、ChatGPTのUX、企業向けエージェント展開をつなぐ節目だったと言えます。

【AI週報】エージェントAIと計算資源争奪が加速した1週間

Tue, 28 Apr 2026 12:52:00 +0900

直近のAIサービスプロバイダの動向を見ると、単なる新モデル発表よりも「AIをどう企業業務に組み込むか」と「そのための計算資源を誰が握るか」に焦点が移った印象です。OpenAI、Google、Microsoft、Anthropic、Metaの動きを見ると、AIサービスプロバイダの競争軸は、モデル性能、エージェント基盤、クラウドインフラ、企業導入支援の四つに収束しつつあります。

エージェントAIが主戦場に

OpenAIは4月22日、ChatGPT向けに「workspace agents」を発表し、ChatGPT Business、Enterprise、Edu、Teachers向けのresearch previewとして提供を始めました OpenAI。この機能はCodexをベースに、レポート作成、コード作成、メッセージ対応などの長時間ワークフローをクラウド上で実行し、ChatGPTやSlackから利用できる共有エージェントとして設計されています OpenAI。

Googleも4月22日にGemini Enterprise Agent Platformを発表し、Vertex AIを発展させる形で、エージェントの構築、運用、統制、最適化を一体化しました Google Cloud Blog。同プラットフォームにはAgent Identity、Agent Registry、Agent Gateway、Memory Bank、Agent Observabilityなどが含まれ、長期間状態を保持するエージェントや、企業内の権限・監査を前提にした運用を重視しています Google Cloud Blog。

MicrosoftはFoundry Agent Serviceのhosted agentsをpublic previewとして刷新し、セッションごとのVM分離、永続ファイルシステム、Entra Agent ID、OpenTelemetryベースの観測性、長期メモリを組み合わせました Microsoft Foundry Blog。OpenAIがChatGPT内の業務自動化を前面に出す一方、GoogleとMicrosoftは開発者と企業IT部門向けに、統制可能なエージェント実行基盤を押し出している点が対照的です。

OpenAIは企業導入と新モデルを加速

OpenAIは4月21日、Codexの企業導入を広げるため、主要なグローバルコンサルティング企業との提携を拡大し、顧客組織内にOpenAIの専門家を入れるCodex Labsを始めると報じられました Reuters。Reutersによると、Codexはコード作成、レビュー、推論を支援するツールで、週次利用開発者数は400万人を超えているとされています Reuters。

さらにOpenAIは4月23日にGPT-5.5をリリースし、Plus、Pro、Business、Enterprise向けに展開すると報じられました TechCrunch。TechCrunchによると、GPT-5.5は前モデルより少ないトークンで高速に動く「より直感的な」モデルと位置付けられ、ChatGPT、Codex、AIブラウザを統合する「スーパーアプリ」構想にもつながる発表です TechCrunch。

Anthropicを巡る計算資源競争

Anthropic周辺では、クラウド大手による大型支援が続きました。Anthropicは4月20日、Amazonが追加で約7,250億円（50億ドル）を投資し、将来的に最大約2.9兆円（200億ドル）を追加投資する可能性があること、さらにAnthropicが今後10年でAWS技術に約14.5兆円（1,000億ドル）超を投じ、Claudeの学習・運用向けに最大5GWの計算能力を確保すると発表しました Anthropic。

その数日後、GoogleもAnthropicへ最大約5.8兆円（400億ドル）を投資する計画を発表し、初回約1.45兆円（100億ドル）と、業績条件に応じた追加約4.35兆円（300億ドル）で構成されると報じられました CNBC。GoogleはClaudeの競合であるGeminiを持つ一方、Google CloudやTPUを通じてAnthropicの重要なインフラ提供者でもあり、AI市場では競争相手と供給者の境界がますます曖昧になっています CNBC。

Metaは組織再編でAIへ集中

Metaは4月23日、AI投資を強める流れの中で従業員の10%、約8000人を削減する計画だと報じられました CNBC。CNBCによると、削減は5月20日から始まり、6000件の採用枠も停止される見通しで、MetaがOpenAI、Google、Anthropicに対して生成AIで遅れを取っているという文脈で説明されています CNBC。

まとめ

今週の流れをまとめると、AIサービスプロバイダの競争は「賢いチャットボット」から「業務を実行するエージェント」へ移っています。OpenAIはChatGPTとCodexを企業ワークフローに深く入れ、GoogleとMicrosoftは統制・監査・ID管理を備えたエージェント基盤を整備し、AnthropicはAmazonとGoogleから巨大な計算資源を確保しています。次の差別化要因は、モデル単体のベンチマークよりも、企業データへの安全な接続、長時間実行、権限管理、そしてGPU・TPU・Trainiumを含むインフラ調達力になりそうです。