Skip to content

【AIニュース】AIが80年来の数学難問を自力証明、760Mパラメータで最先端を超える小型モデルも登場

OpenAIの汎用推論モデルが1946年提唱の未解決数学問題を自律的に証明し、AI史上初の本格的な科学的発見を達成。一方でZyphra社のZAYA1-8Bは760Mの実行パラメータで数学オリンピック予選91.9%を記録し、小型モデルの常識を塗り替えた。

【AIニュース】ChatGPTの記憶革命とGoogle I/O 2026:エージェント時代が動き出した

ChatGPTのデフォルトモデルがGPT-5.5 Instantに切り替わり記憶機能が大幅強化。一方Google I/O 2026ではGemini 3.5 Flashとエージェント開発プラットフォームAntigravityが発表され、AIがチャットボットから自律行動するエージェントへ本格移行した。

【AIニュース】マルチモーダルAIエージェントと専門職自動化の加速―Thinking Machines・Google Android・Microsoft Legal Agent

Mira MuratiのThinking Machinesによるリアルタイム協働AI、GoogleのAndroid向けマルチステップAIエージェント、Gemini 3.1 Flash-Liteの一般提供、MicrosoftのLegal Agentなど、2026年5月15日のAI最前線をまとめる。

【AIニュース】推論コストの激変とインフラ成熟——エージェント時代の“地盤”が固まる

DeepSeek V4がMITライセンスでオープンソース化され、推論コストの構造が激変。Cloudflareはエージェント専用インフラ「Infire」で分散推論の基盤を整備。モデルの賢さより“動かす地盤”の設計が競争軸になりつつあります。

【AIニュース】“待たないAI”と“守れないエージェント”——先手を打つ設計が問われる週

Anthropicが「Orbit」で先回り型AIの本格展開を宣言し、iOS 27がAI選択の自由を開放。一方でエージェント普及の影で、認可設計と多段伝播攻撃が実運用上の急所として浮上しました。

【AIニュース】ベンチマーク再設計と“道具立て”の自動進化が示す、エージェント実用化の次の壁

AIエージェント評価が『単発の正解率』から『長期タスクの信頼性』へ移行しつつあります。加えて、エージェントを強くする“ハーネス”自体を自動で改良する研究も登場しました。