Skip to content

カテゴリ: AIニュース

【AIニュース】AIが80年来の数学難問を自力証明、760Mパラメータで最先端を超える小型モデルも登場

OpenAIの汎用推論モデルが1946年提唱の未解決数学問題を自律的に証明し、AI史上初の本格的な科学的発見を達成。一方でZyphra社のZAYA1-8Bは760Mの実行パラメータで数学オリンピック予選91.9%を記録し、小型モデルの常識を塗り替えた。

【AIニュース】ChatGPTの記憶革命とGoogle I/O 2026:エージェント時代が動き出した

ChatGPTのデフォルトモデルがGPT-5.5 Instantに切り替わり記憶機能が大幅強化。一方Google I/O 2026ではGemini 3.5 Flashとエージェント開発プラットフォームAntigravityが発表され、AIがチャットボットから自律行動するエージェントへ本格移行した。

【AIニュース】マルチモーダルAIエージェントと専門職自動化の加速―Thinking Machines・Google Android・Microsoft Legal Agent

Mira MuratiのThinking Machinesによるリアルタイム協働AI、GoogleのAndroid向けマルチステップAIエージェント、Gemini 3.1 Flash-Liteの一般提供、MicrosoftのLegal Agentなど、2026年5月15日のAI最前線をまとめる。

【AIニュース】推論コストの激変とインフラ成熟——エージェント時代の“地盤”が固まる

DeepSeek V4がMITライセンスでオープンソース化され、推論コストの構造が激変。Cloudflareはエージェント専用インフラ「Infire」で分散推論の基盤を整備。モデルの賢さより“動かす地盤”の設計が競争軸になりつつあります。

【AIニュース】“待たないAI”と“守れないエージェント”——先手を打つ設計が問われる週

Anthropicが「Orbit」で先回り型AIの本格展開を宣言し、iOS 27がAI選択の自由を開放。一方でエージェント普及の影で、認可設計と多段伝播攻撃が実運用上の急所として浮上しました。

【AIニュース】ベンチマーク再設計と“道具立て”の自動進化が示す、エージェント実用化の次の壁

AIエージェント評価が『単発の正解率』から『長期タスクの信頼性』へ移行しつつあります。加えて、エージェントを強くする“ハーネス”自体を自動で改良する研究も登場しました。

【AIニュース】エージェントの“世界モデル化”と推論コスト最適化が現実解に近づく

エージェントの世界理解(world modeling)の整理が進む一方、運用コスト(トークン消費)と推論表現(潜在CoT)の最適化が実務課題として前面に出てきました。研究の枠組みが、そのままプロダクト運用の設計図になりつつあります。

【AIニュース】オープンウェイトの“コーディングエージェント化”と、根拠ある推論の訓練が主戦場に

オープンウェイトLLMがコーディングエージェントとしての実用域に入りつつある一方で、推論の“それっぽさ”を排し、根拠に基づく意思決定をどう学習させるかが研究の焦点になっています。

【AIニュース】推論高速化・エージェント記憶・指示追従の脆さが同時に進む

LLMの推論を速くする新手法、エージェントの長期記憶を強化する設計、そして指示追従モデルの予期せぬ脆弱性が同時に浮上。運用設計と評価の作法がアップデート局面に入っています。