LLM

タグ: LLM

【AIニュース】Fable 5でAnthropicが頂点へ、Gemini 3.5 FlashはSearch制覇、そしてAIがDeFiを動かす時代

AnthropicがClaude Fable 5とMythos 5を発表し、SWE-Benchで圧倒的スコアを記録。Google SearchのAIモードがGemini 3.5 Flashをデフォルトにし、MetaMask Agent WalletでAIが自律的にDeFi取引を行う時代が幕を開けた。

【AIニュース】オープン最強モデル登場とエージェント速度競争の新局面

NVIDIAが550BパラメータのオープンモデルNemotron 3 Ultraを公開し、Gemini 3.5 FlashがGA達成。Claude Opus 4.8も主要ベンチマークで全モデルトップに立つなど、エージェント向けLLM競争が一気に加速した。

【AIニュース】学習コスト3倍速・FDE常駐戦略・二次計算破壊――実用化を加速する2026年6月の三大潮流

LLM学習速度を最大3倍にするMITの新手法、OpenAI・AnthropicのFDE（現地常駐エンジニア）戦略、そして二次計算を排除した超長文脈アーキテクチャまで、AIの実用化を後押しする最新動向を解説する。

【AIニュース】トランスフォーマーの壁を超えたSubQと欧州AI再編・OpenAI新モデルの加速

サブ二乗型アーキテクチャのSubQ登場、GPT-5.5 Instantの全ユーザー展開、Cohere×Aleph Alphaの200億ドル合併など、2026年5月のAI業界を揺るがす動きをまとめる。

【AIニュース】Cloudflare推論技術の深化とAlibaba自社チップ×LLMの35時間自律エージェント

CloudflareのRust製推論エンジンとロスレス圧縩22%圧縮技術、AlibabaのZhenwu M890チップとQwen3.7-Maxによる35時間自律コーディングデモを解説する。

【AIニュース】非トランスフォーマーLLMの台頭と中国勢の推論コスト競争

「二乗の壁」を破るSubQの登場、12日間で4つのオープンウェイトコーディングモデルを投入した中国勢の動向、消費電力を100分の1に削減するニューロシンボリックAIの研究成果を解説する。

【AIニュース】準二次アーキテクチャの登場とAIをめぐる地政学的再編

準二次アーキテクチャを採用した初の商用LLM「SubQ」の登場、OpenAIのGPT-5.5 Instant、Cohere×Aleph Alpha合併、米中AI摩擦など、2026年5月の主要動向をまとめる。

【まとめ】Copilotで使えるAIモデル一覧 — コスト・コンテキスト・用途を比較

GitHub CopilotやClaude Codeで選べるAIモデルをコスト・コンテキストサイズ・得意分野で整理した実務向け早見表。

【AIニュース】AnthropicのOpenAI逆転とサブ二乗アーキテクチャの衝撃

ビジネス採用率でAnthropicがOpenAIを初めて逆転し、SMB向けエージェント展開が本格化。同時にサブ二乗アテンションで1200万トークンを低コストで処理するSubQが登場し、Transformerの前提を揺さぶる。

【AIニュース】オープンウェイトのフロンティア追随とエージェントインフラの成熟

Kimi K2.6・DeepSeek V4のオープンウェイトモデルがクローズドモデルと並ぶ性能を示し、KVキャッシュ圧縮やエッジ推論インフラの整備が実務コストを急速に引き下げている。

【AIニュース】推論コストの激変とインフラ成熟——エージェント時代の“地盤”が固まる

DeepSeek V4がMITライセンスでオープンソース化され、推論コストの構造が激変。Cloudflareはエージェント専用インフラ「Infire」で分散推論の基盤を整備。モデルの賢さより“動かす地盤”の設計が競争軸になりつつあります。

【AIニュース】“待たないAI”と“守れないエージェント”——先手を打つ設計が問われる週

Anthropicが「Orbit」で先回り型AIの本格展開を宣言し、iOS 27がAI選択の自由を開放。一方でエージェント普及の影で、認可設計と多段伝播攻撃が実運用上の急所として浮上しました。

【AIニュース】計算資源の争奪と“見える化”が迫る、エージェント実運用の次の論点

今週は、計算資源の確保競争がプロダクト体験に直結し始めた動きと、LLMが参照した文脈を“見える化”する潮流が同時に加速しました。運用と監査の設計をどう更新するかが焦点です。

【AIニュース】ツール呼び出し最適化が示す、エージェント実装の“次の当たり前”

AIエージェントの実運用で効くのは『ツールを増やすこと』ではなく『呼ぶべき時にだけ呼ぶこと』。最新研究と事例から、ツール呼び出しの評価・制御・安全性の論点を整理します。

【AIニュース】ベンチマーク再設計と“道具立て”の自動進化が示す、エージェント実用化の次の壁

AIエージェント評価が『単発の正解率』から『長期タスクの信頼性』へ移行しつつあります。加えて、エージェントを強くする“ハーネス”自体を自動で改良する研究も登場しました。

DeepSeek V4登場で『AIは高い』が揺らぐ：GPT-5.4の約1/50出力コストが示す価格破壊

DeepSeek V4 Previewの公開により、長文コンテキストとエージェント用途のAIコストが大きく下がる可能性が見えてきました。公式価格とGPT-5.4との比較から、生成AIの価格競争を整理します。

【AI開発】SkillとAgentを増やしすぎない設計指針

Copilotや各種LLMツールを実務で使うときに起きがちな、Skillを盛り込みすぎる問題とAgentを増やしすぎる問題を対比し、設計上の考え方を整理します。

【AIニュース】エージェントの“世界モデル化”と推論コスト最適化が現実解に近づく

エージェントの世界理解（world modeling）の整理が進む一方、運用コスト（トークン消費）と推論表現（潜在CoT）の最適化が実務課題として前面に出てきました。研究の枠組みが、そのままプロダクト運用の設計図になりつつあります。

【AI開発】エージェントAI設計パターンを4レイヤで整理する

エージェントAIの設計パターンを、ゴール・計画、推論・自己改善、協調、安全性ガードの4レイヤに分け、開発者視点で使い分けを整理します。

【AI開発】エージェントAIの設計パターン入門

エージェントAIを設計するときに押さえたい基本パターンを、ReAct、リフレクション、計画、ツール利用、マルチエージェントの観点から整理します。

【AIニュース】オープンモデルの信頼性検証とエージェント実運用が前に進む

オープンモデルを“どこで動かしても同じ品質”に近づける検証の動きと、コーディングエージェント性能を押し上げる新モデルの要点を整理します。

【AIニュース】推論高速化・エージェント記憶・指示追従の脆さが同時に進む

LLMの推論を速くする新手法、エージェントの長期記憶を強化する設計、そして指示追従モデルの予期せぬ脆弱性が同時に浮上。運用設計と評価の作法がアップデート局面に入っています。

【AIニュース】エージェント運用の基盤整備と指示追従の脆さが突きつけるガバナンス

マネージドなAIエージェント基盤の整備が進む一方で、instruction tuning由来の脆さや、クレジット消費・権限行使のガバナンス課題が表面化しています。

【AIニュース】音声マルチモーダルの拡張と、エージェント運用・安全性の実装が加速

音声を長時間・高精度に扱う大規模音声言語モデルの進展と、AIエージェントを本番で回すための運用基盤・安全性検証の研究が加速。研究と実装の距離が一段と縮まっています。