AI

タグ: AI

【AIニュース】ベンチマーク再設計と“道具立て”の自動進化が示す、エージェント実用化の次の壁

AIエージェント評価が『単発の正解率』から『長期タスクの信頼性』へ移行しつつあります。加えて、エージェントを強くする“ハーネス”自体を自動で改良する研究も登場しました。

AIサービスの課金は「月額」から「トークン従量制」へ：背景と今後の予想

AIサービスプロバイダがトークン利用量に応じた課金体系へ移行している背景を整理し、今後の料金モデルや開発者への影響を考察します。

『答えるAI』から『動くAI』へ：2026年4月にAIエージェントが本格普及へ進んだ理由

2026年4月は、AIエージェントが実験段階から企業導入段階へ移る節目になりました。OpenAI、Google Cloud、Microsoftの発表から流れを整理します。

AnthropicとGoogle Cloud連携強化：Claudeを支えるTPU戦略とエンタープライズAI基盤

AnthropicはGoogleとBroadcomとの連携を拡大し、Claude向けの次世代TPU容量を確保しました。Google Cloud Next 2026のエージェント戦略とあわせて整理します。

DeepSeek V4登場で『AIは高い』が揺らぐ：GPT-5.4の約1/50出力コストが示す価格破壊

DeepSeek V4 Previewの公開により、長文コンテキストとエージェント用途のAIコストが大きく下がる可能性が見えてきました。公式価格とGPT-5.4との比較から、生成AIの価格競争を整理します。

GPT-5リリースから約8ヶ月：統合モデルが変えたChatGPTとエージェントAIの現在地

GPT-5は2025年8月に登場し、OpenAI初の統合モデルとしてChatGPTとAPIの使い方を変えました。リリースから約8ヶ月後の意味を整理します。

OpenAI GPT-4.1シリーズを再評価：コーディング・指示追従・長文処理を底上げした開発者向けモデル

OpenAIのGPT-4.1、GPT-4.1 mini、GPT-4.1 nanoは、コーディング、指示追従、長文コンテキストで大きな改善を示した開発者向けモデル群です。2026年時点の意味を整理します。

OpenAI Sora終了：アプリ停止とDisney提携破談が示す生成動画ビジネスの難しさ

OpenAIはSoraのWeb・アプリ体験を2026年4月26日に終了し、APIも9月24日に停止予定です。生成動画アプリが直面したコスト、著作権、事業性の問題を整理します。

OpenAI、生命科学向けGPT-Rosalindを発表：創薬研究に特化するAIモデルの始まり

GPT-Rosalindは、生命科学R&D向けに設計されたOpenAIの専門モデルです。研究プレビューの対象、対応ワークフロー、安全性の制約を整理します。

【AI週報】エージェントAIと計算資源争奪が加速した1週間

直近1週間のAIサービスプロバイダ関連ニュースを、エージェント化、企業導入、計算資源競争の観点から整理します。