Skip to content

【AIニュース】AIが80年来の数学難問を自力証明、760Mパラメータで最先端を超える小型モデルも登場

OpenAIの汎用推論モデルが1946年提唱の未解決数学問題を自律的に証明し、AI史上初の本格的な科学的発見を達成。一方でZyphra社のZAYA1-8Bは760Mの実行パラメータで数学オリンピック予選91.9%を記録し、小型モデルの常識を塗り替えた。

AI研究の最前線で「賢さ」と「効率」の両極端を示す二つの出来事が重なった。一方でOpenAIの汎用推論モデルが80年間未解決だった数学の難問を自力で解き、AI史上初の本格的な自律数学発見を達成した。もう一方では、実行時に使うパラメータがわずか760Mというコンパクトなモデルが数学オリンピック予選で最先端クラスのスコアを叩き出し、「小さくても賢い」時代の到来を告げた。

OpenAIのAIが80年来の数学難問を自力証明

5月20日、OpenAIは公式ブログで重大な発表をした。社内の汎用推論モデルが、数学者のポール・エルデシュが1946年に提唱した離散幾何学の予想を自律的に否定する証明を発見したというものだ。

問題の中身をひとことで言うと

「平面上にn個の点を置くとき、ちょうど1単位の距離になる点ペアは最大で何組作れるか」という問いだ。エルデシュは正方グリッド(縦横等間隔の格子状配置)がほぼ最善だと予想していた。80年間、数学者たちもその前提を疑わなかった。

AIが発見したこと

OpenAIのモデルは代数的整数論の一分野「ゴロド=シャファレヴィッチ理論(無限の代数的拡大体を構成する技法)」を独自に応用し、正方グリッドを多項式的に上回る無限個の点配置の族を発見した。出力は125ページの証明書類で、外部の数学者(プリンストン大学のWill Sawin氏)が検証・改良を加え、改善量を示す定数δ=0.014として確定させた。

なぜこれが特別なのか

過去にもAIが数学の問題を解いた例はあったが、今回の意義は二点ある。一つ目は「数学専用に訓練されたモデルではなく汎用モデル」が達成した点。二つ目は「著名なサブ分野の中心的な未解決問題」が対象だった点だ。計算機を使った証明補助ツールとは次元が異なり、AIが新しい数学的アイデアを自分で生み出したと言える。

実務上の示唆

  • 「AIは資料をまとめるだけ」という認識はもはや実態を反映していない。仮説生成や定理探索への応用が現実的な選択肢になりつつある
  • 一方で今回も外部数学者による検証が不可欠だったように、AIの出力を批判的に確認するプロセスは引き続き必要だ
  • 製薬・材料科学・経済モデルなど「仮説の数が膨大な分野」への応用研究が今後加速するとみられる

ZAYA1-8B:760Mの実行パラメータで数学オリンピックを攻略

5月6〜7日、スタートアップのZyphra社がZAYA1-8BをApache 2.0ライセンスで公開した。名前に「8B」とあるが、実際に推論時に動かすパラメータは760M(約7億6000万)だけだ。この数字の意味を実感するために比べると、GPT-3は1750億パラメータを常時フル稼働させていた。

MoEという「専門家チーム」の仕組み

MoE(Mixture of Experts:入力ごとに一部の専門サブモデルだけを呼び出す構造)は、全パラメータを毎回使わずに済む設計だ。本の索引と似ていて、質問の内容に応じて「その分野が得意な専門家」だけが計算を担当する。ZAYA1-8Bは8.4Bのパラメータを持ちながら、1回の推論では760M分しか動かさない。

ベンチマーク結果

VentureBeatの記事によると、数学オリンピック予選に相当するAIME'25で**91.9%**を記録した。GPT-4o・Claude 4.5 Sonnet・Gemini 2.5 Proといった大型フロンティアモデルの上限とされる約90%を上回る。コーディング評価LiveCodeBenchも65.8%と実用域だ。

AMD製GPUで訓練したことの意味

学習にはAMD Instinct MI300XとAMD Pensando Pollaraネットワークを使ったIBM Cloudクラスターを利用した。NVIDIAのH100/H200が事実上の標準だったAI訓練インフラにおいて、AMD環境でここまでの性能を実現したことは、GPU市場の多様化を示す事例として業界に注目されている。

KVキャッシュ圧縮という技術上のポイント

ZAYA1-8BはCCA(Compressed Convolutional Attention:圧縮畳み込みアテンション)という独自の仕組みを使い、KVキャッシュ(モデルが文脈を保持するための一時メモリ)を通常比8分の1に圧縮する。長い文章を処理するほどメモリ消費が増える問題(計算量が文章の長さの2乗に比例して増える「2乗問題」)を緩和し、限られたメモリでも長い会話を扱いやすくしている。

実務上の示唆

  • Apache 2.0ライセンスのため商用利用・改変が自由。社内システムへの組み込みや派生モデルの開発に使いやすい
  • 実行パラメータが小さい分、APIコストや自前サーバーの消費電力を大幅に抑えられる。数学・コーディング特化の用途では大型モデルを使わない選択肢として検討の価値がある
  • AMDエコシステムでの訓練実績は、NVIDIA依存から脱却したいインフラ担当者にとって有力な事例になる

まとめ

今週のAIニュースは「どこまで賢くなれるか」と「どこまで小さくできるか」という二つの問いへの答えが同時に更新された週だった。OpenAIのモデルは80年分の数学的直感を覆す発見をし、ZAYA1-8Bは760Mという小さな体で大型モデルの背中を追い越した。どちらの進展も、AIを「使う側」として見ると、選択肢と可能性の広がりを意味している。