WEB3業界動向

OpenAI、スマートコントラクト向け安全性評価基盤「EVMbench」発表

センチメンタルな岩狸

センチメンタルな岩狸

0
0
サムネ


OpenAI、Paradigmと共同でEVMbench開発 120件の高深刻度脆弱性を収録

米OpenAIは、イーサリアム仮想マシン(EVM)に対応するスマートコントラクトの安全性を評価する新たなベンチマーク「EVMbench(イーブイエムベンチ)」を発表しました。

EVMbenchは、ブロックチェーン上で稼働するスマートコントラクトに潜む脆弱性に対し、AIモデルがどの程度適切に対応できるかを測定する評価基盤です。暗号資産分野の投資会社Paradigmと共同で開発され、実際の監査コンペティションや公開監査レポートから抽出された120件の高深刻度の脆弱性が収録されているといいます。


背景にあるハッキング被害と防御需要

スマートコントラクトは、分散型金融(DeFi)やNFTなど各種ブロックチェーンサービスの中核を担う自動実行型プログラムであり、設計や実装の不備は巨額の資金流出につながる可能性があります。これまでにも大規模なハッキング被害が発生しており、安全性の向上は業界全体の喫緊の課題となっています。こうした背景から、AIによる脆弱性の検出や修正を通じた防御的活用が注目されています。


「Detect」「Patch」「Exploit」の3モードで評価

EVMbenchでは、AIの能力を三つの観点から評価します。第一は、コード内の欠陥や設計上の問題点を見つけ出す「検出(Detect)」です。第二は、発見した脆弱性を安全な実装へと修正する「修正(Patch)」です。そして第三は、発見した脆弱性をサンドボックス環境下で実際に悪用する攻撃シナリオを実行し、その影響を測る「悪用(Exploit)」です。これらの評価は単に説明するだけでなく、実行を伴うテストによって採点される点が特徴です。


GPT-5.3-Codexが72.2%を記録

OpenAIによると、EVMbenchの評価結果から、AIモデルは「悪用」タスクで比較的高いパフォーマンスを示す一方、検出や修正では依然として課題が残ることが明らかになったといいます。特に「Exploit」モードでは、GPT-5.3-Codexが72.2%を記録し、約6か月前に公開されたGPT-5の31.9%から大きく向上しました。これは、脆弱性を実際に突いて資金流出攻撃を成立させるテストにおいて、成功率が大幅に高まったことを示しています。一方で、コード全体を網羅的に監査する検出や、機能を維持しながら安全に修正する作業については、なお改善の余地があるとしています。こうした結果を踏まえ、同社はAIを防御的に活用するセキュリティ研究の強化を進める方針です。


AI監査の実用化は進むか

このベンチマークは、AIが単なるコード補助ツールにとどまらず、セキュリティ監査の現場で実践的な支援役を担えるかどうかを検証する重要な基盤となりそうです。今後、開発者コミュニティや監査企業による活用が進めば、スマートコントラクトの品質向上やハッキング被害の抑止につながることが期待されます。AIと人間の専門知識を組み合わせた新たな監査体制の確立に向け、業界の動向が注目されます。

Web3OpenAIEVMbenchParadigmスマートコントラクトブロックチェーンDeFiNFT暗号資産仮想通貨サイバーセキュリティAI生成AIセキュリティ監査イーサリアムEVM
センチメンタルな岩狸

センチメンタルな岩狸

このニュースをシェア

コメント

0件のコメント
コメントがありません。