NYUタンドン大学の研究者らは、サイバーセキュリティの課題を自律的に解決するAIエージェントであるEnIGMAを発表し、現実世界のアプリケーションを変革し、セキュリティ対策を強化する可能性を強調した。
ニューヨーク大学タンドン工学部の研究者らは、ニューヨーク大学アブダビ校やその他の協力機関と共同で、複雑なサイバーセキュリティの課題に自律的に対処するために設計された高度なAIエージェントを発表した。 エニグマこの画期的な成果は、2025年の国際機械学習会議(ICML)で発表され、この分野における目覚ましい進歩を示しました。
「EnIGMAは、大規模言語モデルエージェントをサイバーセキュリティアプリケーションに使用することを目的としています」と、ニューヨーク大学タンドン校の博士課程学生で共著者のミート・ウデシ氏はニュースリリースで述べています。
EnIGMA は、ニューヨーク大学タンドン校の電気・コンピューター工学科 (ECE) の学科長であり、ニューヨーク大学サイバーセキュリティセンターおよびニューヨーク大学先端電気通信技術センター (CATT) の教員でもある Ramesh Karri 氏と、ECE 教授であり CATT の教員でもある Farshad Khorrami 氏の指導の下、Udeshi 氏が主導した共同作業の集大成です。
この研究には、ニューヨーク大学アブダビ校、プリンストン大学、スタンフォード大学の多様な学識者からの意見も反映されている。
従来の AI システムは、ソフトウェア開発や Web ナビゲーションなどの分野ですでにその価値を実証していますが、サイバーセキュリティは多くの既存の AI フレームワークを不十分にする独自の課題をもたらしました。
しかし、EnIGMA は「インタラクティブ エージェント ツール」と呼ばれる特殊なフレームワークを活用して、視覚的なサイバーセキュリティ プログラムを AI モデルが理解できるテキストベースの形式に変換します。
「LLMに適切に入力するには、これらのインターフェースを再構築する必要があります。そのため、いくつかのサイバーセキュリティツールでこれを実現しました」とウデシ氏は付け加えた。
この革新的なアプローチにより、AI はテキストを処理できるようになり、デバッガーやネットワーク アナライザーなどのサイバーセキュリティ ツールで一般的に使用されている従来のグラフィカル インターフェイスの制限を克服できます。
EnIGMAの開発において極めて重要な役割を果たしたのは、カスタマイズされたキャプチャー・ザ・フラッグ(CTF)ベンチマークデータセットの作成でした。現実世界の脆弱性をシミュレートし、学術的な競技会でも使用されるこれらのCTF課題は、AIのトレーニングにおいて重要な役割を果たしました。
「CTFは、学術的な競技で使われるサイバーセキュリティのゲーム版のようなものです。現実世界で直面する真のサイバーセキュリティの問題ではありませんが、非常に優れたシミュレーションです」とウデシ氏は付け加えました。
この研究では、EnIGMAが390つのベンチマークにわたるXNUMXのCTF課題において優位性を示し、最先端の結果を達成しました。このAIエージェントは、従来のシステムと比較してXNUMX倍以上の課題を解決しました。
AIモデルの進化を振り返り、ウデシ氏は「当時はAnthropicのClaude 3.5 Sonnetが最高のモデルで、GPT-4oがXNUMX番目だった」と述べています。
研究チームは研究の過程で、「独白」と呼ばれる現象を発見しました。これは、AIが環境と実際に相互作用することなく、幻覚的な観察を生成する現象です。この発見は、今後のAIの安全性と信頼性に重要な影響を与える可能性があります。
学術的な称賛を超えて、EnIGMA の影響は実用的なアプリケーションにも及びます。
ウデシ氏は、「これらのCTFを解決できる自律型LLMエージェントを考えてみると、そのエージェントは他のサイバーセキュリティタスクにも使用できる十分なサイバーセキュリティスキルを備えています。」と述べています。
このようなエージェントがその機能を現実世界の脆弱性評価に適用し、何百もの異なるアプローチを自律的に試行するという見通しは、サイバーセキュリティ運用における変革的な変化を示しています。
しかし、この技術は二重用途であるため、注意が必要です。サイバーセキュリティ対策の強化が期待される一方で、悪用される可能性も秘めています。
これを踏まえ、研究者らはMeta、Anthropic、OpenAIなど大手AI企業に研究結果を報告した。
出典: ニューヨーク大学タンドン工学部
