ナビゲーションをスキップする
BlackBerry ブログ

サイバーセキュリティにおけるAI予測:何が有効なのかと、それを理解する方法

原文のブログはこちらからご覧いただけます。
 

サイバーセキュリティにおける人工知能(AI)に関して、最も重要なことは何でしょうか。それは結果です。

脅威の状況が変化し攻守双方が使用できるツールセットに生成 AI が加わる中、さまざまな AI ベースのセキュリティ製品の相対的な有効性の評価はますます重要に、かつ困難になっています。誇大広告ではなく価値と ROI を実現するソリューションを見つけるためには、適切な質問が役立ちます。例えば、「使用している予測 AI ツールは新しい脅威を十分阻止できるか ?」、「AI活用型のサイバーセキュリティプラットフォームにおける成功を本当に示すものは何か ?」といった質問です。

BlackBerry の AI および ML (機械学習)の特許ポートフォリオが証明しているように、BlackBerry はこの分野のリーダーであり、「何が」「なぜ」有効なのかに関する視点を、非常に豊富な情報によって育ててきました。このブログではその点について明らかにし、今非常に関心の高いこのトピックについて探っていきます。

サイバーセキュリティにおける AI の進化

サイバーセキュリティにおける AI と ML の最初の利用例は、10 年以上前の CylancePROTECT®︎ EPP (エンドポイント防御プラットフォーム)の開発にまで遡ります。しかし今日においては、新たなマルウェア攻撃の予測と予防は、間違いなく重要性を増しています。なぜなら、脅威アクターは生成 AI の助けを借り、迅速な新しいコードの作成とテストが可能になっているためです。最新の BlackBerryの グローバル脅威インテリジェンスレポートでは、新しいマルウェア攻撃が、四半期ごとに 13% の勢いで急増していることが明らかになっています。こういった攻撃の予防が困難な課題である状況は続いていますが、幸いにも技術の進化が攻撃の進化を迎え撃っています。

BlackBerry のデータサイエンスおよびMLチームは、当社の予測 AI ツールモデルの性能と有効性の改善に継続的に取り組んでいます。最近のサードパーティによるテストでは、BlackBerryの CylanceENDPOINT®︎ が脅威全体の 98.9% を阻止していることが明らかになっています。新種のマルウェア株であっても、その挙動を能動的に予測できることがその理由です。このレベルの有効性の達成は至難であり、適切な指標のタイプに関するモデルの訓練を精確に行うことが求められます。

BlackBerryは過去 10 年にわたり継続的に、 AI の改良、実験、発展に取り組み、最高の成績をおさめてきました。当社の主な方針変更には、初期のモデルでの人間によるラベル付けを用いた教師あり学習のみから、教師なし学習、教師あり学習、能動学習などを組み合わせたトレーニング手法への移行があり、それをクラウドと防護対象のエンドポイントの両方で行うようにした点が挙げられます。また、時間をかけて非常に膨大なデータを吟味し、利用する属性とデータセットを最適化して、最高の予測成績が得られるようにしました。このような継続的な改良により、実世界での応用に非常に適したモデルが得られました。新しい脅威の正確な予測と予想が可能なモデルです。

時間的優位性:時間を考慮する

ML モデルの質と有効性に関する今日の議論は、モデルのサイズ、パラメータ数、確立されたテストデータでの性能の 3 つを中心に展開されることが多く、優れた AI が提供できる重要な成績、すなわち時間は考慮されません。

言語、視覚、物体の分類や識別タスクなど特定の領域では、時間は評価における重要な特性とはされません。しかし、サイバーセキュリティにおいて、時間は非常に重要です。実際、マルウェアの実行前防御の文脈では、脅威検知の時間が重要です。マルウェアが展開され実行される前に、それをモデルが発見して阻止するという文脈です。

MLで敵対的挙動の予測を行うことに加え、モデルの検証では時間的な回復力も考慮し、過去と未来の両方の攻撃に対して有効であることを証明する必要があります。この文脈で最も重要な指標は、長期にわたるモデルの予測優位性です。TPA (時間的予測優位性)は、当社のデータサイエンスチーム内で、将来の脅威に対するモデルの性能を評価するために使用されている用語です。

このコンセプトは、セキュリティアルゴリズムや暗号設計の評価に由来しています。その評価では、暗号の時間不変性、つまり、入力に対するシステムの応答が入力信号の発生タイミングに関係なく予測可能で正確かどうかを測定します。

例を挙げましょう。私たちは、時間を進めることも戻すこともできないため、過去の各種のマルウェアを使用してモデルのトレーニングを行い、それを現在の新しいマルウェアでテストします。この時間的なテストの目的は、ゼロデイ防御の検知に重要な、時間が経過する中での一般化された性能を検証することです。このテストを行うことで、モデルアーキテクチャをトレーニングし、悪意のある意図を学習して検知する能力を評価できます。

「なぜそれが重要なのか」という疑問はもっともです。クラウドではモデルを頻繁に更新できるため、通常、ほとんどのモデルはクラウドから供給されます。しかし、IoT や規制のある産業であったり、接続されていなかったり、意図的に隔絶されていたりするなど、クラウドに接続されていないエンドポイントは多数あります。こういった場合、モデルの更新は必ずしも実行可能ではありません。クラウドに強く依存している ML モデルでは、接続が失われることで検知率が大きく下がります。しかし、最近のサードパーティによる解析によると、当社が BlackBerry Cylance のモデルを構築した方法では、接続の有無に関わりなく、マルウェアの検知と継続的な防御が同じレベルで行われていることが分かりました。BlackBerryの製品はクラウド活用型であり、クラウド依存型ではないのです。

さらに重要な点があります。ベンダーによるモデルのアップデート配信が頻繁な場合、ML モデルの未熟さを示している可能性があります。アップデートがなければ、モデルのドリフト(予測性能の低下)が早まり、マルウェア種の検知漏れが急激に増加する可能性があります。それに対して、次のグラフでは、第 4 世代 Cylance モデルを新種のマルウェアに対してテストした際の TPA (時間的予測優位性)を月ごとに示しています。モデルの更新なしで、どのくらい先まで脅威を検知し阻止できたのでしょうか ?

グラフ 1 :第 4 世代 Cylance AI モデルの時間的予測優位性を示すグラフ。これが示すのはモデルの更新なしで防御が持続した期間であり、この場合は 6 か月先から 18 か月先まで持続。

最長 18 か月、モデルの更新なしで防御が持続しました。ここでも、モデルの成熟度とトレーニングの正確さが明らかになりました。こうしたことは偶然には起こり得ません。

成熟した AI が予測し予防する未来の回避型脅威

CylanceENDPOINT には、他とは一線を画す新しい ML モデル推論技術があります。この技術は、初めて見るものでも、それが脅威かどうかを演繹、もしくは「推論」できます。当社のアプローチでは、まだ ML ライブラリやモデル提供ツールが入手できなかった 7 年前に考え出されたコンセプトである、独自のハイブリッド型分散推論を採用しています。当社の最新モデルはこのアプローチから生まれ、この技術の何世代にもわたる革新と改良の頂点を表すものです。

成熟した AI が回避型マルウェアをどのくらい検知できるかについては、下のグラフで、例えば Sality マルウェアと Parite マルウェアの検知に注目してください。どちらもポリモーフィック型マルウェアの亜種であり、検知回避の試みとして自身の異なるバージョンを生成します。従来の手法、例えばシグネチャやヒューリスティクス、あるいは未熟な機械学習手法などで検知することは非常に困難です。AI や ML のモデルは、どのようなマーケティングが行われているかにかかわらず、すべて同じではありません。

グラフ 2 :当社のシステムで30 日間に観測されたマルウェア種を示すグラフ。これらの一部は新しい種や更新されたものであり、過去に確認されたことのない種類にも関わらず、このモデルは検知。
 

RedLine インフォスティーラは、2020 年初頭に高い複製性を備えた「サービスとしてのマルウェア」として登場しました。ChatGPT、Bard、Facebook の広告などに高頻度で潜伏しています。

検知の準備はできているでしょうか ? 次のグラフでは、ポリモーフィック型マルウェア種 Sality と「サービスとしてのマルウェア」種 RedLine の 2 つの種に対するモデルの性能を示しています(注:PE4C、PE6E、PE7D はモデルの世代であり、PE7D が最新です)。

グラフ 3a、3b :複数世代の Cylance モデルを示すグラフ。ML モデルが数年前のものであっても、ポリモーフィック型マルウェア Sality (左)と RedLine インフォスティーラ(右)の両方で高い正検知率を示す。
 

これらのモデルの時間的予測優位性が、この結果によく表れています。3 年以上前にリリースされた第 6 世代のモデルは、このマルウェアを正しく特定、つまり「正検知」し、最新のモデルアップデートでは RedLine の新しい亜種の 99% 以上を正検知しています(このグラフでは、数値が大きいほど優れた結果となります)。

また、以下に示すのは、LockBit (左)や Maze (右)など、興味深い特定の種のランサムウェアに対するモデルの性能のグラフです。これらの結果から、当社の ML モデルに共通する予測優位性があることが分かります。また、当社の最新版モデルである PE7D で、これらの亜種の 99% 以上を正検知していることも注目に値します。

グラフ 4a、4b :複数世代の Cylance モデルの性能を示すぐラフ。数年前のML モデルであっても、LockBit (左)と Maze マルウェア(右)の高い正検知率を示している。

それでは、これらの結果からさらに広げ、30 日間に観測されたすべてのマルウェア種に対するモデルの全体的な性能を見てみましょう。次のグラフをご覧ください。数値が小さいほど、優れています。

グラフ 5 :Cylance モデルの各世代で検知漏れ率が非常に低いことを示すグラフ。これは、各モデルが悪意あるマルウェアの認識に失敗した場合を示すため、数値が小さいほど優れている。

上のグラフは、見逃しの割合を示しています。これは、モデルが、あるマルウェア株が示す挙動を誤って良性と特定したために、マルウェアとして正しく検知しなかった場合を指しています。この場合、全体に占める見逃しの割合を示しているため、スコアが小さいほど優れています。最近の各種マルウェアに関する 30 日間の観察の結果、当社の最新世代のモデルの検知漏れ率は全カテゴリで 0.005% を下回り、一つ前の世代でも 0.01% 未満となっています。

マルウェアを予測:最も成熟した Cylance モデル

BlackBerryの最新モデルは、ペタバイト級のデータ量を持ち、長期的に観察されたマルウェアの挙動からなる多様なデータセットを利用できるため、これまでで最も強力なモデルとなっています。時間的予測優位性を含むさまざまな性能指標において、先行モデルすべてを凌駕しています。

BlackBerry Cylance AI は、5 億以上のサンプルを数十億の特徴量で評価し、先行する各世代が長期にわたり獲得したインサイトからの推論結果を得て、極めて望ましい結果を実現し続けています。また、ローカルとクラウド両方での分散推論をサポートしているため、素晴らしいスピードを誇ります。

BlackBerryによるサイバーセキュリティへのMLの適用は十分に確立されており、当社はこの分野でイノベーションを牽引していることを喜ばしく思っています。サイバー攻撃を行う側も AI の採用を続ける中、結果に焦点を置いたサイバーセキュリティ防御態勢の確立が、これまで以上に重要です。

Cylance AI はその誕生以来、年単位の予測優位性を武器に、世界中の企業や政府をサイバー攻撃から防御してきました。BlackBerry の Cylance AI は、競合他社との比較においてマルウェアを 36% 以上多く、12 倍高速に、20 倍の低オーバーヘッドで阻止し、お客様を支援しています。これらの成績が示すのは、すべての AI が等しく作られているのではないこと、そしてCylance AI がどのAIとも異なるという事実です。

同様の記事やニュースの配信を希望される場合は、BlackBerry ブログの購読をご検討ください。

イベント日程
Shiladitya Sircar

About Shiladitya Sircar

Shiladitya Sircar は、BlackBerry のプロダクト エンジニアリングおよびデータ サイエンス担当上級副社長です。