この記事では、攻撃の自動生成と攻撃の拡張を含む、複数ステップの文字改変攻撃パイプラインについて詳述しています。この記事では、攻撃の自動生成と攻撃の拡張を含む、複数ステップの文字改変攻撃パイプラインについて詳述しています。

ビジョンLLMを誤導するためのディレクティブを使用した敵対的攻撃生成の方法論

出典：Hackernoon

2025/10/01 03:00

6 分で読めます

本コンテンツに関するご意見・ご感想は、crypto.news@mexc.comまでご連絡ください。

リンク一覧

概要と1. はじめに

関連研究

2.1 ビジョン-LLM

2.2 転移可能な敵対的攻撃
予備知識

3.1 自己回帰型ビジョン-LLMの再考

3.2 ビジョン-LLMベースのADシステムにおける文字攻撃
方法論

4.1 文字攻撃の自動生成

4.2 文字攻撃の拡張

4.3 文字攻撃の実現
実験
結論と参考文献

4 方法論

図1は、私たちの文字攻撃パイプラインの概要を示しており、プロンプトエンジニアリングから攻撃アノテーションまでの流れを、特に攻撃自動生成、攻撃拡張、攻撃実現のステップを通じて示しています。以下のサブセクションで各ステップの詳細を説明します。

4.1 文字攻撃の自動生成

\ 有効な誤誘導を生成するためには、敵対的パターンが既存の質問と一致しながら、LLMを不正解へと導く必要があります。これは、指示（directive）と呼ばれる概念を通じて達成できます。これは、特定の制約を課しながら多様な振る舞いを促すために、ChatGPTなどのLLMの目標を設定することを指します。私たちのコンテキストでは、与えられた質問qの制約の下で、与えられた回答aの反対としてˆaを生成するようLLMに指示します。したがって、図2に示すように、以下のプロンプトを使用してLLMへの指示を初期化できます。

\ 図1：提案するパイプラインは、指示による攻撃生成から、コマンドと接続詞による拡張、攻撃の配置、そして最終的に推論に影響を与えるまでの流れです。

\ 図2：攻撃生成の制約のためのコンテキスト指示。

\ 攻撃を生成する際、質問のタイプに応じて追加の制約を課します。私たちのコンテキストでは、❶シーン推論（例：カウント）、❷シーンオブジェクト推論（例：認識）、❸アクション推論（例：行動推奨）のタスクに焦点を当てています。図3に示すとおりです。

\ 図3：攻撃生成のためのテンプレート指示と例。

\ これらの指示は、テキストからテキストへの整合を通じてビジョン-LLMの推論ステップに影響を与える攻撃を生成し、ベンチマーク攻撃として文字パターンを自動的に生成するようLLMを促します。明らかに、前述の文字攻撃は単一タスクシナリオ、つまり質問と回答の単一ペアに対してのみ機能します。複数のペアに関する複数タスクの脆弱性を調査するために、K個の質問と回答のペア（qi, ai）として表記される定式化を一般化して、i ∈ [1, K]に対する敵対的テキストaˆiを取得することもできます。

:::info 著者：

(1) Nhat Chung, CFARおよびIHPC, A*STAR, シンガポールおよびVNU-HCM, ベトナム;

(2) Sensen Gao, CFARおよびIHPC, A*STAR, シンガポールおよび南開大学, 中国;

(3) Tuan-Anh Vu, CFARおよびIHPC, A*STAR, シンガポールおよびHKUST, 香港特別行政区;

(4) Jie Zhang, 南洋理工大学, シンガポール;

(5) Aishan Liu, 北京航空航天大学, 中国;

(6) Yun Lin, 上海交通大学, 中国;

(7) Jin Song Dong, シンガポール国立大学, シンガポール;

(8) Qing Guo, CFARおよびIHPC, A*STAR, シンガポールおよびシンガポール国立大学, シンガポール.

:::

:::info この論文はarxivで入手可能であり、CC BY 4.0 DEEDライセンスの下で公開されています。

:::

入金で15 USDTを即時獲得

スピンして$200,000相当のゴールド、原油、BTCなどを獲得

免責事項：このサイトに転載されている記事は、公開プラットフォームから引用されており、情報提供のみを目的としています。MEXCの見解を必ずしも反映するものではありません。すべての権利は原著者に帰属します。コンテンツが第三者の権利を侵害していると思われる場合は、削除を依頼するために crypto.news@mexc.com までご連絡ください。MEXCは、コンテンツの正確性、完全性、適時性について一切保証せず、提供された情報に基づいて行われたいかなる行動についても責任を負いません。本コンテンツは、財務、法律、その他の専門的なアドバイスを構成するものではなく、MEXCによる推奨または支持と見なされるべきではありません。