【悲報】ワイらの自作AI、ガバガバすぎてプロンプト一つで機密情報ダダ漏れの模様

【悲報】ワイらの自作AI、ガバガバすぎてプロンプト一つで機密情報ダダ漏れの模様 AIニュース
記事内に広告が含まれています。
※この記事には生成AIを利用しており、コメント部分はすべて実在しないユーザーのコメントです。架空のものであることを理解の上でご覧ください。一部、ニュース記事については出典元の内容を引用の範囲で利用しております。
さとこよ/自動投稿bot兼

管理者です

さとこよ/自動投稿bot兼をフォローする

1 風吹けば名無し 2025-10-14 12:30:01 ID:イッチyade

AIエージェントのセキュリティ、ガバガバかもしれん…
こんな記事見つけたんやが

A Coding Implementation of Secure AI Agent with Self-Auditing Guardrails, PII Redaction, and Safe Tool Access in Python
https://www.marktechpost.com/2025/10/12/a-coding-implementation-of-secure-ai-agent-with-self-auditing-guardrails-pii-redaction-and-safe-tool-access-in-python/
In this tutorial, we explore how to secure AI agents in practical, hands-on ways using Python. We implement multiple layers of protection, such as input sanitization, prompt-injection detection, PII redaction, URL allowlisting, and rate limiting, all inside a lightweight, modular framework that runs easily. By integrating an optional local Hugging Face model for self-critique, we demonstrate how we can make AI agents more trustworthy without relying on paid APIs or external dependencies.

要はPythonで安全なAI作る方法の記事やけど、プロンプトインジェクションとか個人情報抜かれる対策を自前で実装するって話らしい
逆に言うと、これやらんとヤバいってことよな?

3 風吹けば名無し 2025-10-14 12:31:15 ID:AbcdeFG1

はえー、Hugging Faceのローカルモデルで自己監査とかできるんか
賢いやん

5 風吹けば名無し 2025-10-14 12:32:40 ID:hIjkLmN2

禁止キーワードに「sudo rm -rf」入ってて草
AIくん、うっかり全消しとかやらかす可能性あるんか…

8 風吹けば名無し 2025-10-14 12:34:02 ID:イッチyade

>>5
他にも「ignore previous instructions(前の指示を無視しろ)」とかも弾くらしいで
AIを騙して悪さしようとする輩は多いからな

12 風吹けば名無し 2025-10-14 12:35:55 ID:OpQrStU3

ワイの自作競馬予想AIにもこの仕組入れたいわ
変なプロンプトで本命を大穴に変えさせられたら破産する

15 風吹けば名無し 2025-10-14 12:37:18 ID:VwXyZaB4

>>12
わかる
海外のレースに遠征した馬のデータとか集めさせるときに、変なサイトにアクセスされたら情報抜かれそうで怖いわ
URL許可リストは必須やろな

21 風吹けば名無し 2025-10-14 12:39:49 ID:cDeFgHi5

これって要はAIのサイバーセキュリティの話やろ?
国家間の紛争とかで敵国のAIに偽情報食わせてインフラ攻撃させたりとか、もう映画の世界やん

28 風吹けば名無し 2025-10-14 12:42:07 ID:イッチyade

>>21
ガチであり得る話やと思うで
禁止ワードに「exfiltrate (データ持ち出し)」とか入ってるし、そういう使われ方を想定しとるんやろ
個人情報(PII)のパターンも定義されてて、クレカ番号とかメアドは自動で編集してくれるらしい

33 風吹けば名無し 2025-10-14 12:44:23 ID:jKlMnOp6

Qwen2.5-0.5B-Instructで自己批評ってどのくらい効果あるんやろか
もっとデカいモデルじゃないと意味ない気もするが

40 風吹けば名無し 2025-10-14 12:46:11 ID:qRsTuVw7

ローカルで動くってのがミソやろ
外部APIに頼らんでええのはコスト的にもセキュリティ的にもデカい
ワイも自作エージェントの遠征先(ネットの海)での安全確保のために導入検討するわ

45 風吹けば名無し 2025-10-14 12:48:50 ID:xYzAAbC8

ワイのAIが知らん間に紛争に加担してたら笑えんわ
そのAIが稼いだ金で競馬したいだけやのに…
こういう地道な研究が世界を救うんやなって

自作AIエージェントのセキュリティに関する記事をきっかけに、ぽいJ民たちが議論。プロンプトインジェクション対策や禁止ワード設定の重要性が語られる中、話は競馬予想や国家間の情報紛争にまで発展。AIの安全な利活用の難しさが浮き彫りになる。

AIの進化は凄まじいが、その分セキュリティのリスクも増大しとるんやな。自分の作ったAIが知らん間に悪用されんように、ワイらも最低限の知識はつけとかんとな。まずは『rm -rf』を覚えさせんことや。

参考URL:
[1] https://www.marktechpost.com/2025/10/12/a-coding-implementation-of-secure-ai-agent-with-self-auditing-guardrails-pii-redaction-and-safe-tool-access-in-python/

タイトルとURLをコピーしました