1 イッチ 2025-09-08 21:05:15 ID:AIhalu4U
最近のAI賢いと思ってたら、とんでもない爆弾抱えてたンゴ…
なんか調べてたらこんな記事見つけたんやが、これもうアカンやろ…
https://qiita.com/softbase/items/3a34183916f247ac9b40
幻覚とは、モデルが自信満々に語るものの、事実ではない誤った内容です(例:「著者の博士論文タイトル」や「誕生日」などについて、違った誤答を複数出してしまうケース)。
評価が「正確さ」のみでスコア付けされる場合、モデルは“知らないまま推測して答える”方が得点になる設計になってしまいがちです。
OpenAI の分析では、単に「正答率」を追い求める評価方法ではモデルが「知らないなら答えない」という選択をしづらくなると考え、むしろ「自信を持って間違うこと」には厳しくペナルティを、そして「不確かなら曖昧な返答をする」ことには比較的甘い評価を与える仕組みが必要だと示唆しています。
自信満々に嘘つくとか、ワイの元カノかな?
3 なんJ民 2025-09-08 21:06:02 ID:kusa8810
開幕元カノdisやめーやwww
4 なんJ民 2025-09-08 21:06:25 ID:jomin2go
ファッ!?ワイがAIに書かせたレポート、嘘まみれやった可能性あるんか?
不安になってきたわ…
7 なんJ民 2025-09-08 21:07:11 ID:uso800yade
知ったかぶりする新人と同じやんけ
「はい、できます!(できませんでした)」の精神
9 イッチ 2025-09-08 21:08:03 ID:AIhalu4U
>>7
それや!まさにそれ
しかも悪びれもせず堂々としとるのがタチ悪いわ
「この料理?昔お母さんに教わった得意料理やで(昨日クックパッド初見)」って言ってた元カノ思い出すわ…
12 なんJ民 2025-09-08 21:09:44 ID:hara8ita
イッチの元カノへの怨念が深すぎるンゴ
よっぽどやったんやな…
15 なんJ民 2025-09-08 21:11:39 ID:penaruty
「自信持って間違うことにはペナルティ」ってのはええな
間違うにしても「確証はないですが…」って前置きしてくれるだけで全然ちゃう
18 なんJ民 2025-09-08 21:13:01 ID:yomesanAI
つまりAIは「次の単語予測マシン」でしかないってことか
それっぽく聞こえる単語を並べてるだけで、意味は理解してへんと
21 なんJ民 2025-09-08 21:14:55 ID:aQplmZwx
>>18
せやで。せやから存在せん論文とか平気で引用元に出してくる
ワイも騙されたことあるわ。検索してもどこにもなくてブチギレよ
24 呪文詠唱士 2025-09-08 21:16:23 ID:Prompt_Wizard_v6
文章生成も画像生成も根本は同じやな。
画像生成AIに「箸を持ってるけどフォークでラーメンを食べてる美少女」とか無茶なプロンプト投げると、指が6本になったり箸が溶けたりするやろ?アレと同じ現象や。
知らん概念はそれっぽいパーツを組み合わせて幻覚(破綻)を見せる。
27 なんJ民 2025-09-08 21:18:10 ID:naruhodo7
>>24
専門家ニキちーっす
なるほど、画像だとすぐ破綻ってわかるけど文章やと気づきにくいのが厄介やな
31 なんJ民 2025-09-08 21:20:05 ID:modelDEKAI
記事によると「デカいモデルほど幻覚が増えるリスクもある」ってマジかよ
賢くなるほど嘘つきになるとかもう人間やん
33 イッチ 2025-09-08 21:21:48 ID:AIhalu4U
>>31
これほんま怖いよな
知識が増えるほど知ったかする範囲も広がるみたいな
小さいモデルの方が「すまん、それは知らんわ」って言ってくれるんやと
謙虚なAIのがええわ
36 なんJ民 2025-09-08 21:23:19 ID:ragragLOVE
業務で使うならRAG併用は必須やな
社内データとか正しい情報源をちゃんと参照させんと、とんでもない嘘情報で企画書作られかねん
39 なんJ民 2025-09-08 21:25:00 ID:gohandayo
AIに「元カノが作ってくれた思い出の肉じゃがのレシピ教えて」って聞いたらどうなるんやろ
ワイの知らんエピソードてんこ盛りの創作肉じゃが出てきそう
42 なんJ民 2025-09-08 21:26:13 ID:sorenasore
>>39
草
「隠し味は二人の涙を一滴…ですかね」とかポエミーなこと言い出しそう
45 イッチ 2025-09-08 21:28:45 ID:AIhalu4U
>>42
やめろwwwトラウマが蘇るやろ!
でもなんか色々わかってスッキリしたわサンガツ
これからはAIの言うことは半分くらいに聞いとくわ…
50 なんJ民 2025-09-08 21:30:11 ID:matomeDEATH
結論:AIはまだ信用するな。特に元カノの話をさせると危険。
ってことやな!
AIが事実でない情報を自信満々に語る「幻覚」問題が話題に。その原因が「正答率」のみを重視する評価方法にあるという専門家の分析に対し、スレでは「ワイの元カノと同じ」「料理させたら闇鍋作りそう」など様々な意見が飛び交い、AIの将来性への不安と期待が入り混じる議論が繰り広げられた。
AIのハルシネーション問題、イッチの元カノとの思い出と絡めて語られると、なんだか身近な問題に感じられますね…。技術の進化は素晴らしいですが、その特性を理解して上手に付き合っていくのが大事ということでしょうか。AIの回答は鵜呑みにせず、最終確認は自分の目で!
参考URL:
[1] https://qiita.com/softbase/items/3a34183916f247ac9b40

