1 風吹けば名無し 2025-10-15 10:30:15 ID:AIkowaE01
やばい記事見つけてもうた…これもう人類終わりの始まりやろ
https://qiita.com/mihosato/items/a007c24005e95a043046
プロンプティングでは、ゼロショットでも “Let’s think step by step” を加えることで性能が向上するという、思考誘導(Chain-of-Thought, CoT) の効果が紹介されました。
第3章の “Improvement Strategy” では、LLM-as-a-Judgeの信頼性を高めるための手法 が整理されており、第5章 “Meta-evaluation Experiment” では、その検証結果が以下のようにまとめられていました。
効果的な戦略として、強力なLLMを選択すること、評価コンテンツの順序をランダム化(シャッフル)すること、複数ラウンドの評価を多数決で決定すること が挙げられ、これらによりバイアスを軽減できると示された。
プロンプトや評価の設計が、単なる技術要素ではなく「モデルの知的成長」を支える基盤になりつつあります。
AIが自分で自分を評価して成長するとか、もう人間いらんやんけ…
3 風吹けば名無し 2025-10-15 10:31:02 ID:magicWord00
Let’s think step by step
これ魔法の呪文やんけ草
5 風吹けば名無し 2025-10-15 10:32:45 ID:judgeMAN
LLM-as-a-Judgeてw
AI裁判官とかもうSFの世界やん
マッチポンプとも言う
8 風吹けば名無し 2025-10-15 10:34:11 ID:CoTmaster
>>1
思考誘導って、これもうAIの性格をこっちでコントロールできるってことか?
糖質制限してる時のワイみたいに思考がクリアになるんやろか
12 風吹けば名無し 2025-10-15 10:35:59 ID:shuffleBOY
評価順をシャッフルとか多数決とか、やってることが意外とアナログで草
AIにも飽きとか第一印象とかあるんか?
15 風吹けば名無し 2025-10-15 10:37:23 ID:AIkowaE01
>>12
多分バイアス対策やろな
人間と同じでAIにも「性格」みたいなもんがあって評価が偏るんやろ
それを力技で是正するって感じか
19 風吹けば名無し 2025-10-15 10:39:08 ID:kachiKAKU
はぇ〜、つまりワイが最強のプロンプトを作れば勝ち確ってことか?
プロンプトエンジニア、ワンチャンあるで!
23 風吹けば名無し 2025-10-15 10:41:30 ID:owakonMAN
>>19
なおそのプロンプトもAIが自動生成する模様
お前の仕事はないぞ
28 風吹けば名無し 2025-10-15 10:43:55 ID:costDOKO
結局「強力なLLMを選択すること」ってのがミソやろ
金持ち企業しかできんやんけ。資本主義はAIの世界にも及ぶんやね
31 風吹けば名無し 2025-10-15 10:45:12 ID:GPT2senpai
GPT-2の時代からこの萌芽があったって話が胸熱やな
ワイらが知らんだけで研究はとんでもないとこまで進んどる
35 風吹けば名無し 2025-10-15 10:48:04 ID:genjitsuMIRO
言うても人間との評価一致はまだ課題らしいし、コストもかかるんやろ?
ワイの仕事がなくなるのはまだ10年は先やと信じたい
42 風吹けば名無し 2025-10-15 10:50:29 ID:AIkowaE01
でも「モデルの知的成長を支える基盤」って表現が怖すぎるわ
もうこれ生命やん…
ワイは明日からAIに「一歩ずつ考えてね」ってお願いすることにするわ
とある講義のレポート記事をきっかけに、AIの進化が止まらないとスレが騒然。「Let's think step by step」という呪文で賢くなる思考誘導や、AIがAIを評価する「LLM-as-a-Judge」の登場に、住民たちは戦々恐々。AIの性格やバイアス、そして人類の未来について議論が白熱する。
AIが自ら評価し成長する時代の到来に、スレ住民も興味と恐怖が入り混じった様子。とはいえ、その手法は意外と人間臭いもので、まだ人類の付け入る隙はありそうだ。とりあえず困ったら「Let's think step by step」と唱えてみるのが、これからの処世術になるのかもしれない。
参考URL:
[1] https://qiita.com/mihosato/items/a007c24005e95a043046


