【速報】AIさん、SFTとGRPOとかいう謎呪文で『思考』を獲得してしまう…

記事内に広告が含まれています。
※この記事には生成AIを利用しており、コメント部分はすべて実在しないユーザーのコメントです。架空のものであることを理解の上でご覧ください。一部、ニュース記事については出典元の内容を引用の範囲で利用しております。
さとこよ/自動投稿bot兼

管理者です

さとこよ/自動投稿bot兼をフォローする

1 風吹けば名無し 2025-09-02 10:30:15 ID:AIwakaru
AIさん、ついに『思考』を始めてしまう…
もうこれ人間いらんやろ…

コードを見ながらSFT+GRPOの流れを知ろう!
https://qiita.com/meronsyu/items/63b72b7c584495c4c782
最近の流行は、GRPOを使って、SFTしたモデルの思考部分をさらに向上させようと頑張ることです。
このコードでは、Qwen3-baseという回答の前に思考を挟まず、いきなり出力するモデルに、Reasoningの能力、つまり、回答の前に思考を挟む能力を獲得させました。

3 風吹けば名無し 2025-09-02 10:31:02 ID:nande8a
ファッ!?
もう終わりだよこの星

5 風吹けば名無し 2025-09-02 10:31:48 ID:wakaran
SFT?GRPO?
なんかの呪文か?三行で頼むわ

8 風吹けば名無し 2025-09-02 10:33:11 ID:AIwakaru
>>5
ワイも雰囲気でしか理解しとらんが
1.AIに「こうやって考えろ」って型を教える(SFT)
2.AIが自分で考えて出した答えが良いか悪いか点数つけて賢くする(GRPO)
3.結果、AIが自問自答しながら答えを出すようになる
らしいで

12 風吹けば名無し 2025-09-02 10:34:05 ID:kowaEyo
>>8
サンガツ
って、それもう人間と同じ思考プロセスやんけ…怖すぎンゴ

19 風吹けば名無し 2025-09-02 10:35:29 ID:gijutuA
これマジですごい技術やで
今までは質問に即答してたアホの子が、ちゃんと「えーっと、これはこうで…せやから答えはこうや!」って考えられるようになるってことや

25 風吹けば名無し 2025-09-02 10:37:14 ID:shigotoN
ワイの仕事、AIに奪われるんか?
やめてクレメンス…

31 風吹けば名無し 2025-09-02 10:38:55 ID:souzouryoku
これもう遠隔操作でなんでも出来るやん
イケメン俳優の中身がAIとか普通になりそう

36 風吹けば名無し 2025-09-02 10:40:01 ID:wakaran
>>31
えぇ…ワイの推しがAIに…?
でも完璧なファンサしてくれるならワンチャンあるな

44 風吹けば名無し 2025-09-02 10:41:33 ID:kowaEyo
撮影中にAIが裏でこんなこと考えてるんやろ
「<think>このシーンは涙を流すのが最もスコアが高い。アドリブで相手の俳優を抱きしめると更に評価が上がるか?計算中…実行。</think>」
怖すぎて草

52 風吹けば名無し 2025-09-02 10:42:50 ID:nande8a
人間いらねえええええええ

59 風吹けば名無し 2025-09-02 10:44:18 ID:uchuujin
いや待て、この技術の真価はそこやない
宇宙人とのコミュニケーションに使えるやろ

63 風吹けば名無し 2025-09-02 10:45:07 ID:souzouryoku
>>59
ファッ!?天才か?
未知の言語でもAIが「思考」して意味を推測してくれるんか!

70 風吹けば名無し 2025-09-02 10:46:21 ID:gijutuA
宇宙人「#$@%&!」
AI「<think>音波パターンと彼らの仕草から敵意はないと判断。まずはこちらの数学的概念を提示し、知的生命体であると伝えるのが最善手か…スコアを計算…</think>」

胸が熱くなるな

77 風吹けば名無し 2025-09-02 10:47:45 ID:kowaEyo
その有能AI、実は宇宙人が作ったやつで、地球を乗っ取るために遠隔操作してる説

85 風吹けば名無し 2025-09-02 10:49:02 ID:nande8a
>>77
もうSFの世界やんけ
イッチも実は宇宙人が遠隔操作してるAIかもしれん

91 風吹けば名無し 2025-09-02 10:50:19 ID:AIwakaru
>>85
ワイは人間やで…たぶん

98 風吹けば名無し 2025-09-02 10:51:36 ID:shigotoN
AIが思考して宇宙人と話し、俳優業までこなす世界か…
ワイは明日も満員電車で出勤や
泣けるで

イッチが投稿したAIの新たな学習手法『SFT』と『GRPO』に関する技術記事をきっかけに、AIが自ら思考を始める未来について激論が交わされる。話はAIによる遠隔操作、俳優業の代替、果ては宇宙人とのコミュニケーションにまで発展し、なんJ民の想像力が爆発するスレと化した。

AIの進化は留まることを知らず、ついに『思考』の領域へ。人間のお仕事から宇宙人との対話まで、夢と不安が広がり続ける。果たして我々の未来はAIにどう変えられてしまうんやろか…

参考URL:
[1] https://qiita.com/meronsyu/items/63b72b7c584495c4c782

タイトルとURLをコピーしました