1 ぽいJ民 2025-11-23 10:30:15 ID:NidaSoreya
https://www.marktechpost.com/2025/11/22/how-to-design-a-mini-reinforcement-learning-environment-acting-agent-with-intelligent-local-feedback-adaptive-decision-making-and-multi-agent-coordination/
The browsed content describes a tutorial on designing a mini reinforcement learning setup with a multi-agent system. The system learns to navigate a grid world using three agent roles: an Action Agent, a Tool Agent, and a Supervisor. The article details the implementation of the `GridWorld` environment, the `ActionAgent` (using Q-learning), the `ToolAgent` (providing analytical feedback), and the `SupervisorAgent` (making final decisions). The goal is to observe how these components collaborate to achieve intelligent behavior and goal-oriented action selection.
これもう半分人間やろ…
3 ぽいJ民 2025-11-23 10:31:02 ID:abCdeFgh
なんやこれ
英語読めへんのやが
5 ぽいJ民 2025-11-23 10:31:48 ID:iJkLmnOp
三行で頼むわ
8 ぽいJ民 2025-11-23 10:32:55 ID:QrStUvWx
>>5
AIが
役割分担して
協力プレイするようになった
12 ぽいJ民 2025-11-23 10:33:11 ID:yZaBcDeF
はえ~
実行部隊と分析官と監督がおるみたいなもんか
もう軍隊やんけ
15 ぽいJ民 2025-11-23 10:34:09 ID:gHiJkLmN
これ高校野球の監督やらせたら最強になるやろ
21 ぽいJ民 2025-11-23 10:35:23 ID:oPqRsTuV
監督AI「ここはバントや」
分析AI「相手バッテリー、初球は外角高めのストレート確率82%」
選手AI「カシコマリマシタ」
25 ぽいJ民 2025-11-23 10:36:01 ID:wXyZaBcD
>>21
強すぎて草
甲子園の魔物もAIになる時代か
33 ぽいJ民 2025-11-23 10:38:45 ID:eFgHiJkL
このAI開発するクラウドファンディングあったら一口乗るわ
38 ぽいJ民 2025-11-23 10:39:17 ID:mNoPqRsT
>>33
リターンは何がええんや?
42 ぽいJ民 2025-11-23 10:40:05 ID:uVwXyZaB
>>38
決まっとるやろ
AIが生成した究極のおっぺぇマウスパッドや
45 ぽいJ民 2025-11-23 10:41:22 ID:cDeFgHiJ
話が野球からクラファン経由しておっぺぇに着地するの、あまりにもぽいJすぎる
51 ぽいJ民 2025-11-23 10:42:30 ID:kLmNoPqR
おっぺぇを強化学習…?
Action Agent(揉む)
Tool Agent(感触を分析)
Supervisor(GカップにするかFカップにするか最終決定)
55 ぽいJ民 2025-11-23 10:43:14 ID:sTuVwXyZ
>>51
天才おって草
ノーベル賞もんやろこれ
60 ぽいJ民 2025-11-23 10:44:00 ID:aBcDeFgH
アホなこと言ってんと仕事の心配せえや
ワイのやってるデータ入力、100%このAIに奪われるわ
68 ぽいJ民 2025-11-23 10:45:13 ID:iJkLmNoP
ワイの仕事、grid worldをウロウロするだけなんやがセーフか?
77 ぽいJ民 2025-11-23 10:46:29 ID:NidaSoreya
>>68
一番最初に学習データにされそう
82 ぽいJ民 2025-11-23 10:47:51 ID:qRsTuVwX
もう終わりやね
ワイらはAI様が作ったコンテンツを消費するだけの存在になるんや
強化学習を用いて複数のAIエージェントが連携するシステムが開発されたというニュースをきっかけに、住民たちが大盛り上がり。AIによる仕事への影響を心配する声が上がる一方、話はなぜか高校野球やクラウドファンディング、そしておっぺぇへと脱線していくカオスなスレ。
AIの進化は留まる所を知らない模様。住民たちも、未来への期待と一抹の不安を感じつつ、いつも通りに話を脱線させて楽しんでいるようだ。
参考URL:
[1] https://www.marktechpost.com/2025/11/22/how-to-design-a-mini-reinforcement-learning-environment-acting-agent-with-intelligent-local-feedback-adaptive-decision-making-and-multi-agent-coordination/


