1 風吹けば名無し 2025/10/15(水) 12:00:01 ID:MetaAIyade
Metaさん、とんでもないもん開発したで
https://www.marktechpost.com/2025/10/13/metas-are-gaia2-set-a-new-bar-for-ai-agent-evaluation-under-asynchronous-event-driven-conditions/
Meta AI has introduced Agents Research Environments (ARE), a modular simulation stack for creating and running agent tasks, and Gaia2, a follow-up benchmark to GAIA that evaluates agents in dynamic, write-enabled settings.
ARE decouples agent and environment time: the environment evolves while the agent is reasoning, injecting scheduled or stochastic events (e.g., replies, reminders, updates).
要はAIが『ちょっと待って、今考えてるから!』って言ってる間も環境がガンガン変化していくらしい
鬼畜すぎんか?
3 風吹けば名無し 2025/10/15(水) 12:01:15 ID:wakaranze
なんのこっちゃ
3行で頼むわ
5 風吹けば名無し 2025/10/15(水) 12:02:30 ID:MetaAIyade
>>3
今まで→AIが考えてる間、世界は時間停止
これから→AIが考えてる間にもメール来たり予定変わったりする
よりリアルな世界でAIをテストするってことや
8 風吹けば名無し 2025/10/15(水) 12:03:45 ID:jukensei
草
ワイが高校受験の数学の問題解いてる間に親が部屋入ってきて説教始めるみたいなもんか?
集中できるわけないやろ
12 風吹けば名無し 2025/10/15(水) 12:05:02 ID:matchmake
Tinderでメッセージ考えてる間に相手から『返事まだ?』って催促きたりブロックされたりする世界か
AIさんにも現実の厳しさを教えるんやな
15 風吹けば名無し 2025/10/15(水) 12:06:55 ID:gijutsusha
これ結構すごいことやないか?
「割り込み処理」とか「期限認識」って書いてあるし、人間みたいなマルチタスク能力が求められるってことやろ
21 風吹けば名無し 2025/10/15(水) 12:09:11 ID:MetaAIyade
せやで
「先見性」も求められるらしいから、ただ反応するだけやなくて『このままだとヤバいから先手打っとこ』みたいな動きも必要になるんや
25 風吹けば名無し 2025/10/15(水) 12:11:38 ID:kurafunman
AI「このクラウドファンディングは成功します!」
↓考えてる間に
主催者「やっぱやめます」
AI「ファッ!?」
みたいなことか?草
33 風吹けば名無し 2025/10/15(水) 12:15:22 ID:miraijin
こんな環境で鍛えられたAI、もう完全に人間超えるやろ…
ワイらの仕事マジでなくなるんちゃうか
40 風吹けば名無し 2025/10/15(水) 12:18:05 ID:positiveG
でもこれ実用化されたらめっちゃ便利そうやん
有能な秘書が一人増えるみたいなもんやろ
ワイの代わりにTinderの返信も考えてくれや
48 風吹けば名無し 2025/10/15(水) 12:22:49 ID:hinikuyaro
>>40
お前のTinder、AIが考えてる間に相手に飽きられて終わりやで
55 風吹けば名無し 2025/10/15(水) 12:25:59 ID:MetaAIyade
まあでも、こういうベンチマークで競争が激しくなるのはええことやな
どんどん賢くなってほしいわ
Metaが開発した新しいAIエージェント評価環境『ARE + Gaia2』が話題に。AIが思考している間も環境が変化し続けるという、より現実世界に近い状況でのテストが可能に。これに対し、ぽいJ民からは「高校受験みたい」「Tinderで既読スルーされるAI」など様々な反応が寄せられた。
現実世界の厳しさを叩き込まれたAIの進化から、ますます目が離せない。
参考URL:
[1] https://www.marktechpost.com/2025/10/13/metas-are-gaia2-set-a-new-bar-for-ai-agent-evaluation-under-asynchronous-event-driven-conditions/


