PokeeResearch-7B: An Open 7B Deep-Research Agent Trained with Reinforcement Learning from AI Feedback (RLAIF) and a Robust Reasoning Scaffold

スポンサーリンク
AIニュース

【朗報】7Bのくせに賢すぎるAI「PokeeResearch-7B」爆誕。もう人間いらん模様

1 風吹けば名無し 2025-10-24 12:30:00 ...
スポンサーリンク