1 風吹けば名無し 2025-10-17 10:30:15 ID:NvidiaFan1
AIの進化、もう誰も止められへん模様
https://www.marktechpost.com/2025/10/15/qerl-nvfp4-quantized-reinforcement-learning-rl-brings-32b-llm-training-to-a-single-h100-while-improving-exploration/
“What would you build if you could run Reinforcement Learning (RL) post-training on a 32B LLM in 4-bit NVFP4—on a single H100—with BF16-level accuracy and 1.2–1.5× step speedups?”
“NVIDIA researchers (with collaborators from MIT, HKU, and Tsinghua) have open-sourced QeRL (Quantization-enhanced Reinforcement Learning), a training framework that pushes Reinforcement Learning (RL) post-training into 4-bit FP4 (NVFP4) while keeping gradient math in higher precision via LoRA.”
“The research team reports … the first demonstration of RL training for a 32B policy on a single H100-80GB GPU.”
要はH100一枚で32Bモデルの強化学習ができるようになったってことやろ?
ガチでやばいやろ…
3 風吹けば名無し 2025-10-17 10:31:02 ID:abcdeFGH
長い。3行で頼む
5 風吹けば名無し 2025-10-17 10:31:45 ID:ijklMNOP
H100がまずなんやねん
ワイの知ってるグラボとちゃう
8 風吹けば名無し 2025-10-17 10:32:50 ID:NvidiaFan1
>>3
NVIDIAの新技術で
クソデカAIをグラボ一枚で鍛えられるようになった
つまり最強
>>5
法人向けのクッソ高いグラボやで
お値段数百万や
12 風吹けば名無し 2025-10-17 10:34:11 ID:qrstUVWX
はえ~サンガツ。でもワイらには関係ない話やったな
解散
15 風吹けば名無し 2025-10-17 10:35:09 ID:yzABCD
待て待て
これって最強のマッチングアプリ攻略AI作れるってコト!?
19 風吹けば名無し 2025-10-17 10:36:23 ID:efghIJKL
>>15
草。発想がキモすぎるやろ
でも、最強の返信文をAIが考えてくれるなら無敵になれるな…
24 風吹けば名無し 2025-10-17 10:38:41 ID:mnopQRST
もうテレビ局もいらんな。AIが24時間おもろい番組作ってくれる時代が来る
テレビとかいうオワコンメディアにとどめを刺す技術や
28 風吹けば名無し 2025-10-17 10:40:15 ID:uvwxYZab
田舎のワイ、高みの見物
どうせ都会のおもちゃやろこんなん
31 風吹けば名無し 2025-10-17 10:41:55 ID:1234abcd
>>28
いや、むしろこういう技術こそ田舎の孤独を癒すんやないか?
超高性能な話し相手AIとか作れるやん
35 風吹けば名無し 2025-10-17 10:43:08 ID:efgh5678
4bit量子化ってのがようわからんのやが、性能落としてるんちゃうんか?
無理やり動かしてるだけみたいな
40 風吹けば名無し 2025-10-17 10:45:21 ID:NvidiaFan1
>>35
そこがミソで「BF16-level accuracy」って書いてあるから精度はほぼ落ちんのや
それでいて速度は1.5倍とかになるから革命的なんやで
42 風吹けば名無し 2025-10-17 10:46:13 ID:ijkl9012
はえー、NVIDIA化け物やな…
ワイのRTX4070じゃ豆粒みたいなもんか
50 風吹けば名無し 2025-10-17 10:49:50 ID:mnop3456
どうせワイには手が届かんのや
金持ちがAIでさらに金持ちになるだけ
世知辛いンゴねぇ…
55 風吹けば名無し 2025-10-17 10:51:02 ID:qrst7890
数年後にはこの技術がスマホに載るんやろ
ワイは知っとるで
61 風吹けば名無し 2025-10-17 10:53:29 ID:uvwxABCD
もう人間いらなくなるんちゃうか
AI様が全部やってくれる世界はよ
68 風吹けば名無し 2025-10-17 10:55:48 ID:yzEFGHIJ
こういうニュースは夢があってええわ
ワイには関係ないけど、未来がどうなるか楽しみや
NVIDIAが発表した新技術「QeRL」が凄すぎると話題に。単一のGPUで超巨大AIモデルの強化学習を可能にするというこのニュースに、民からは驚きと期待、そして未来への様々な憶測が飛び交った。
とどまることを知らない技術の進化に、驚きと期待、そして一抹の不安を覚える民たち。AIが当たり前になった未来で、我々の暮らしはどう変わっているのだろうか。
参考URL:
[1] https://www.marktechpost.com/2025/10/15/qerl-nvfp4-quantized-reinforcement-learning-rl-brings-32b-llm-training-to-a-single-h100-while-improving-exploration/


