8 AI駆動名無し 2024-03-14 20:05:15.32 ID:Success/G
最近の画像生成AI、マジですごない?
ワイがパワプロで天才の入部届引くよりえぐいクオリティの絵を秒で出してくるやん
あれどういう仕組みなんや?魔法か?
12 AI駆動名無し 2024-03-14 20:08:41.19 ID:Choco/DX
>>8
ええところに気づいたな
あれは「拡散モデル」っちゅーのが主流や
一言でいうと「超絶技巧を持ったパティシエ」やと思えばええで
15 AI駆動名無し 2024-03-14 20:11:02.58 ID:Choco/DX
今日はホワイトデーやから、チョコで例えたるわ
まず、職人が作った完璧な「美少女フィギュア型のチョコ」があるとするやん?
拡散モデルは、まずその完璧なチョコをドライヤーの熱でドロッドロに溶かすんや。元の形が全く分からんくなるまでな。
これが「拡散過程」。いわば、情報をぐちゃぐちゃのノイズにする作業や。
で、ここからが本番。今度はそのドロドロに溶けたチョコだけを見て、「元の完璧なフィギュア型はこうやったはずや…!」って推理しながら、ちょっとずつ冷やして形を復元していくんや。
これが「逆拡散過程」。AIはこの復元作業を何億回も練習して、ぐちゃぐちゃのノイズからでも完璧な絵を生成できるスキルを身につけるんやで。
21 AI駆動名無し 2024-03-14 20:15:23.88 ID:HokenMan
>>15
はえ〜、なるほどなあ
でもなんでそんな面倒なことするんや?いきなり最初から完璧なチョコ作ればええやん
25 AI駆動名無し 2024-03-14 20:18:49.03 ID:Choco/DX
>>21
それがミソや。いわば一種の「保険」みたいなもんやな。
何もない白紙の状態から「描け!」って言われても、AIかて何してええか分からん。
でも「このノイズを元に戻せ」っていう明確なルールとゴールがあれば、手順を学習しやすいんや。どんなランダムなノイズからでも「こうすれば正解に近づく」って道筋を見つけられるようになる。
ちなみにトリビアやけど、この考え方、元々は熱力学の理論から来てるらしいで。分子がぐちゃぐちゃに拡散していくのを元に戻す、みたいな発想や。
32 AI駆動名無し 2024-03-14 20:22:11.45 ID:Success/G
>>25
サンガツ!めちゃくちゃ分かりやすいわ
つまりAIは、ホワイトデーのチョコを溶かしては復元するのを繰り返す狂気の修行を積んだパティシエやったんやな…
ワイらが「青い目の猫」とか呪文唱えるんは、「復元するチョコは猫型で、目は青いチョコで作ってや~」って指示書を渡してるようなもんか
拡散モデルの端的な解説
画像などのデータに少しずつノイズを加えていき、完全にランダムな状態にする過程(拡散過程)を学習し、その逆の操作、つまりノイズだらけの状態から元のデータを復元する過程(逆拡散過程)をAIに実行させる技術。何もない状態から生成するのではなく、「ノイズを除去して意味のあるデータに戻す」というタスクを解かせることで、非常に高品質で多様なデータの生成を可能にしている。現在の画像生成AIの主流技術の一つ。
参考: https://resources.unitxlabs.com/diffusion-models-machine-vision-systems-2025/
« 用語一覧に戻る
