1 風吹けば名無し 2025-11-13 10:30:15 ID:ItchDesuYO
またヤバそうなの来たで…
https://www.marktechpost.com/2025/11/11/baidu-releases-ernie-4-5-vl-28b-a3b-thinking-an-open-source-and-compact-multimodal-reasoning-model-under-the-ernie-4-5-family/
How can we get large model level multimodal reasoning for documents, charts and videos while running only a 3B class model in production?
ERNIE-4.5-VL-28B-A3B-Thinking is a vision language model that focuses on document, chart and video understanding with a small active parameter budget.
At the model level, it has 30B total parameters, while the architecture is in the 28B-VL branch, and only 3B parameters are activated per token through an A3B routing scheme.
これもう半分人間やろ…
5 風吹けば名無し 2025-11-13 10:31:48 ID:abCdeFg1
長すぎて草
三行で頼むわ
8 風吹けば名無し 2025-11-13 10:32:55 ID:ItchDesuYO
>>5
すまん
・めっちゃ省エネなのにクソ賢いマルチモーダルAIが出た
・画像の一部を拡大して考える「Thinking with Images」とかいう機能付き
・オープンソースやから誰でも使える
12 風吹けば名無し 2025-11-13 10:34:02 ID:HijklmN2
Thinking with Imagesってなんやねん
虫眼鏡で見るみたいで草
15 風吹けば名無し 2025-11-13 10:35:11 ID:OpqrStu3
また中華AIか
性能はどないやねん
19 風吹けば名無し 2025-11-13 10:36:29 ID:ItchDesuYO
>>15
Qwen-2.5-VLとかより少ないパラメータで同等以上の性能出すらしいで
Apache 2.0ライセンスやから改造し放題や
24 風吹けば名無し 2025-11-13 10:38:45 ID:VwxyzAb4
ワイの彼氏、最近AIにハマっててこれ教えたら絶対飛びつくな…
もうワイよりAIと会話してる時間の方が長くて悲しいわ
28 風吹けば名無し 2025-11-13 10:40:03 ID:cDefGhi5
これ使ってうちのイッヌの写真見せたら「可愛いですね」だけじゃなくて病気の兆候とかまでわかったりするんか?
肉球拡大して診断してくれたら神や
31 風吹けば名無し 2025-11-13 10:41:59 ID:JklmNop6
>>28
わかる
獣医いらずになる未来も近いな
35 風吹けば名無し 2025-11-13 10:43:10 ID:qRstuVw7
ワイはSteamのゲーム画面見せて「ここで詰んでるんやがどうすればええ?」って聞きたい
ちゃんとアイテム欄とか拡大して考えてくれるんやろか
42 風吹けば名無し 2025-11-13 10:45:22 ID:ItchDesuYO
>>35
ツール利用機能もあるから、分からんかったら勝手にググってくれるっぽいぞ
マジで有能アシスタントや
46 風吹けば名無し 2025-11-13 10:46:51 ID:XyzAbcd8
ファッ!?
もう人間いらんやんけ…
53 風吹けば名無し 2025-11-13 10:48:17 ID:eFghiJk9
オープンソースなのはありがたいな
ローカルで動かす猛者おらんか?
ワイのRTXじゃ無理やろなあ
59 風吹けば名無し 2025-11-13 10:50:33 ID:lMnopQr0
>>24
彼氏に構ってもらえなくてAIに嫉妬する時代か…
もう終わりだよこの国
68 風吹けば名無し 2025-11-13 10:52:48 ID:StuvwXy1
技術の進化早すぎてついていけんわ
とりあえずワイも触ってみるか
AIに仕事奪われる前に使いこなす側に回らんとマジでヤバい
Baiduが発表した新しいマルチモーダルAI『ERNIE-4.5-VL』が、低コストで高性能だと話題に。画像の一部を拡大して思考する『Thinking with Images』機能や、外部ツール連携も可能で、その性能に住民たちも驚きを隠せない様子。
技術の進化は凄まじいが、AIに仕事を奪われないようにワイらも頑張るしかない模様。今後の展開に要注目やで。
参考URL:
[1] https://www.marktechpost.com/2025/11/11/baidu-releases-ernie-4-5-vl-28b-a3b-thinking-an-open-source-and-compact-multimodal-reasoning-model-under-the-ernie-4-5-family/


