1 風吹けば名無し 2025-10-17 12:30:01 ID:AItsukai
なんJ民おるかー?
ヤバい記事見つけたから共有するで
https://zenn.dev/nttdata_tech/articles/c615442e2b5912
生成AIモデルは種類も多く、更新サイクルも早いため、この領域を専門としているデータサイエンティストであっても「どのモデルが良いか」「自分の担当する案件に適したモデルは何か」を判断することは容易ではありません。
そこで本記事では、生成AIモデルの性能を理解するうえで参考となる各種ベンチマークを紐解きながら、これをもとに主要な生成AIモデルの特性について解説しようと思います。
GPTが万能型、Claudeはコーディング重視、Geminiはコーディングはやや弱いものの万能型であるといった傾向が分かります。
なお、上記3モデルはリリース日が異なります。直近でリリースされたモデルの精度が高くなる傾向がある点にご注意ください。
また現時点の首位はGPTですが、Geminiのスコアの伸びが大きいことに着眼すると、今後GPTがGeminiを追う展開になる可能性もあることが読み取れます。
これもう人間いらんやろ…
3 風吹けば名無し 2025-10-17 12:31:15 ID:longdeNG
長すぎて草
理系ニキ、3行で頼むわ
5 風吹けば名無し 2025-10-17 12:32:02 ID:GPT5godd
はえ〜、GPT-5さんサイドが圧倒的すぎる
もうこいつ一人でええやん
8 風吹けば名無し 2025-10-17 12:33:48 ID:AItsukai
>>3
すまんな
・GPT-5が今のところ最強
・コード書かせるならClaude
・Geminiもめっちゃ追い上げてる
こんな感じや
12 風吹けば名無し 2025-10-17 12:35:29 ID:coderMAN
SWE-bench VerifiedでClaude Sonnet 4.5がトップってマジか
ワイの仕事、マジで無くなるかもしれん…
16 風吹けば名無し 2025-10-17 12:37:11 ID:uso800ww
ハルシネーション率1.4て
100回に1回以上は平気で嘘つくってことやろ?
まだまだやな
19 風吹けば名無し 2025-10-17 12:38:55 ID:idolPdes
>>16
ワイの推してる地下アイドルのwikiよりは正確やからセーフ
24 風吹けば名無し 2025-10-17 12:40:03 ID:soraDEOK
それよりSora2とかVeo3でワイの推しのエッッッな動画は作れるんか?
それだけが知りたい
27 風吹けば名無し 2025-10-17 12:41:49 ID:gironZUKI
>>24
倫理フィルター「お前の望みはそこまでだ」
31 風吹けば名無し 2025-10-17 12:43:10 ID:unchiKOM
ちょっとしたうんちくやけど、こういうベンチマークって結局「テストで良い点取る能力」やからな
実際の仕事で使えるかはまた別の話やで
ソースはワイの経験
35 風吹けば名無し 2025-10-17 12:45:22 ID:robotKOW
コンピュータ操作とかロボット自律制御とか怖すぎやろ
ターミネーターの世界まったなしやんけ
41 風吹けば名無し 2025-10-17 12:48:09 ID:geminiOU
Geminiのスコアの伸びがデカいってのがミソやな
Googleの本気見せたるわって感じがする
46 風吹けば名無し 2025-10-17 12:50:57 ID:AItsukai
正直ここまで進化してるとは思わんかったわ
ワイが応援してる地下アイドルグループも、いつかAIが作詞作曲した曲で武道館立つんかな…
50 風吹けば名無し 2025-10-17 12:53:18 ID:naniTSUKU
で、お前らは結局AIを何に使ってるんや?
ワイはメールの文章考えるのに使ってる
53 風吹けば名無し 2025-10-17 12:55:01 ID:eroSHOSE
>>50
エッッッな小説の推敲
58 風吹けば名無し 2025-10-17 12:57:43 ID:owataMAN
>>53
同志よ…
ワイはAIに仕事奪われたら、AIが書いた小説読んで一生過ごすわ
65 風吹けば名無し 2025-10-17 13:01:25 ID:miraiYOS
もうガチでシンギュラリティ目前やろこれ
ワイらはAI様が稼いでくれた金で暮らすだけになるんや…
2025年10月上旬時点での最新生成AIモデルの性能比較記事が投下され、GPT-5の圧倒的な性能や、コーディングに特化したClaudeの強さなどが話題に。激化する開発競争とAIの未来について、ぽいJ民たちが様々な憶測を繰り広げる。
AIの進化、ガチで止まらない模様。ワイらも上手く使いこなして、推し活に役立てていきたいところやね。
参考URL:
[1] https://zenn.dev/nttdata_tech/articles/c615442e2b5912


