1 風吹けば名無し 2025-10-23 18:30:15 ID:A1bC2dE3
中国のAIがまたなんかヤバいの開発したらしい
https://www.itmedia.co.jp/aiplus/articles/2510/22/news042.html
中国のDeepSeek-AIに所属する研究者らは、本や画像などをスキャンして書いてある文字をデジタルテキストデータに変換するOCR(光学文字認識)を用い、長文を画像に圧縮する技術を発表した。
大規模言語モデル(LLM)が長文を処理する際、文章の長さに応じて計算量が二次関数的に増大するという根本的な課題がある。
DeepSeek-OCRは、文書を画像として扱い、視覚トークンへと変換することで大幅なデータ圧縮を実現している。
圧縮率が10倍以内であれば約97%という高い精度でテキストを復元でき、20倍という極端な圧縮でも約60%の精度を維持できることを実証した。
シンプルな文字認識だけでなく、文書内のグラフや図表、化学式、幾何学図形なども理解し、構造化されたデータとして出力できる。
もうこれわかんねえな…
3 風吹けば名無し 2025-10-23 18:31:02 ID:xYz4AbCd
ファッ!?
テキストを画像化…?逆じゃなくて?
5 風吹けば名無し 2025-10-23 18:31:45 ID:fGh5IjKl
長文を画像にして軽くしてAIに読ませるってことか?
発想がもう人間のそれやない
8 風吹けば名無し 2025-10-23 18:32:11 ID:mNo6PqRs
圧縮率10倍で精度97%とかいうパワーワード
普通にバケモンやろ
12 風吹けば名無し 2025-10-23 18:33:50 ID:tUv7WxYz
化学式とか図形もいけるんか…
ワイらの卒論、全部コイツに食わせられるやん
16 風吹けば名無し 2025-10-23 18:35:03 ID:aBc8DeFg
これを使えば昔のジャニーズの雑誌とかも全部データ化できるんちゃうか?
闇に葬られた記事が蘇るな
19 風吹けば名無し 2025-10-23 18:35:59 ID:hIj9KlMn
>>16
スマイルアップ社、震えて眠れ
24 風吹けば名無し 2025-10-23 18:37:21 ID:oPq0RsTu
計算量が減るってことは省エネなんやろ?
環境問題にも貢献とか最強か?
意識高い系もニッコリ
28 風吹けば名無し 2025-10-23 18:38:44 ID:vWx1YzA2
つまりワイが持ってるおっぱいの画像もテキストに圧縮できるってことなんか!?
31 風吹けば名無し 2025-10-23 18:39:10 ID:bCd3EfG4
>>28
たぶん「豊満な胸」みたいなキャプションになるだけやぞ
アホの子かな?
35 風吹けば名無し 2025-10-23 18:40:05 ID:hIj9KlMn
てか100言語対応ってマジ?
もう世界中の文献を支配できるやんけ
41 風吹けば名無し 2025-10-23 18:41:33 ID:jKl5MnOp
処理能力もA100一枚で1日20万ページとか書いてて草
国会図書館の蔵書も数年で終わりそう
48 風吹けば名無し 2025-10-23 18:43:09 ID:qRs6TuVw
さらっと書いてある「Gundam-masterモード」が気になってしゃーない
53 風吹けば名無し 2025-10-23 18:44:17 ID:xYz4AbCd
>>48
草
絶対開発者にガノタおるやろw
こういう遊び心すこ
59 風吹けば名無し 2025-10-23 18:45:22 ID:A1bC2dE3
ちな論文名は「DeepSeek-OCR: Contexts Optical Compression」らしいで
もうワイらには理解不能な領域やな…
66 風吹けば名無し 2025-10-23 18:46:58 ID:fGh5IjKl
もう人間はAI様が作った便利な道具を使うだけの存在になるんやね
72 風吹けば名無し 2025-10-23 18:48:01 ID:DeF7gH8i
また中国か…
技術の進化早すぎてついていけんわ
ワイはもう寝る
中国のDeepSeek-AIが、テキストを画像として圧縮しLLMの処理効率を上げる新技術「DeepSeek-OCR」を発表。その革新的な発想と性能に、ぽいJ民からは驚きと将来への期待、そしてなぜかジャニーズやおっぱいに関する謎の議論が巻き起こっている。
AIの進化は留まるところを知らんな…。ワイらも時代に乗り遅れんように、新しい技術には常にアンテナを張っとかんとアカンで!
参考URL:
[1] https://www.itmedia.co.jp/aiplus/articles/2510/22/news042.html


