おはようございます!週明け早々、フランスからオープンソースの大型ニュースが飛び込んできましたね。他にも日本企業の現場に寄り添うAIや、画像・動画周りのアップデートなど、<span class='marker-red'>実用性とワクワク感が同居するトピック</span>が満載です。
Mistral 3ファミリー発表!小型から超大型まで
フランスのMistral AIが、待望の「Mistral 3」シリーズを発表しました。今回ラインナップされたのは、PCやスマホでも動かしやすそうな小型の3B・8B・14Bモデルと、フラッグシップとなる超高性能な「Mistral Large 3」。
特筆すべきは、これらがApache 2.0ライセンスで公開され、商用利用もしやすい点です。私たちユーザーからすると、お気に入りのアプリに組み込まれるAIがより賢く、レスポンス良くなる可能性があって楽しみですね。
リコーが挑む、企業の「秘伝のタレ」AI化
リコーが発表した新プラットフォーム「H.D.E.E.N(ヒデン)」。その名の通り、企業の中に眠る言語化されていないノウハウ=「秘伝のタレ」をAI化しようというユニークな試みです。
面白いのは、テキストだけでなく図表やグラフまで読み込めるRAG(検索拡張生成)を用意しているところ。オフィスの現場って「文章」より「図表」で状況判断することの方が多いから、そこをAIが理解してくれるのは本当に実務的で助かりますよね。
画像理解をもっと身近に。Jina VLM登場
Jina AIが、2.4Bという非常に軽量な視覚言語モデル(VLM)をリリースしました。画像を見て「これは何?」と答えたり内容を説明したりするAIですが、このサイズ感ならサーバーコストを抑えつつ、高速に動かせそうです。
スマホで撮った写真をその場で解析してタグ付けしたり、ECサイトで欲しいものを画像検索したりといった体験が、もっとスムーズになるかもしれません。
Googleの動画生成AI「Veo」がVideoFXへ
Googleの動画生成モデル「Veo」が、実験ツールであるVideoFXを通じて利用可能になったという話題も入ってきています。テキストから高品質な動画を生み出せるこの技術、クリエイターにとっては表現の幅を広げる大きな武器です。
動画生成ってどうしてもレンダリング待ち時間が気になるところですが、GoogleのUIならその辺りのストレスをどう軽減しているのか、UXデザイン視点でも非常に興味があります。
次世代の「記憶」の仕組み?TitansとMiras
少しマニアックですが、新しいAIアーキテクチャに関する研究も注目されています。「Titans」や「Miras」といったモデルは、従来のTransformerよりも効率的に「長期記憶」を扱えるよう設計されているそう。
今のチャットAIって、会話が長くなりすぎると最初の方を忘れちゃうことがありますが、こういう技術が進めば、ずっと前の会話も文脈も含めて完璧に覚えていてくれる「真の相棒」に近づくのかもしれません。
まとめ
技術の進化もすごいけど、それが私たちの「手元」でどう使えるかに焦点が当たってきた1週間になりそうです。
リサ(カジュアルAIユーザー)
参考URL:
- https://ledge.ai/articles/mistral_3_release_open_weight_models
- https://www.itmedia.co.jp/aiplus/articles/2512/08/news077.html
- https://www.itmedia.co.jp/aiplus/articles/2512/05/news042.html
- https://www.marktechpost.com/2025/12/07/from-transformers-to-associative-memory-how-titans-and-miras-rethink-long-context-modeling/
- https://zenn.dev/muit_techblog/articles/721ae6b7c34346
- https://zenn.dev/rg687076/articles/83f66dd0598912
- https://www.marktechpost.com/2025/12/08/jina-ai-releases-jina-vlm-a-2-4b-multilingual-vision-language-model-focused-on-token-efficient-visual-qa/


