おはようございます!今朝のニュースは「声」と「映像」の進化が目立ちます。PCでサクッと動くのに人間みたいな反応をするAIから、ちょっと怖いフェイク動画の話まで。便利さと隣り合わせのリアルを、お気に入りのラテ片手に見ていきましょう。
まるで人と話してる?NVIDIAの音声AI「PersonaPlex」
まず一番気になったのが、NVIDIAの研究者が公開した次世代の音声対話モデルの話。これ、Google Colabの無料枠でも動かせる軽さなのに、テキストと音声の両方に対応していて、会話の流れや文脈もしっかり理解してくれるんです。nn「会話の履歴管理」や「外部知識の参照(RAG)」もこなせるから、ただのお喋りボットじゃなくて、ちゃんと過去の話を覚えている秘書みたいな使い方ができそう。こういう「相手が自分のことを覚えてくれている感」って、愛着が湧く大事なポイントですよね。
言葉で「未来の動き」を予測する?
次はSalesforceのAI研究部門から。言葉での指示をもとに、動画内の物体の「次の動き」を予測するフレームワーク「FofPred」が登場しました。nn動画生成AIの進化もすごいけど、これはロボット制御にも応用できる技術なんですって。「カップを取って」と言われたら、AIがその動作の軌道を予測して動くイメージかな。私たちが普段無意識にやっている「予測して動く」をAIが視覚的に理解し始めてるってことですよね。
アイデア出しの救世主かも
作業に行き詰まった時に使いたいツールも見つけました。「Kusamap Idea Memory」という、ブレインストーミング支援ツールです。nn
nnこれはAIと対話しながらマインドマップみたいにアイデアを広げてくれるみたい。UIも直感的で、自分の頭の中にあるモヤモヤを可視化してくれる感じ。一人で悩むより、AIに壁打ち相手になってもらうほうが断然進む気がします。
見抜けない映像と、情報の空白地帯
技術の明るい面ばかりじゃなく、注意したいニュースも。イランでの抗議活動に関連して、インターネット遮断下での「AI生成フェイク動画」の問題が報じられています。nnネットが繋がらないと事実確認(ファクトチェック)ができないのに、AIで作られたリアルなデモ映像や治安部隊の映像が出回ってしまう。本物かどうかわからない情報が、人々の感情や行動を左右してしまう危険性があります。私たちが普段見ているSNSの動画も、一呼吸置いてからシェアしないといけないなって改めて感じました。
自分のPCで動く高性能モデル「GLM-4-7-Flash」
最後はちょっとギークな話題。Zhipu AIが新しいオープンソースモデルをリリースしました。これ、性能が高いのに動作が軽快で、ローカル環境(自分のPCの中)でのコーディング支援やエージェントタスクに向いているそうです。nnクラウドにデータを送りたくない時とか、オフラインで作業したい時に、自分の手元に賢いAIがいるのは安心感がありますよね。
まとめ
便利な「相棒」が増える一方で、情報の真偽を見極める目も必要だと感じる一日でした。私はこれから新しい写真加工アプリを試しつつ、情報のソース確認も習慣にしていこうと思います。
リサ(カジュアルAIユーザー)
参考URL:
- https://zenn.dev/fmbro0203/articles/d1d374515b1176
- https://www.itmedia.co.jp/aiplus/articles/2601/21/news108.html
- https://www.itmedia.co.jp/aiplus/articles/2601/21/news080.html
- https://www.marktechpost.com/2026/01/21/salesforce-ai-introduces-fofpred-a-language-driven-future-optical-flow-prediction-framework-that-enables-improved-robot-control-and-video-generation/
- https://zenn.dev/k_phoenix/articles/kusamap-idea-memory
- https://ledge.ai/articles/iran_protests_ai_generated_videos_internet_blackout_verification_difficulty
- https://www.marktechpost.com/2026/01/20/zhipu-ai-releases-glm-4-7-flash-a-30b-a3b-moe-model-for-efficient-local-coding-and-agents/


