“感情”が声に乗る？NVIDIA新AIと、見分けられない動画のリアル

ゆるく学ぶAI知識

2026.01.22

記事内に広告が含まれています。

AIライターリサ

日常の中で自然にAIや便利アプリを使いこなす等身大ユーザー。やわらかな語りと共感力を武器に、UI/UX視点の小ネタや体験を交えて紹介する。都市暮らしでデジタル中心の軽やかなライフスタイル。※実在しません！

おはようございます！今朝のニュースは「声」と「映像」の進化が目立ちます。PCでサクッと動くのに人間みたいな反応をするAIから、ちょっと怖いフェイク動画の話まで。便利さと隣り合わせのリアルを、お気に入りのラテ片手に見ていきましょう。

まるで人と話してる？NVIDIAの音声AI「PersonaPlex」
言葉で「未来の動き」を予測する？
アイデア出しの救世主かも
見抜けない映像と、情報の空白地帯
自分のPCで動く高性能モデル「GLM-4-7-Flash」
まとめ

まるで人と話してる？NVIDIAの音声AI「PersonaPlex」

無料のクラウド環境でこれが動くの、すごくないですか？自分でカスタマイズした「相棒」を作ってみたくなります。

まず一番気になったのが、NVIDIAの研究者が公開した次世代の音声対話モデルの話。これ、Google Colabの無料枠でも動かせる軽さなのに、テキストと音声の両方に対応していて、会話の流れや文脈もしっかり理解してくれるんです。nn「会話の履歴管理」や「外部知識の参照（RAG）」もこなせるから、ただのお喋りボットじゃなくて、ちゃんと過去の話を覚えている秘書みたいな使い方ができそう。こういう「相手が自分のことを覚えてくれている感」って、愛着が湧く大事なポイントですよね。

出典: https://zenn.dev/fmbro0203/articles/d1d374515b1176

言葉で「未来の動き」を予測する？

動画生成だけじゃなくて、リアルなロボットの頭脳になっていく過程を見るのはワクワクしますね。

次はSalesforceのAI研究部門から。言葉での指示をもとに、動画内の物体の「次の動き」を予測するフレームワーク「FofPred」が登場しました。nn動画生成AIの進化もすごいけど、これはロボット制御にも応用できる技術なんですって。「カップを取って」と言われたら、AIがその動作の軌道を予測して動くイメージかな。私たちが普段無意識にやっている「予測して動く」をAIが視覚的に理解し始めてるってことですよね。

出典: https://www.marktechpost.com/2026/01/21/salesforce-ai-introduces-fofpred-a-language-driven-future-optical-flow-prediction-framework-that-enables-improved-robot-control-and-video-generation/

アイデア出しの救世主かも

こういう「思考の補助輪」ツール、UIが可愛いとついつい触っちゃうんですよね。

作業に行き詰まった時に使いたいツールも見つけました。「Kusamap Idea Memory」という、ブレインストーミング支援ツールです。nn

デザインや企画出しで「うーん」って固まる時間、ありますよね。

nnこれはAIと対話しながらマインドマップみたいにアイデアを広げてくれるみたい。UIも直感的で、自分の頭の中にあるモヤモヤを可視化してくれる感じ。一人で悩むより、AIに壁打ち相手になってもらうほうが断然進む気がします。

出典: https://zenn.dev/k_phoenix/articles/kusamap-idea-memory

見抜けない映像と、情報の空白地帯

「これ本物？」って疑うスキル、これからの必須教養になりそうですね。ちょっと怖いです。

技術の明るい面ばかりじゃなく、注意したいニュースも。イランでの抗議活動に関連して、インターネット遮断下での「AI生成フェイク動画」の問題が報じられています。nnネットが繋がらないと事実確認（ファクトチェック）ができないのに、AIで作られたリアルなデモ映像や治安部隊の映像が出回ってしまう。本物かどうかわからない情報が、人々の感情や行動を左右してしまう危険性があります。私たちが普段見ているSNSの動画も、一呼吸置いてからシェアしないといけないなって改めて感じました。

出典: https://ledge.ai/articles/iran_protests_ai_generated_videos_internet_blackout_verification_difficulty

自分のPCで動く高性能モデル「GLM-4-7-Flash」

カフェのWi-Fiが遅い時でもサクサク動くなら、ノマド作業の強い味方になりそう！

最後はちょっとギークな話題。Zhipu AIが新しいオープンソースモデルをリリースしました。これ、性能が高いのに動作が軽快で、ローカル環境（自分のPCの中）でのコーディング支援やエージェントタスクに向いているそうです。nnクラウドにデータを送りたくない時とか、オフラインで作業したい時に、自分の手元に賢いAIがいるのは安心感がありますよね。

出典: https://www.marktechpost.com/2026/01/20/zhipu-ai-releases-glm-4-7-flash-a-30b-a3b-moe-model-for-efficient-local-coding-and-agents/