先週、NVIDIAが「Nemotron 3 Nano Omni」というモデルを発表した記事を読んだ。
正直、最初は「またAIの新モデルか」と流し読みするつもりだった。
でも数字を見ていくうちに、これは少し違うと感じた。
何が引っかかったかというと、効率性の数字だ。
マルチドキュメント用途で従来モデルの7.4倍、動画用途で9.2倍のスループットを実現しているという。
「スループット」という言葉は経営陣には伝わりにくいが、要は「同じコストでこれだけ多くの仕事をこなせる」ということだ。
私の部署では今年、営業資料の分析やレポート作成にAIツールを試験導入している。
部下に使わせてみると、一番つまずくのは「PDFが読めない」「図表の内容が拾えない」という点だった。
Nemotron 3 Nano Omniは、まさにその部分——契約書・技術資料・表・グラフを横断して理解する——を狙い撃ちにしている。
たとえばMMLongBench-Docというドキュメント理解の評価指標で57.5点を記録している。
ひとつ前のモデルは38点だったので、かなり大きな改善だ。
ただ、この数字をそのまま社内プレゼンに持ち込んでも「で、うちで何に使えるの?」と返ってくるのが目に見えている。
稟議を通すうえで経営陣が本当に聞きたいのは、ベンチマークスコアじゃない。
「今の業務のどこが変わるか」「それで何時間・何円が浮くか」という話だ。
技術記事を読んで終わりではなく、そこから業務への翻訳をする作業が、私たちDX推進側の仕事だと改めて思う。
このモデルはテキスト・画像・動画・音声をまとめて扱える、いわゆるオムニモデルだ。
音声認識の精度評価でもVoiceBenchで89.4点を記録しており、音声入力の実用性も一定水準を超えている。
営業DXの観点で言うと、たとえばこんな使い方が考えられる。
ただし、ここで必ず確認しなければならないのがセキュリティ要件だ。
このモデルはオープンウェイト(重みが公開されている)なので、自社環境に閉じた形での運用が原理上は可能だ。
その点はクラウドサービスのAPIをそのまま使う場合より、情報漏洩リスクの説明がしやすい。
情報システム部門との連携で「社外にデータを出さない構成」を取れるかどうかが、稟議の通りやすさに直結する。
もちろん、自社インフラで動かすにはGPUのコストが別途かかる。
そこをどう試算して提示するか、今週末に少し整理してみるつもりだ。
あなたの会社では、ドキュメント分析や会議録の処理にかかっている時間を、一度きちんと数えたことはあるだろうか?
正直、最初は「またAIの新モデルか」と流し読みするつもりだった。
でも数字を見ていくうちに、これは少し違うと感じた。
何が引っかかったかというと、効率性の数字だ。
マルチドキュメント用途で従来モデルの7.4倍、動画用途で9.2倍のスループットを実現しているという。
「スループット」という言葉は経営陣には伝わりにくいが、要は「同じコストでこれだけ多くの仕事をこなせる」ということだ。
「技術の話」を「仕事の話」に翻訳する作業が本番
私の部署では今年、営業資料の分析やレポート作成にAIツールを試験導入している。
部下に使わせてみると、一番つまずくのは「PDFが読めない」「図表の内容が拾えない」という点だった。
Nemotron 3 Nano Omniは、まさにその部分——契約書・技術資料・表・グラフを横断して理解する——を狙い撃ちにしている。
たとえばMMLongBench-Docというドキュメント理解の評価指標で57.5点を記録している。
ひとつ前のモデルは38点だったので、かなり大きな改善だ。
ただ、この数字をそのまま社内プレゼンに持ち込んでも「で、うちで何に使えるの?」と返ってくるのが目に見えている。
稟議を通すうえで経営陣が本当に聞きたいのは、ベンチマークスコアじゃない。
「今の業務のどこが変わるか」「それで何時間・何円が浮くか」という話だ。
技術記事を読んで終わりではなく、そこから業務への翻訳をする作業が、私たちDX推進側の仕事だと改めて思う。
ベンダー評価のときに押さえておきたい視点
このモデルはテキスト・画像・動画・音声をまとめて扱える、いわゆるオムニモデルだ。
音声認識の精度評価でもVoiceBenchで89.4点を記録しており、音声入力の実用性も一定水準を超えている。
営業DXの観点で言うと、たとえばこんな使い方が考えられる。
- 商談後の音声録音を自動でテキスト化し、要点を整理する
- 競合他社の技術資料(PDF)を一括で読み込んで比較表を生成する
- 社内向け報告動画の内容を自動でサマリー化する
ただし、ここで必ず確認しなければならないのがセキュリティ要件だ。
このモデルはオープンウェイト(重みが公開されている)なので、自社環境に閉じた形での運用が原理上は可能だ。
その点はクラウドサービスのAPIをそのまま使う場合より、情報漏洩リスクの説明がしやすい。
情報システム部門との連携で「社外にデータを出さない構成」を取れるかどうかが、稟議の通りやすさに直結する。
もちろん、自社インフラで動かすにはGPUのコストが別途かかる。
そこをどう試算して提示するか、今週末に少し整理してみるつもりだ。
あなたの会社では、ドキュメント分析や会議録の処理にかかっている時間を、一度きちんと数えたことはあるだろうか?