先日、競合のCTOと久しぶりに飲んだ。そこで出てきた話が少し気になっている。「うちはもうNVIDIAにこだわってない」という一言だ。
最近こんな記事を読んだ。AMD製のGPU(MI300X)だけを使って、医療系AIをゼロから学習させたというプロジェクトの話だ。しかもHugging FaceのブログにPublishされた、わりと本気度の高い内容だった。
正直、AIインフラの話は「エンジニアに任せればいい」と思っていた。でも読んでみると、これは調達コストの話だと気づいた。学習に使ったGPUはAMD Instinct MI300Xという機種で、HBMメモリが192GBある。これがポイントだ。
NVIDIAの同等スペック帯のGPUは今、入手難・価格高騰が続いている。一方でAMDは選択肢として浮上してきている。このプロジェクトでは、環境変数を3行変えるだけでNVIDIAと同じコードがそのまま動いたと書いてある。コードの改修ゼロだ。
そして学習時間は約5分。2000件のデータで医療系の質問回答モデルをファインチューニングして5分。スタートアップが「とりあえず試す」には十分すぎる速さだ。
うちは医療系じゃない。でもこの話を読んで考えたのは、AIの調達コスト構造が変わってきているということだ。
投資家にAI活用の話をするとき、「うちはOpenAIのAPIを使っています」だと差別化にならない。一方で「独自モデルをチューニングしています」と言うと、「コストは?」「どのインフラで?」という話になる。
そこで「NVIDIAじゃなくていい環境を選んでいる」という選択肢があると、調達の柔軟性として語れる。GPUクラウドのコスト比較でAMDが入ってくると、交渉レバレッジが変わる。これは地味だけど効く話だと思う。
セールスやカスタマーサクセスの文脈でも同じだ。「AIで何かやりたい」という顧客候補に対して、「インフラの選択肢が広がっている」という話は、導入ハードルを下げる材料になる。NVIDIAが高い・手に入らないという理由でAI導入を止めていた企業には刺さる。
LLMのファインチューニングに使われたのはQwen3-1.7Bというモデルで、パラメータ数は17億。決して巨大モデルではない。それでも医療系MCQで意味のある精度が出たと書いてある。
スタートアップがAIを使うとき、GPT-4を叩き続けることが正解とは限らない。小さいモデルを自社データでチューニングして、AMD製GPUで動かす。コストと速度のバランスを自分たちでコントロールできる環境が、実は競争力になり得る。
飲みの席でのCTOの一言は、たぶんこういうことだったんだと思う。自分も来週、うちのエンジニアにこの記事を共有してみるつもりだ。NVIDIA以外の選択肢を今のうちに把握しておくことは、コスト最適化の布石になると思っている。
最近こんな記事を読んだ。AMD製のGPU(MI300X)だけを使って、医療系AIをゼロから学習させたというプロジェクトの話だ。しかもHugging FaceのブログにPublishされた、わりと本気度の高い内容だった。
「NVIDIA前提」が崩れていく
正直、AIインフラの話は「エンジニアに任せればいい」と思っていた。でも読んでみると、これは調達コストの話だと気づいた。学習に使ったGPUはAMD Instinct MI300Xという機種で、HBMメモリが192GBある。これがポイントだ。
NVIDIAの同等スペック帯のGPUは今、入手難・価格高騰が続いている。一方でAMDは選択肢として浮上してきている。このプロジェクトでは、環境変数を3行変えるだけでNVIDIAと同じコードがそのまま動いたと書いてある。コードの改修ゼロだ。
そして学習時間は約5分。2000件のデータで医療系の質問回答モデルをファインチューニングして5分。スタートアップが「とりあえず試す」には十分すぎる速さだ。
自分のビジネスに引き寄せて考えてみた
うちは医療系じゃない。でもこの話を読んで考えたのは、AIの調達コスト構造が変わってきているということだ。
投資家にAI活用の話をするとき、「うちはOpenAIのAPIを使っています」だと差別化にならない。一方で「独自モデルをチューニングしています」と言うと、「コストは?」「どのインフラで?」という話になる。
そこで「NVIDIAじゃなくていい環境を選んでいる」という選択肢があると、調達の柔軟性として語れる。GPUクラウドのコスト比較でAMDが入ってくると、交渉レバレッジが変わる。これは地味だけど効く話だと思う。
セールスやカスタマーサクセスの文脈でも同じだ。「AIで何かやりたい」という顧客候補に対して、「インフラの選択肢が広がっている」という話は、導入ハードルを下げる材料になる。NVIDIAが高い・手に入らないという理由でAI導入を止めていた企業には刺さる。
「NVIDIA一択」は思い込みかもしれない
LLMのファインチューニングに使われたのはQwen3-1.7Bというモデルで、パラメータ数は17億。決して巨大モデルではない。それでも医療系MCQで意味のある精度が出たと書いてある。
スタートアップがAIを使うとき、GPT-4を叩き続けることが正解とは限らない。小さいモデルを自社データでチューニングして、AMD製GPUで動かす。コストと速度のバランスを自分たちでコントロールできる環境が、実は競争力になり得る。
飲みの席でのCTOの一言は、たぶんこういうことだったんだと思う。自分も来週、うちのエンジニアにこの記事を共有してみるつもりだ。NVIDIA以外の選択肢を今のうちに把握しておくことは、コスト最適化の布石になると思っている。