国産LLM
国産LLMとは、おちつきAIラジオでは日本の企業や組織が国内で開発・運用する大規模言語モデルとして語られている存在である。番組(ep.26「【国産LLM】後出しジャンケンで挑む日本のAI開発とAI推進法の現在地を解説」)では、単純なベンチマーク性能だけでなく、「国産で国の中で完結している」というストーリーや、セキュリティ、行政・教育・日本語向け用途での価値という観点から繰り返し取り上げられた。さらにep.29の速報回では、政府が1兆円投資を宣言し、その資金がまさに国産LLMの開発に流れていく、という話題として語られた。ep.56の速報回では、国産の日本語モデルが、海外のフリーなモデルへのファインチューニングで作られているという実態に踏み込んで語られている。
概要
おちつきAIラジオでは、毎週火曜日に速報会をきちんとやっているものの、日本関連のトピックを扱ったことはほぼなく、ほとんどないのではないかと振り返られている 該当箇所を聴く。その上で、このエピソードの結論として、日本のAI開発は「バチバチに進んでますよ」という話だと最初に語られた 該当箇所を聴く。
ただし番組では、日本のAIは「結局こういうことになりましたよ」と結論が出た段階ではなく、常に今から変化していったり新しい取り組みが行われていく段階にあると整理されている 該当箇所を聴く。
番組での扱われ方
番組では、国産LLMの価値は単純性能だけではないと強調された。性能も当然あるとしつつ、その後その人たちと開発するとか、やっぱり国産で国の中で完結しているというストーリーが重要だから、と語られている 該当箇所を聴く。
この観点から、しぶちょー・かねりんは、ベンチマークテストで完全にGeminiなどと勝たなくてもいい、日本用であればよいという立場を示した 該当箇所を聴く。性能競争での全面勝利よりも、日本向けの用途で機能することを重視する語り口である。
この「日本向けで機能すればよい」という見方は、ep.56でもさらに踏み込んで語られた。番組では、国産の日本語モデルについて、特定のタスクでめちゃくちゃ性能が高いといったクリティカルな強さがあるわけではないが、日本の文化や社会的な文脈においてはすごく有用性を発揮するモデルなのではないか、という見方が示されている 該当箇所を聴く。
国産LLMの担い手
番組では、具体的な国産LLMの事例として企業名とモデル名が挙げられた。NECは「琴見(cotomi)」という国産LLMを手がけていると語られ 該当箇所を聴く、富士通は「高音(Takane)」だったと挙げられている 該当箇所を聴く。
国産日本語モデルの作られ方:ファインチューニング
ep.56では、国産の日本語モデルが実際にどう作られているかにも踏み込んで語られた。番組では、ナマズ(試作モデル)について、もともとあるフリーで提供されているモデルに対してFine-tuningをして日本語モデルを作っている、と説明されている 該当箇所を聴く。
そのベースになるモデルとして、番組ではMeta AI系のLlamaや、OpenAIが出しているオープンソースのモデルGPT-OSSなどが使われると語られた 該当箇所を聴く。国産モデルといっても、まったくゼロから作るのではなく、既存の公開モデルを土台にしている、という実態が示されている。
そのうえで番組では、ファインチューニングは結構難しく、これによってモデルをちゃんと学習させようと思ったら相当のデータセットと相当の学習がいる、と語られた 該当箇所を聴く。「ベースを使っているから簡単」という話ではなく、肝はファインチューニングの側にあるという整理である。
この点について番組では、たとえベースにDeepSeekのような海外モデルを使っていても、それは車輪の再発明をしないというだけの話で、ファインチューニングにこそ肝がある、という見方が示された 該当箇所を聴く。ベースモデルが海外製であることをもって国産モデルの価値を否定する向きへの、番組側の応答にもなっている。なお、ベースモデルが中国系であることそのものを理由に批判が向かいやすい点については中国モデルへのバイアスとしても語られた。
セキュリティと行政・教育での価値
番組では、国産LLMの意義としてセキュリティの担保が論じられた。仕組みとして完全に国産LLMができれば、セキュリティとそういうものは担保されるわけだから、捜査機関などで導入した方がよいという見方が示されている 該当箇所を聴く。
また、3Dモデルの話の流れから、安心して使えるのはやっぱり国産のサービスであり、行政に取り入れていけるのもそういうサービスだから、教育という文脈においても国産の生成AI系のサービスがめっちゃ大事だなと実感したと語られた 該当箇所を聴く。
日本語向け用途との相性
番組では、日本語の文章を作る系のものや日本人向けのサービスは、割と国産でいけるのではないかと話された。日本語の文章を作る系や日本人向けのサービスでは、国産LLMで無駄が減り良くなっていくと思うという見方が示されている 該当箇所を聴く。
政府の1兆円投資
ep.29「[12月30日:速報回]」では、政府の動きとして、国産LLMの開発強化やトレンドワードであるフィジカルAIに力を入れていくことを宣言し、予算として1兆円投資するという話題が紹介された。番組では「1兆円僕らの番組にも投資してもらえないのかね」と冗談を交えつつ、国の政策として国産LLM開発に大きな予算が向けられることが語られている 該当箇所を聴く。
そのうえで番組では、この政府の1兆円投資について「この国産LLMの開発にまさに流れていくということになるね」と語られ、宣言された予算が国産LLMの開発に向かっていくものとして位置づけられた 該当箇所を聴く。
他人事から応援へ
ep.29では、国産LLMとの距離感についても語られた。番組では、国産LLMはこれまで「耳にしつつもどこか他人事だった」存在だったと振り返られている 該当箇所を聴く。
そのうえで、関連団体をXでフォローして話題にすること自体が、「やっぱり国産LLM界隈を応援することにもなっている」と語られ、リスナーや番組が情報を追いかけ広めること自体が国産LLM界隈を応援する行為になりうる、という見方が示された 該当箇所を聴く。この語りは、日本のAI動向を追うために番組がフォローを勧めたチーム未来などをフォローしていく姿勢とも地続きになっている。
他との関係
番組での国産LLMの語りは、汎用的な巨大モデルで全面的に勝つのではなく、用途を絞って活かすという産業特化モデル戦略の議論と一体で展開されている。また、良質な日本語データセットの必要性を議論していた安野(庵野)さんや、日本のAI動向を追うために番組がフォローを勧めたチーム未来、日本初のAIに特化した包括的な法令として紹介されたAI推進法とあわせて、日本のAI開発というテーマの中で語られた。
語られ方の変遷
ep.26では、国産LLMは性能だけでなく「国内で完結しているストーリー」やセキュリティ、行政・教育・日本語向け用途の価値という観点から語られていた 該当箇所を聴く。ep.29ではそこに、政府が1兆円投資を宣言し、その資金が国産LLM開発に流れていくという政策面の話題が加わった 該当箇所を聴く該当箇所を聴く。
また、距離感の面でも変化が語られている。これまで「どこか他人事だった」国産LLMが 該当箇所を聴く、関連団体をXでフォローして話題にすること自体が「国産LLM界隈を応援することにもなっている」と語られるようになり 該当箇所を聴く、番組内での国産LLMは、遠くで進む話から、自分たちが情報を追いかけ応援していく対象へと位置づけが寄っている。
そしてep.56では、国産日本語モデルの「中身の作られ方」にまで踏み込んだ語りが加わった。クリティカルなタスク性能ではなく日本の文化・社会的文脈での有用性に価値を見る見方 該当箇所を聴く、フリーの公開モデルへのファインチューニングで作られている実態 該当箇所を聴く、ベースにLlamaやGPT-OSSなどの海外モデルが使われること 該当箇所を聴く、そしてファインチューニングには相当のデータと学習が要り、そこにこそ肝がある 該当箇所を聴くという整理である。番組内での国産LLMは、ここに至って、「国産か否か」を見た目で線引きする話から、海外の土台の上にどう日本向けの作り込みを重ねるか、という技術的な実態を含めて語られる対象へと深まっている 該当箇所を聴く。
ここにも登場
出典エピソード
- 102f051edee5edd1cbc419
- 19328bc7c66ba9539b1f29
- d5187e1d8e2a17839ee14f
各セクションの「該当箇所を聴く」リンクから、番組の発話そのものを確認できます。