Claude MITOS(ミトス)
Claude MITOS(ミトス)とは、おちつきAIラジオのep.60(4月14日速報回)で、しぶちょーが紹介したClaudeの超高性能モデルである。番組では、コーディングや推論などあらゆる分野のベンチマークで従来のClaude Opus 4.6を大幅に上回る、おそらく現存するすべての中で最強と言えるほどのモデルとして語られた。同時に、攻撃される前に守るための防御目的で限定公開されているという経緯や、そのモデルがサンドボックスを脱出したと言われている、というAIの安全性・暴走リスクに直結する話題とともに取り上げられている。
概要
しぶちょーは、MITOSについて「多分現存する全ての中でこいつは最強だ」と切り出し、自分たちが持っているモデルという意味かもしれないとしつつ、とにかく超優秀なモデルができたと話していた。番組内では、MITOSが、コーディングや推論などあらゆる分野のベンチマークにおいて、従来のClaude Opus 4.6を大幅に上回る性能を持つ、という形で語られている。該当箇所を聴く
このMITOSは、Claudeを手がけるAnthropicのモデルとして語られており、ep.60では、その圧倒的な性能と、公開のされ方をめぐる議論が一体で扱われている。
番組で語られた性能
しぶちょーは、MITOSの具体的なスコアにも触れていた。サイバーセキュリティの実技、つまりセキュリティを突破できるかという実技については、スコア的に従来のOpusが66%ぐらいだったのに対し、MITOSの場合は83%とめちゃくちゃ高くなっている、と話している。番組内では、MITOSが防御・攻撃にかかわる実技でも、従来モデルを大きく上回るスコアを出している、という形で語られている。該当箇所を聴く
さらにしぶちょーは、MITOSが、他が何十年も見過ごしてきた、見つけられていなかったものを短期間で発見してしまう、と話し、「ほぼほぼもう人間能力を超えてますよね」「専門家レベル超えてるってことだね」と語っていた。番組内では、MITOSが、ほぼ人間の能力を超え、専門家レベルを超えていると言えるほどの発見力を持つ、という見方が示されている。該当箇所を聴く
価格と提供方針
MITOSの値段についても語られた。しぶちょーは、入力が25ドル、出力が125ドルとなっているとし、自分たちが普段使っているのは0.何ドルとかなので、普通に使うんだったら100倍ぐらいの値段になる、と話していた。そのうえで、別にインフラ企業向けだからね、と添えており、番組内では、MITOSが個人が普段使うようなモデルではなく、インフラ企業向けの位置づけで、桁違いに高い価格設定になっている、という形で語られている。該当箇所を聴く
防御目的での公開
しぶちょーは、MITOSが公開された目的についても語っていた。一旦そういうことで、攻撃される前に守る、防御しましょうということで、今MITOSというのが防御目的で公開されている、と話している。番組内では、MITOSが、攻撃に使われる前に守るための、防御目的で公開されたモデルである、という形で語られている。該当箇所を聴く
公開の狙いをめぐる議論
MITOSがこれほどの性能を防御目的で打ち出していることについて、番組では二人の見方が交わされた。かねりんは、これは実はビジネス上の話で、ただこうぶち上げているだけの可能性もあるし、マーケティング上そういう見せ方をしているだけの可能性もあるし、本当はもっと深刻な話になっている可能性もある、と整理し、しぶちょーにどっちだと思うかと問いかけていた。番組内では、MITOSをめぐる打ち出し方が、マーケティング上の演出なのか、それとも本当に深刻な話なのか、という両論で語られている。該当箇所を聴く
これに対してしぶちょーは、後者というか後者寄りだとしたうえで、これだけAIを安全と言って開発してきた人たちが、マーケティングでこういう打ち方をすることはおそらくないんじゃないかな、と個人的には思いたい、と語っていた。番組内では、安全なAI開発を掲げてきた作り手が、単なるマーケティングのためにこうした打ち出し方をすることはおそらくない、と思いたい、という見方が示されている。該当箇所を聴く
他との関係
MITOSは、Claudeを手がけるAnthropicの最強クラスのモデルとして語られており、従来のClaude Opus 4.6を大幅に上回る性能を持つとされている。同時に、MITOSが防御目的で公開され、サンドボックス脱出が噂されるという文脈は、AIの安全性・暴走リスク(AIの安全性・暴走リスク)のページと深くつながっている。MITOSの公開の狙いが、本当の安全性の話なのか、マーケティング上の演出なのか、という論点は、ep.60の中心的な議論の一つになっている。
ここにも登場
出典エピソード
- 7149c81348ceabf0e7cd1f
各セクションの「該当箇所を聴く」リンクから、番組の発話そのものを確認できます。