憲法的なAI（Constitutional AI）

AI安全性Constitutional AIRLHF学習バイアスAIの判断基準Anthropic自己学習

憲法的なAI（Constitutional AI）とは、おちつきAIラジオでは、Anthropicが開発した、AIの安全性を高める手法として語られている概念である。ep.37の速報回でしぶちょーは「なんか憲法的なAIっていう概念があってさ、これはAnthropicが開発したAIの安全性を高める手法なんだけど」と切り出し、これがもともとRLHFのような学習に思想が入ってしまう問題から来ている、という流れで説明していた。番組では、AIが従うべき規範を「憲法」と呼ばれる文章の形で与え、その文章をどう書くかでAIの振る舞いを安全な方向に導こうとする手法として扱われている。該当箇所を聴く

概要：RLHF学習の問題が背景にあるという語られ方

しぶちょーは、憲法的なAIについて、もともとRLHFの話とつながっているものとして紹介していた。発言では「もともとさ、最初にさRLHFの話したじゃない?あーっとなんかあれだね、学習して」と語られ、学習の段階で思想が入ってしまうという問題が背景にある、という文脈で位置づけられていた。おちつきAIラジオでは、憲法的なAIは、こうした学習に起因する課題に対して、AIの安全性を高めるためにAnthropicが編み出した手法として説明されている。該当箇所を聴く

原則を与えて自己学習的に学習させる手法

ep.59「Claude躍進の理由は信念にあり！利益より社会貢献を選ぶ異端のAI企業、Anthropicの正体に迫る」では、しぶちょーが、Anthropicの手法としての憲法的なAIをあらためて説明していた。発言では「後で説明するんだけど、とにかくAIモデルにあなたたちはこうあるべきだみたいな原則を与えて、その原則に従って自己学習的な感じで学習させていくと」と語られている。おちつきAIラジオでは、憲法的なAIは、モデルに「あなたたちはこうあるべきだ」という原則を与え、その原則に従って自己学習的に学習させていく手法として語られており、これまで語られてきた「憲法」と呼ばれる文章で規範を与えるという説明と地続きの形で位置づけられている。該当箇所を聴く

旧憲法と新憲法の違い：「なぜ」が書かれているかどうか

番組では、この「憲法」に旧版と新版があるとして、その違いが語られた。しぶちょーは、旧憲法（元々の憲法）には「有害なコンテンツは避けるとか、正直な回答をせよみたいなことが書いてあった」と説明していた。それに対して新憲法では、「なぜ有害なコンテンツを避けるべきか」という理由まで書かれている、という違いが紹介されている。おちつきAIラジオでは、旧憲法が守るべきルールを列挙するだけだったのに対し、新憲法はその理由まで含めて書く形に変わった、という対比で語られている。該当箇所を聴く

「なぜ」を書くことの狙い：リストにない状況でも文脈に沿って判断

しぶちょーは、新憲法に「なぜ」を書くことの狙いについても語っていた。発言では「だってなぜを記載することで、モデルがそれを学んだことでよって、本来リストの中にない状況であっても、憲法の文脈に沿って正しく判断できるよねみたいな」と説明されている。おちつきAIラジオでは、規範の理由までモデルに学ばせておけば、あらかじめリスト化されていない状況に直面しても、憲法の文脈に沿って正しく判断できるようになる、という考え方として、この手法のねらいが語られている。該当箇所を聴く

他との関係

番組内では、この憲法的なAIは、Anthropicが自社のAIの安全性を高めるために用いる手法として語られており、同社が手がけるClaude SonnetをはじめとするClaudeの挙動を支える土台に位置づく文脈で触れられている。また、ルールだけでなく「なぜ」を書くという発想は、AIに何をさせ何をさせないかをどう設計するか、という安全性をめぐる議論の一例として、おちつきAIラジオで紹介されている。なお、Anthropic自身はOpenAIから分離してできた団体だと番組では語られており、憲法的なAIは、そうした安全性を重視するAI企業の取り組みの一つとして扱われている。該当箇所を聴く

語られ方の変遷

憲法的なAIの語られ方は、ep.37で「Anthropicが開発したAIの安全性を高める手法」として、RLHF学習に思想が入る問題を背景に紹介され、旧憲法と新憲法の違い、「なぜ」を書くことの狙い、という形で蓄積されてきた。該当箇所を聴く ep.59では、これらと矛盾しない形で、モデルに「こうあるべきだ」という原則を与え、その原則に従って自己学習的に学習させていく手法だ、という説明が加わった。該当箇所を聴くこれは、規範を文章で与えるというこれまでの説明を、「原則を与えて自己学習的に学習させる」という学習プロセスの側面から補強する語り口になっており、おちつきAIラジオでの憲法的なAI像は、文章で規範を与える手法という側面と、その規範に沿って自己学習させる手法という側面とが、一貫して積み重なっている。

ここにも登場

💬 この話題をAIに質問する（RAG検索へ）→

出典エピソード

110055be6f48cdb491bde1
ca770a56b5ace84a888731

各セクションの「該当箇所を聴く」リンクから、番組の発話そのものを確認できます。