AIバイアス
AIバイアスとは、おちつきAIラジオ(しぶちょー × かねりん)のep.57「Googleの炎上事例から考える、AIバイアスを取り除くことの難しさ」で正面から扱われたテーマで、AIの判断や出力に入り込む偏りのこととして語られている。番組では、このバイアスがどこから来るのか、なぜ問題なのか、そしてそれを取り除くことがいかに難しいかが、具体的な事例とともに議論された。
バイアスの出どころ
かねりんは、AIにバイアスが現れるのは「元の学習データにバイアスが含まれてたから」だと整理した。該当箇所を聴く この回では、その具体例としてAmazonの採用AIやリクルート社のデータの事例が取り上げられており、データ側の偏りが判断に持ち込まれるという学習データの偏りの問題として語られている。
かねりんは、採用などの場面で「そこに差別的な判断が入ってちゃいけないよねっていうのは当然ある」と述べ、バイアスが実害につながる領域があることを前提に話を進めた。該当箇所を聴く
人間のバイアスとの関係
番組で鋭い指摘として語られたのが、AIのバイアスと人間のバイアスの関係だった。かねりんは「人間が生み出したバイアスをAIが学習しているだけなのに、なんでAIのバイアスを許せなくて」と、AIだけが問題視されることへの違和感を口にし、しぶちょーも「確かにそうだ」と応じた。該当箇所を聴く
しぶちょーは、これに対して「なるべくクリーンな状態で情報を持ってこいよ機械野郎」と言ったところで、結局そのクリーンなものを「バイアスまみれの人間が裁くから結局バイアスにまみれる」と、人間が評価に関わる以上バイアスは抜けきらないという構造を語った。該当箇所を聴く
さらにしぶちょーは「常識とか一般みたいなものって平均でしかなくて」と述べ、何が「フラット」なのかという基準そのものが定義しづらいという論点も提示した。該当箇所を聴く かねりんは逆転の発想として「逆にAIにバイアスを指摘してほしいぐらいだよね、僕らの人間の」と、人間側の偏りをAIに照らし返してもらう可能性にも触れた。該当箇所を聴く
バイアスを抜くことの難しさと研究手法
しぶちょーは、AIのバイアスを「まず抜くことがなかなか難しい」と語り、これがこの回のタイトルにもなった核心だと示した。該当箇所を聴く その上で「完璧に抜く方法はないんだけど、研究としていろいろやられているのはある」と、研究レベルでの取り組みを紹介した。該当箇所を聴く
具体的な手法として、しぶちょーは言葉のベクトル空間の話を挙げ、「この単語の近くに男性いるよね」というように単語同士の距離がなんとなく分かるので、その距離感を手がかりに調整できると説明した。該当箇所を聴く また、面白い手法として、ある性別を含む文が出てきたら「その反対性別を入れ替えた版の彼女は医者だっていう言葉も生成して、対になるように」全部の言語を学習させるやり方があると紹介した。該当箇所を聴く
番組での結論
しぶちょーは、この回で言いたかったこととして、世間ではハルシネーション(ハルシネーション)ばかりが注目されがちだが、AIのバイアスも同じくらい問題で、しかも「人間も気がつけないから知らず知らずに」だんだん巻き込まれていくところに怖さがある、とまとめた。該当箇所を聴く
そしてしぶちょーは、AIのバイアスによって「差別が助長されたりする可能性があるから、やっぱすごくバイアスっていうのは問題視されている」と、なぜこれが重大なテーマなのかを述べた。該当箇所を聴く 最後に「なるべく除外していくし、使う側もそれを意識しないといけないよね」というのが今日の結論だと締めくくった。該当箇所を聴く
ここにも登場
出典エピソード
- 31e7fdc74e6b188722346d
各セクションの「該当箇所を聴く」リンクから、番組の発話そのものを確認できます。