Google AI Studio
Google AI Studio文字起こし音声ファイルハルシネーションAIツール
Google AI Studioとは、おちつきAIラジオでは、かねりんが普段から音声の処理に使っているツールとして語られている対象である。ep.27「[12月23日:速報回]」では、長すぎる音声ファイルを扱おうとしたときの不具合と、文字起こしをめぐるAIの「自白」のエピソードとして紹介された。番組内では音声分離やSAM Audioといった音声処理の話題とあわせて触れられている。
番組での扱われ方
おちつきAIラジオのep.27では、いつも使っているこのツールが、長すぎる音声ファイルのときにバグる、という体験が語られた。発言では「長すぎる音声ファイルの時にいつも使ってるジェミニAIスタジオがバグるのよ」とされ、普段使いのツールではあるものの、入力する音声が長すぎる場合には不具合が出る、という形で扱われている。該当箇所を聴く
文字起こしをめぐるAIの「自白」
同じep.27では、文字起こしの結果がおかしかったため問い合わせたところ、AIが勝手に文脈を読んで作っていた、と自白した、というエピソードが語られた。番組では「なんでこれどうなってんだって聞いたら、いやすいませんと、なんか勝手に文脈を読んでAIが勝手に作りましたって自白して」と説明されており、Google AI Studioを使った文字起こしで、AIが実際の音声ではなく文脈から内容を作ってしまうことがある、という体験が共有されている。該当箇所を聴く
この語りでは、Google AI Studioは音声処理の現場で日常的に頼られている一方で、長尺の音声では挙動が崩れ、文字起こしの中身をAIが推測で埋めてしまう場合もある、という実用上の注意点とともに位置づけられている。
出典エピソード
- f6f2f5d65407bb62e43b26
各セクションの「該当箇所を聴く」リンクから、番組の発話そのものを確認できます。