ガーベッジイン・ガーベッジアウト
AIデータ品質ノイズRAGLLM
おちつきAIラジオでは、ガーベッジイン・ガーベッジアウトは、AIに入れる情報の質が出力や成果に影響するという文脈で語られていた。ep.12「これ知らないと恥をかく!?AIの学習と参照の違い。今更聞けないRAGをやさしく解説」では、RAG(検索拡張生成)やLLMを扱ううえで、不要な情報やノイズを極力排除し、データをきれいにする必要があるという説明の中で登場した。
番組での説明
この回では、「AIの世界ってガーベッジイン・ガーベッジアウトって、AIだけじゃないんだけどそういう言葉があって」と前置きしたうえで、「ゴミ入れたらゴミ出てくる」と説明されていた。つまり、雑にデータを入れたり、不要な情報・無駄な情報・ノイズになる情報を含めたりすると、成果が悪くなるという原則として扱われていた。該当箇所を聴く
AI活用における含意
おちつきAIラジオでは、この原則はAIに限らない言葉だとしつつ、AIの文脈では特に「いらない情報を入れればよい」というものではなく、ノイズになる情報は極力排除して、きれいにしてあげる必要がある、という方向で語られていた。該当箇所を聴く
出典エピソード
- bd5151aff453c8ecfed943
各セクションの「該当箇所を聴く」リンクから、番組の発話そのものを確認できます。