tenjuu99(天重誠二)
@tenjuu99@hollo.tenjuu.net
これ興味深い内容だな。AIに価値判断をさせる。
https://x.com/ho4not/status/2028067383165043198
AnthropicはConstitutional AIという手法を採っています。これは簡単に言えば、「ルールの集合」ではなく「価値観」をAIに埋め込もうとするアプローチです。「これを言ってはいけない」というブラックリストではなく、「正直であること」「有害でないこと」「有益であること」を原則として、AIが自ら判断できるようにする。
これは、「編集」の機能をAIの内部に組み込もうとする試みに近いかもしれません。何を伝え、何を伝えないか。どこまで踏み込み、どこで止まるか。その判断を、アルゴリズムの自動最適化ではなく、何らかの「価値判断」に基づいて行う。