【AI】OpenAIが人間を使わずAIの安全性を高める手法「Rule-Based Rewards(RBR)」を開発
OpenAIが人間を使わずAIの安全性を高める手法「Rule-Based Rewards(RBR)」を開発
ChatGPTやGPT-4などを開発するOpenAIが、言語モデルの安全性と有効性を高めるための新たなアプローチである「Rule-Based Rewards(RBR)」を開発しました。RBRは、AI自体を使用することで人間によるデータ収集を必要とせずに、AIを安全に動作させることができるとされています。