【IT】強化学習の壁「ビッグ・ベビー問題」に挑む新ベンチマーク
強化学習は、いわゆる「ビッグ・ベビー問題」に直面している。強化学習は、設定した目標を達成するために報酬と罰を用いる機械学習の手法の1つだ。だが、強化学習アルゴリズムの効果を測るためのベンチマーク・タスクとなっているアタリのビデオゲームやシミュレーション環境は自然界の複雑性を反映していない。
2ちゃんねるニュース速報+ナビ
強化学習は、いわゆる「ビッグ・ベビー問題」に直面している。強化学習は、設定した目標を達成するために報酬と罰を用いる機械学習の手法の1つだ。だが、強化学習アルゴリズムの効果を測るためのベンチマーク・タスクとなっているアタリのビデオゲームやシミュレーション環境は自然界の複雑性を反映していない。
このサイトは5ちゃんねる(旧2ちゃんねる)のニュース速報+系掲示板の書き込みを自動解析し、人気の高いニュース及び最新のニュースをリアルタイムで提供しています。
2NN現在閲覧者数 4924人/10min
「#さよなら俺たちの松ちゃん」松本人志 訴訟取り下げで見限るファン続出「もう無理」「メディアに出てほしくない」逆風吹き荒れ ★5
5ちゃんねる(旧2ちゃんねる)ニュース速報+系掲示板の情報をそれぞれ1分~10分間隔で自動取得・解析更新しています。
開発・運営:中島竜馬