日本語
 
Help Privacy Policy ポリシー/免責事項
  詳細検索ブラウズ

アイテム詳細

登録内容を編集ファイル形式で保存
 
 
ダウンロード電子メール
  Hierarchical Relative Entropy Policy Search

Daniel, C., Neumann, G., & Peters, J. (2012). Hierarchical Relative Entropy Policy Search. In N., Lawrence, & M., Girolami (Eds.), Artificial Intelligence and Statistics, 21-23 April 2012, La Palma, Canary Islands (pp. 273-281). Madison, WI, USA: International Machine Learning Society.

Item is

基本情報

表示: 非表示:
資料種別: 会議論文

ファイル

表示: ファイル

関連URL

表示:
非表示:
説明:
-
OA-Status:

作成者

表示:
非表示:
 作成者:
Daniel, C, 著者
Neumann, G, 著者
Peters, J1, 著者           
所属:
1Dept. Empirical Inference, Max Planck Institute for Intelligent Systems, Max Planck Society, ou_1497647              

内容説明

表示:
非表示:
キーワード: -
 要旨: Many real-world problems are inherently hi- erarchically structured. The use of this struc- ture in an agent's policy may well be the key to improved scalability and higher per- formance. However, such hierarchical struc- tures cannot be exploited by current policy search algorithms. We will concentrate on a basic, but highly relevant hierarchy - the 'mixed option' policy. Here, a gating network first decides which of the options to execute and, subsequently, the option-policy deter- mines the action. In this paper, we reformulate learning a hi- erarchical policy as a latent variable estima- tion problem and subsequently extend the Relative Entropy Policy Search (REPS) to the latent variable case. We show that our Hierarchical REPS can learn versatile solu- tions while also showing an increased perfor- mance in terms of learning speed and quality of the found policy in comparison to the non- hierarchical approach.

資料詳細

表示:
非表示:
言語:
 日付: 2012-04
 出版の状態: 出版
 ページ: -
 出版情報: -
 目次: -
 査読: -
 識別子(DOI, ISBNなど): BibTex参照ID: DanielNP2012
 学位: -

関連イベント

表示:
非表示:
イベント名: Fifteenth International Conference on Artificial Intelligence and Statistics (AI Statistics 2012)
開催地: La Palma, Canary Islands, Spain
開始日・終了日: 2012-04-21 - 2012-04-23

訴訟

表示:

Project information

表示:

出版物 1

表示:
非表示:
出版物名: Artificial Intelligence and Statistics, 21-23 April 2012, La Palma, Canary Islands
種別: 会議論文集
 著者・編者:
Lawrence, N, 編集者
Girolami, M, 編集者
所属:
-
出版社, 出版地: Madison, WI, USA : International Machine Learning Society
ページ: - 巻号: - 通巻号: - 開始・終了ページ: 273 - 281 識別子(ISBN, ISSN, DOIなど): -

出版物 2

表示:
非表示:
出版物名: JMLR Workshop and Conference Proceedings
種別: 連載記事
 著者・編者:
所属:
出版社, 出版地: -
ページ: - 巻号: 22 通巻号: - 開始・終了ページ: - 識別子(ISBN, ISSN, DOIなど): -