日本語
 
Help Privacy Policy ポリシー/免責事項
  詳細検索ブラウズ

アイテム詳細

登録内容を編集ファイル形式で保存
 
 
ダウンロード電子メール
  Policy Gradient Methods

Peters, J., & Bagnell, J. (2010). Policy Gradient Methods. In C., Sammut, & G., Webb (Eds.), Encyclopedia of Machine Learning (pp. 774-776). Berlin, Germany: Springer.

Item is

基本情報

表示: 非表示:
資料種別: 書籍の一部

ファイル

表示: ファイル

作成者

表示:
非表示:
 作成者:
Peters, J1, 2, 著者           
Bagnell, JA, 著者
所属:
1Department Empirical Inference, Max Planck Institute for Biological Cybernetics, Max Planck Society, ou_1497795              
2Max Planck Institute for Biological Cybernetics, Max Planck Society, Spemannstrasse 38, 72076 Tübingen, DE, ou_1497794              

内容説明

表示:
非表示:
キーワード: -
 要旨: A policy gradient method is a reinforcement learning approach that directly optimizes a parametrized control policy by a variant of gradient descent. These methods belong to the class of policy search techniques that maximize the expected return of a policy in a fixed policy class, in contrast with traditional value function approximation approaches that derive policies from a value function. Policy gradient approaches have various advantages: they enable the straightforward incorporation of domain knowledge in policy parametrization and often an optimal policy is more compactly represented than the corresponding value function; many such methods guarantee to convergence to at least a locally optimal policy; the methods naturally handle continuous states and actions and often even imperfect state information. The counterveiling drawbacks include difficulties in off-policy settings, the potential for very slow convergence and high sample complexity, as well as identifying local optima that are not globally optimal.

資料詳細

表示:
非表示:
言語:
 日付: 2010-12
 出版の状態: 出版
 ページ: -
 出版情報: -
 目次: -
 査読: -
 識別子(DOI, ISBNなど): DOI: 10.1007/978-0-387-30164-8_640
BibTex参照ID: 6074
 学位: -

関連イベント

表示:

訴訟

表示:

Project information

表示:

出版物 1

表示:
非表示:
出版物名: Encyclopedia of Machine Learning
種別: 書籍
 著者・編者:
Sammut, C, 編集者
Webb, GI, 編集者
所属:
-
出版社, 出版地: Berlin, Germany : Springer
ページ: - 巻号: - 通巻号: - 開始・終了ページ: 774 - 776 識別子(ISBN, ISSN, DOIなど): ISBN: 978-0-387-30164-8