Deutsch
 
Hilfe Datenschutzhinweis Impressum
  DetailsucheBrowse

Datensatz

DATENSATZ AKTIONENEXPORT
  A Non-Parametric Approach to Dynamic Programming

Kroemer, O., & Peters, J. (2012). A Non-Parametric Approach to Dynamic Programming. In Advances in Neural Information Processing Systems 24 (pp. 1719-1727). Red Hook, NY, USA: Curran.

Item is

Externe Referenzen

einblenden:

Urheber

einblenden:
ausblenden:
 Urheber:
Kroemer, O1, Autor           
Peters, J1, 2, Autor           
Shawe-Taylor, Herausgeber
J., Herausgeber
Zemel, R.S., Herausgeber
Bartlett, P., Herausgeber
Pereira, F., Herausgeber
Weinberger, K.Q., Herausgeber
Affiliations:
1Department Empirical Inference, Max Planck Institute for Biological Cybernetics, Max Planck Society, ou_1497795              
2Dept. Empirical Inference, Max Planck Institute for Intelligent Systems, Max Planck Society, ou_1497647              

Inhalt

einblenden:
ausblenden:
Schlagwörter: -
 Zusammenfassung: In this paper, we consider the problem of policy evaluation for continuousstate systems. We present a non-parametric approach to policy evaluation, which uses kernel density estimation to represent the system. The true form of the value function for this model can be determined, and can be computed using Galerkin’s method. Furthermore, we also present a unified view of several well-known policy evaluation methods. In particular, we show that the same Galerkin method can be used to derive Least-Squares Temporal Difference learning, Kernelized Temporal Difference learning, and a discrete-state Dynamic Programming solution, as well as our proposed method. In a numerical evaluation of these algorithms, the proposed approach performed better than the other methods.

Details

einblenden:
ausblenden:
Sprache(n):
 Datum: 2012-01
 Publikationsstatus: Erschienen
 Seiten: -
 Ort, Verlag, Ausgabe: -
 Inhaltsverzeichnis: -
 Art der Begutachtung: -
 Identifikatoren: ISBN: 978-1-618-39599-3
URI: http://nips.cc/Conferences/2011/
BibTex Citekey: KroemerP2011
 Art des Abschluß: -

Veranstaltung

einblenden:
ausblenden:
Titel: Twenty-Fifth Annual Conference on Neural Information Processing Systems (NIPS 2011)
Veranstaltungsort: Granada, Spain
Start-/Enddatum: -

Entscheidung

einblenden:

Projektinformation

einblenden:

Quelle 1

einblenden:
ausblenden:
Titel: Advances in Neural Information Processing Systems 24
Genre der Quelle: Konferenzband
 Urheber:
Affiliations:
Ort, Verlag, Ausgabe: Red Hook, NY, USA : Curran
Seiten: - Band / Heft: - Artikelnummer: - Start- / Endseite: 1719 - 1727 Identifikator: -