Deutsch
 
Hilfe Datenschutzhinweis Impressum
  DetailsucheBrowse

Datensatz

 
 
DownloadE-Mail
  Hierarchical Relative Entropy Policy Search

Daniel, C., Neumann, G., & Peters, J. (2012). Hierarchical Relative Entropy Policy Search. In N. Lawrence (Ed.), Proceedings of the 15th International Conference on Artificial Intelligence and Statistics (AISTATS) (pp. 273-281). Cambridge, MA, USA: Microtome Publ.

Item is

Externe Referenzen

einblenden:

Urheber

einblenden:
ausblenden:
 Urheber:
Daniel, C, Autor
Neumann, G, Autor
Peters, J1, Autor           
Affiliations:
1Dept. Empirical Inference, Max Planck Institute for Intelligent Systems, Max Planck Society, ou_1497647              

Inhalt

einblenden:
ausblenden:
Schlagwörter: Abt. Schölkopf
 Zusammenfassung: {Many real hierarchically structured. The use of this structure in an agent's policy may well be the key to improved scalability and higher performance. However, such hierarchical structures cannot be exploited by current policy search algorithms. We will concentrate on a basic, but highly relevant hierarchy - the `mixed option' policy. Here, a gating network first decides which of the options to execute and, subsequently, the option-policy determines the action. In this paper, we reformulate learning a hierarchical policy as a latent variable estimation problem and subsequently extend th Relative Entropy Policy Search (REPS) to the latent variable case. We show that our Hierarchical REPS can learn versatile solutions while also showing an increased performance in terms of learning speed and quality of the found policy in comparison to the nonhierarchical approach.}

Details

einblenden:
ausblenden:
Sprache(n):
 Datum: 2012-04
 Publikationsstatus: Erschienen
 Seiten: -
 Ort, Verlag, Ausgabe: -
 Inhaltsverzeichnis: -
 Art der Begutachtung: -
 Identifikatoren: BibTex Citekey: DanielNP2012
URN: http://jmlr.csail.mit.edu/proceedings/papers/v22/
 Art des Abschluß: -

Veranstaltung

einblenden:
ausblenden:
Titel: Fifteenth International Conference on Artificial Intelligence and Statistics (AISTATS 2012)
Veranstaltungsort: La Palma, Canary Islands, Spain
Start-/Enddatum: 2012-04-21 - 2012-04-23

Entscheidung

einblenden:

Projektinformation

einblenden:

Quelle 1

einblenden:
ausblenden:
Titel: Proceedings of the 15th International Conference on Artificial Intelligence and Statistics (AISTATS)
Genre der Quelle: Konferenzband
 Urheber:
Lawrence, N., Herausgeber
Girolami, M., Autor
Affiliations:
-
Ort, Verlag, Ausgabe: Cambridge, MA, USA : Microtome Publ.
Seiten: - Band / Heft: 22 Artikelnummer: - Start- / Endseite: 273 - 281 Identifikator: -

Quelle 2

einblenden:
ausblenden:
Titel: JMLR: Workshop and Conference Proceedings
  Kurztitel : JMLR: W&P
Genre der Quelle: Reihe
 Urheber:
Affiliations:
Ort, Verlag, Ausgabe: -
Seiten: - Band / Heft: 22 Artikelnummer: - Start- / Endseite: - Identifikator: -