2016

titre
Improved and Generalized Upper Bounds on the Complexity of Policy Iteration
auteur
Bruno Scherrer
article
Mathematics of Operations Research, INFORMS, 2016, 〈10.1287/moor.2015.0753〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00829532/file/reportv2.pdf BibTex
titre
On the Use of Non-Stationary Strategies for Solving Two-Player Zero-Sum Markov Games
auteur
Julien Pérolat, Bilal Piot, Bruno Scherrer, Olivier Pietquin
article
19th International Conference on Artificial Intelligence and Statistics (AISTATS 2016), May 2016, Cadiz, Spain. Proceedings of the International Conference on Artificial Intelligences and Statistics. 〈http://www.aistats.org/〉
Accès au bibtex
BibTex
titre
Softened Approximate Policy Iteration for Markov Games
auteur
Julien Pérolat, Bilal Piot, Matthieu Geist, Bruno Scherrer, Olivier Pietquin
article
ICML 2016 - 33rd International Conference on Machine Learning, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01393328/file/nmz.pdf BibTex
titre
Contributions algorithmiques au contrôle optimal stochastique à temps discret et horizon infini
auteur
Bruno Scherrer
article
Optimisation et contrôle [math.OC]. Université de Lorraine (Nancy), 2016
Accès au texte intégral et bibtex
https://hal.inria.fr/tel-01400208/file/hdr_full.pdf BibTex

2015

titre
Approximate Modified Policy Iteration and its Application to the Game of Tetris
auteur
Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Boris Lesner, Matthieu Geist
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2015, 16, pp.1629−1676
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01091341/file/final.pdf BibTex
titre
On the Rate of Convergence and Error Bounds for LSTD(λ)
auteur
Manel Tagorti, Bruno Scherrer
article
ICML 2015, Jul 2015, Lille, France. 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01186667/file/lstd.pdf BibTex
titre
Recherche locale de politique dans un espace convexe
auteur
Bruno Scherrer, Matthieu Geist
article
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2015, 29 (6), pp.685-704. 〈10.3166/RIA.29.685-706〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01275247/file/ria_lps_hal_v2.pdf BibTex
titre
Approximate Dynamic Programming for Two-Player Zero-Sum Markov Games
auteur
Julien Perolat, Bruno Scherrer, Bilal Piot, Olivier Pietquin
article
International Conference on Machine Learning (ICML 2015), Jul 2015, Lille, France. 2015, 〈http://jmlr.org/proceedings/papers/v37/perolat15.pdf〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01153270/file/ICML_2015_JPBSBPOP.pdf BibTex
titre
Non-Stationary Approximate Modified Policy Iteration
auteur
Boris Lesner, Bruno Scherrer
article
ICML 2015, Jul 2015, Lille, France. 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01186664/file/icml2015.pdf https://hal.inria.fr/hal-01186664/file/api-vs-nsapi-avg-crop2.pdf https://hal.inria.fr/hal-01186664/file/api-vs-nsapi-avg-crop.pdf https://hal.inria.fr/hal-01186664/file/fixed_lm_err_std-crop.pdf BibTex

2014

titre
Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search
auteur
Bruno Scherrer, Matthieu Geist
article
ECML, Sep 2014, Nancy, France. pp.35 - 50, 2014, 〈10.1007/978-3-662-44845-8_3〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01091079/file/lps_guarantee_ecml14_final.pdf BibTex
titre
Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search
auteur
Bruno Scherrer, Matthieu Geist
article
ECMLPKDD 2014, Sep 2014, Nancy, France. Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, 8726, pp.35 - 50, 2014, Lecture Notes in Computer Science. 〈10.1007/978-3-662-44845-8_3〉
Accès au texte intégral et bibtex
https://hal-supelec.archives-ouvertes.fr/hal-01086345/file/supelec886.pdf BibTex
titre
Quand l'optimalité locale implique une garantie globale : recherche locale de politique dans un espace convexe et algorithme d'itération sur les politiques conservatif vu comme une montée de gradient fonctionnel
auteur
Bruno Scherrer, Matthieu Geist
article
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA'14), May 2014, Liège, Belgique. 2014
Accès au bibtex
BibTex
titre
Modified policy iteration algorithms are not strongly polynomial for discounted dynamic programming
auteur
Eugene A. Feinberg, Jefferson Huang, Bruno Scherrer
article
Operations Research Letters, Elsevier, 2014, 42, pp.429 - 431. 〈10.1016/j.orl.2014.07.006〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01091370/file/Feinberg_Huang_Scherrer.pdf BibTex
titre
Rate of Convergence and Error Bounds for LSTD($\lambda$)
auteur
Manel Tagorti, Bruno Scherrer
article
[Research Report] 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00990525/file/report.pdf BibTex
titre
Off-policy Learning with Eligibility Traces: A Survey
auteur
Matthieu Geist, Bruno Scherrer
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2014, 15 (1), pp.289-333
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00921275/file/jmlr.pdf BibTex
titre
Approximate Policy Iteration Schemes: A Comparison
auteur
Bruno Scherrer
article
ICML - 31st International Conference on Machine Learning - 2014, Jun 2014, Pékin, China. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00989982/file/icml2014.pdf BibTex
titre
Une étude comparative de quelques schémas d'approximation de type iterations sur les politiques
auteur
Bruno Scherrer
article
[Rapport de recherche] 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00989991/file/scherrer.pdf BibTex
titre
Vitesse de convergence et borne d'erreur pour l'algorithme LSTD($\lambda$)
auteur
Manel Tagorti, Bruno Scherrer
article
JFPDA - 9èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, May 2014, Liège, Belgique. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00990508/file/tagorti-manel.pdf BibTex

2013

titre
Approximate Dynamic Programming Finally Performs Well in the Game of Tetris
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Bruno Scherrer
article
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00921250/file/tetris.pdf BibTex
titre
Improved and Generalized Upper Bounds on the Complexity of Policy Iteration
auteur
Bruno Scherrer
article
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00921261/file/nips2013.pdf BibTex
titre
Performance Bounds for Lambda Policy Iteration and Application to the Game of Tetris
auteur
Bruno Scherrer
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2013, 14, pp.1175-1221
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00759102/file/article.pdf BibTex
titre
Off-policy Learning with Eligibility Traces: A Survey
auteur
Matthieu Geist, Bruno Scherrer
article
[Research Report] 2013, pp.43
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00644516/file/jmlr.pdf BibTex
titre
Tight Performance Bounds for Approximate Modified Policy Iteration with Non-Stationary Policies
auteur
Boris Lesner, Bruno Scherrer
article
2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00815996/file/report.pdf BibTex
titre
Quelques majorants de la complexité d'itérations sur les politiques
auteur
Bruno Scherrer
article
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00921287/file/scherrer-bruno.pdf BibTex
titre
Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini
auteur
Bruno Scherrer, Boris Lesner
article
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France. 2013
Accès au bibtex
BibTex
titre
La carotte et le bâton... et Tetris
auteur
Alain Dutech, Bruno Scherrer, Christophe Thiery
article
Images des Mathématiques, CNRS, 2013
Accès au bibtex
BibTex
titre
Policy Search: Any Local Optimum Enjoys a Global Performance Guarantee
auteur
Bruno Scherrer, Matthieu Geist
article
2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00829548/file/report.pdf BibTex
titre
Abstraction Pathologies In Markov Decision Processes
auteur
Manel Tagorti, Bruno Scherrer, Olivier Buffet, Joerg Hoffmann
article
8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2013, Lille, France. 2013, Actes des 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00907295/file/jfpda13-a.pdf BibTex
titre
Abstraction Pathologies In Markov Decision Processes
auteur
Manel Tagorti, Bruno Scherrer, Olivier Buffet, Joerg Hoffmann
article
ICAPS'13 workshop on Heuristics and Search for Domain-independent Planning (HSDIP), Jun 2013, Rome, Italy. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00907315/file/hsdip13.pdf BibTex
titre
On the Performance Bounds of some Policy Search Dynamic Programming Algorithms
auteur
Bruno Scherrer
article
2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00829559/file/report.pdf BibTex

2012

titre
Approximate Modified Policy Iteration
auteur
Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00697169/file/article.pdf BibTex
titre
Approximations de l'Algorithme Itérations sur les Politiques Modifié
auteur
Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist
article
Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p, 2012, 〈http://icml.cc/2012/papers/608.pdf〉
Accès au bibtex
BibTex
titre
Approximate Modified Policy Iteration
auteur
Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Matthieu Geist
article
29th International Conference on Machine Learning - ICML 2012, Jun 2012, Edinburgh, United Kingdom. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00758882/file/icml-short.pdf BibTex
titre
A Dantzig Selector Approach to Temporal Difference Learning
auteur
Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh
article
John Langford and Joelle Pineau. ICML-12, Jun 2012, Edinburgh, United Kingdom. Omnipress, pp.1399-1406, 2012
Accès au bibtex
BibTex
titre
On the Use of Non-Stationary Policies for Stationary Infinite-Horizon Markov Decision Processes
auteur
Bruno Scherrer, Boris Lesner
article
NIPS 2012 - Neural Information Processing Systems, Dec 2012, South Lake Tahoe, United States. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00758809/file/nips2012.pdf BibTex
titre
Un sélecteur de Dantzig pour l'apprentissage par différences temporelles
auteur
Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh
article
Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p, 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00736229/file/3.pdf BibTex
titre
On the Use of Non-Stationary Policies for Infinite-Horizon Discounted Markov Decision Processes
auteur
Bruno Scherrer
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00682172/file/nonstationary.pdf BibTex

2011

titre
Performance Bounds for Lambda Policy Iteration and Application to the Game of Tetris
auteur
Bruno Scherrer
article
[Research Report] RR-6348, 2011, pp.54
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00185271/file/article.pdf BibTex
titre
Classification-based Policy Iteration with a Critic
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Bruno Scherrer
article
International Conference on Machine Learning (ICML), Jun 2011, Seattle, United States. ACM, pp.1049-1056, 2011, Proceedings of the 28 th International Conference on Machine Learning
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00644935/file/dpi-critic.pdf BibTex
titre
l1-penalized projected Bellman residual
auteur
Matthieu Geist, Bruno Scherrer
article
European Wrokshop on Reinforcement Learning (EWRL 11), Sep 2011, Athens, Greece. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00644507/file/gs_ewrl_l1_cr.pdf BibTex
titre
Recursive Least-Squares Learning with Eligibility Traces
auteur
Bruno Scherrer, Matthieu Geist
article
European Wrokshop on Reinforcement Learning (EWRL 11), Sep 2011, Athens, Greece. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00644511/file/ewrl.pdf BibTex
titre
Moindres carrés récursifs pour l'évaluation off-policy d'une politique avec traces d'éligibilité
auteur
Bruno Scherrer, Matthieu Geist
article
6ème Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes - JFPDA 2011, Jun 2011, Rouen, France. 2011
Accès au bibtex
BibTex
titre
Classification-based Policy Iteration with a Critic
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Bruno Scherrer
article
2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00590972/file/dpi-critic-techReport.pdf BibTex

2010

titre
Partially Observable Markov Decision Processes
auteur
Alain Dutech, Bruno Scherrer
article
Olivier Sigaud and Olivier Buffet. Markov Decision Processes in Artificial Intelligence, ISTE Ltd and John Wiley & Sons Inc, 2010, inria-00439123
Accès au bibtex
BibTex
titre
Least-Squares λ Policy Iteration : optimisme et compromis biais-variance pour le contrôle optimal
auteur
Christophe Thiery, Bruno Scherrer
article
Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes, Jun 2010, Besançon, France. 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00520843/file/thiery-christophe.pdf BibTex
titre
Least-Squares λ Policy Iteration: Bias-Variance Trade-off in Control Problems
auteur
Christophe Thiery, Bruno Scherrer
article
International Conference on Machine Learning, Jun 2010, Haifa, Israel. 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00520841/file/article.pdf BibTex
titre
Should one compute the Temporal Difference fix point or minimize the Bellman Residual? The unified oblique projection view
auteur
Bruno Scherrer
article
27th International Conference on Machine Learning - ICML 2010, Jun 2010, Haïfa, Israel. 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00537403/file/article.pdf BibTex
titre
Performance bound for Approximate Optimistic Policy Iteration
auteur
Bruno Scherrer, Christophe Thiery
article
[Technical Report] 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00480952/file/opi_proof.pdf BibTex

2009

titre
Construction d'un joueur artificiel pour Tetris
auteur
Christophe Thiery, Bruno Scherrer
article
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2009, Modélisation et décision pour les jeux, 23 (2-3), pp.387-407. 〈http://ria.revuesonline.com/article.jsp?articleId=13195〉. 〈10.3166/ria.23.387-407〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00418922/file/article.pdf BibTex
titre
Improvements on Learning Tetris with Cross Entropy
auteur
Christophe Thiery, Bruno Scherrer
article
International Computer Games Association Journal, ICGA, 2009, 32
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00418930/file/article.pdf BibTex
titre
Building Controllers for Tetris
auteur
Christophe Thiery, Bruno Scherrer
article
International Computer Games Association Journal, ICGA, 2009, 32, pp.3-11
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00418954/file/article.pdf BibTex
titre
Une approche modifiée de Lambda-Policy Iteration
auteur
Christophe Thiery, Bruno Scherrer
article
Journées Francophones Planification Décision Apprentissage, Jun 2009, Paris, France. 2009, 〈http://webia.lip6.fr/~sigaud/thiery.pdf〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00418910/file/thiery-christophe.pdf BibTex

2008

titre
Analyse d'un algorithme d'intelligence en essaim pour le fourragement
auteur
Amine Boumaza, Bruno Scherrer
article
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2008, 22 (6), pp.791-816
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00172200/file/boumaza-2008.pdf BibTex
titre
Processus décisionnels de Markov partiellement observables
auteur
Alain Dutech, Bruno Scherrer
article
O. Sigaud and O. Buffet. Processus décisionnels de Markov en intelligence artificielle, 1 - principes généraux et applications, Lavoisier - Hermes Science Publications, pp.89-133, 2008, IC2 - informatique et systèmes d'information, 978-2746220577
Accès au bibtex
BibTex
titre
La carotte et le bâton... et Tetris
auteur
Alain Dutech, Bruno Scherrer, Christophe Thiery
article
Interstices, INRIA, 2008
Accès au bibtex
BibTex
titre
Error Reducing Sampling in Reinforcement Learning
auteur
Bruno Scherrer, Shie Mannor
article
NIPS-08 Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Whistler, Canada. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00337659/file/scherrer.pdf BibTex
titre
Biasing Approximate Dynamic Programming with a Lower Discount Factor
auteur
Marek Petrik, Bruno Scherrer
article
Twenty-Second Annual Conference on Neural Information Processing Systems -NIPS 2008, Dec 2008, Vancouver, Canada. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00337652/file/finaldiscount.pdf BibTex
titre
Embedded harmonic control for trajectory planning in large environments
auteur
Cesar Torres-Huitzil, Bernard Girau, Amine Boumaza, Bruno Scherrer
article
International Conference on ReConFigurable Computing and FPGAs - ReConFig 08, Dec 2008, Cancun, Mexico. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00337628/file/reconfig08.pdf BibTex
titre
Block-synchronous harmonic control for scalable trajectory planning
auteur
Bernard Girau, Amine Boumaza, Bruno Scherrer, Cesar Torres-Huitzil
article
Aleksandar Lazinica. Robotics, Automation and Control, I-Tech Publications, pp.85-110, 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00337634/file/itech08.pdf BibTex

2007

titre
Convergence and rate of convergence of a simple ant model
auteur
Amine Boumaza, Bruno Scherrer
article
[Research Report] 2007, pp.8
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00121341/file/article.pdf BibTex
titre
Convergence and rate of convergence of simple ant models
auteur
Amine Boumaza, Bruno Scherrer
article
2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00263536/file/article.pdf BibTex
titre
Optimal control subsumes harmonic control
auteur
Amine Boumaza, Bruno Scherrer
article
IEEE International Conference on Robotics and Automation - ICRA 07, Apr 2007, Rome, Italy. IEEE, pp.2841-2846, 2007, 2007 IEEE International Conference on Robotics and Automation, 10-14 April, 2007, Rome, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00170185/file/icra.pdf BibTex
titre
Convergence and Rate of Convergence of a Foraging Ant Model
auteur
Amine Boumaza, Bruno Scherrer
article
IEEE Congress on Evolutionary Computation - IEEE CEC 2007, Sep 2007, Singapour, Singapore. IEEE, 8 p., 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00170183/file/article.pdf BibTex
titre
Convergence and rate of convergence of a simple ant model
auteur
Amine Boumaza, Bruno Scherrer
article
International Conference on Autonomous Agents and Multiagent Systems - AAMAS'07, May 2007, Honolulu Hawaii, United States. pp.607-609, 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00170186/file/aamas.pdf BibTex

2006

titre
Une condition suffisante pour l'implémentation connexionniste asynchrone
auteur
Bruno Scherrer
article
1ère Conférence Francophone Neurosciences Computationnelles - NeuroComp, Oct 2006, Pont-à-Mousson, France. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00119230/file/neurocomp.pdf BibTex
titre
Optimal control subsumes harmonic control
auteur
Amine Boumaza, Bruno Scherrer
article
[Research Report] 2006, pp.8
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00119243/file/article.pdf BibTex
titre
Convergence et taux de convergence d'un algorithme fourmi simple
auteur
Amine Boumaza, Bruno Scherrer
article
[Research Report] 2006, pp.24
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00119238/file/article.pdf BibTex

2005

titre
Navigation, fonctions harmoniques et contrôle optimal stochastique
auteur
Amine Boumaza, Bruno Scherrer
article
Cinquièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA 2005, Jun 2005, Lille/France, 2005
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00000644/file/pdmia05.pdf BibTex
titre
Asynchronous Neurocomputing for optimal control and reinforcement learning with large state spaces
auteur
Bruno Scherrer
article
Neurocomputing, Elsevier, 2005, New Aspects in Neurocomputing: 11th European Symposium on Artificial Neural Networks., 23, pp.229-251
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00000722/file/neurocomputing2004.pdf BibTex

2004

titre
Error reducing sampling in reinforcement learning
auteur
Bruno Scherrer, Shie Mannor
article
[Research Report] 2004, pp.15
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00098352/file/papier.pdf BibTex
titre
Approche connexionniste du contrôle optimal
auteur
Bruno Scherrer
article
JEDAI - Journal électronique d'intelligence artificielle, AFIA, 2004, 4, 10 p
Accès au bibtex
BibTex

2003

titre
Apprentissage de représentation et auto-organisation modulaire pour un agent autonome
auteur
Bruno Scherrer
article
Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2003. Français
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00003377/file/tel-00003377.pdf BibTex
titre
Planning Cooperative Homogeneous Multiagent System Using Markov Decision Processes
auteur
Iadine Chadès, Bruno Scherrer, François Charpillet
article
5th International Conference on Enterprise Information Systems - ICEIS 2003, 2003, Angers, France, Kluwer, 2003
Accès au bibtex
BibTex
titre
Modular self-organization for a long-living autonomous agent
auteur
Bruno Scherrer
article
Eighteenth International Joint Conference on Artificial Intelligence - IJCAI'03, Aug 2003, Acapulco, Mexico, 2003
Accès au bibtex
BibTex
titre
Modular self-organization
auteur
Bruno Scherrer
article
[Research Report] 2003, pp.16
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00098315/file/article.pdf BibTex
titre
Modular self-organization for a long-living autonomous agent
auteur
Bruno Scherrer
article
[Intern report] A03-R-053 || scherrer03b, 2003, 7 p
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00107753/file/A03-R-053.pdf BibTex
titre
Parallel asynchronous distributed computations of optimal control in large state space Markov Decision Processes
auteur
Bruno Scherrer
article
11th European Symposium on Artificial Neural Networks - ESANN'03, Apr 2003, Bruges, Belgique, 6 p, 2003
Accès au bibtex
BibTex

2002

titre
A Heuristic Approach for Solving Decentralized-POMDP : Assessment on the Pursuit Problem
auteur
Iadine Chadès, Bruno Scherrer, François Charpillet
article
ACM Symposium on Applied Computing - SAC'2002, Mar 2002, Madrid, Spain, 6 p, 2002
Accès au bibtex
BibTex
titre
A connectionist architecture that adpats its representation to complex tasks
auteur
Bruno Scherrer
article
International Joint Conference on Neural Networks - IJCNN 2002, 2002, Hilton hawaiian Village, Honolulu, HI, 6 p, 2002
Accès au bibtex
BibTex
titre
Cooperative Co-learning: A Model-based Approach for Solving Multi Agent Reinforcement Problems
auteur
Bruno Scherrer, François Charpillet
article
14th IEEE International Conference on Tools with Artificial Intelligence - ICTAI 2002, 2002, Washington, USA, IEEE, 6 p, 2002
Accès au bibtex
BibTex
titre
Coevolutive Planning In Markov Decision Processes
auteur
Bruno Scherrer, François Charpillet
article
First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Palazzo Re Enzo, Bologna, Italy, 2 p, 2002
Accès au bibtex
BibTex

2001

titre
A Heuristic Approach for Solving Decentralized-POMDP: Assessment on the Pursuit Problem
auteur
Iadine Chadès, Bruno Scherrer, François Charpillet
article
[Intern report] A01-R-017 || chades01a, 2001, 6 p
Accès au bibtex
BibTex
titre
Auto-organisation modulaire d'une architecture intelligente
auteur
Bruno Scherrer
article
Valgo numéro 01-02, La revue en ligne de l'Association des Connexionnistes en THèse, Oct 2001, Montélimar, France, 8 p, 2001
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00099399/file/A01-R-260.pdf BibTex
titre
Learning to use contextual information for solving POMDP
auteur
Alain Dutech, Bruno Scherrer
article
European Workshop on Reinforcement Learning - EWRL-5, Oct 2001, Utrecht, The Netherlands, 2 p, 2001
Accès au bibtex
BibTex

2000

titre
Modélisation stochastique d'une population de neurones, méta-apprentissage dans un problème de classification
auteur
Bruno Scherrer, Frédéric Alexandre, François Charpillet, Stéphane Vialle
article
Neurosciences et sciences de l'ingénieur, 2000, Dinard, France, 4 p, 2000
Accès au bibtex
BibTex