Publications HAL de bruno,scherrer

2023

titre
Sodium Oxybate for Alcohol Dependence: A Network Meta-Regression Analysis Considering Population Severity at Baseline and Treatment Duration
auteur
Julien Guiraud, Giovanni Addolorato, Henri Jean Aubin, Sylvie Bachelot, Philippe Batel, Andrea de Bejczy, Amine Benyamina, Fabio Caputo, Monique Couderc, Maurice Dematteis, A. E. Goudriaan, Antoni Gual, Sylvie Lecoustey, Otto Michael Lesch, Icro Maremmani, David John Nutt, Francçois M. Paille, Pascal Perney, Jurgen T. Rehm, Benjamin Rolland, Bruno Scherrer, Nicolas Simon, Bo Söderpalm, Lorenzo Somaini, Wolfgang H. Sommer, Rainer Spanagel, Henriette Walter, Wim V. van den Brink
article
Alcohol and Alcoholism, 2023, 58 (2), pp.125-133. ⟨10.1093/alcalc/agac070⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04068585/file/agac070.pdf BibTex

2022

titre
Sodium oxybate for the maintenance of abstinence in alcohol-dependent patients: An international, multicenter, randomized, double-blind, placebo-controlled trial
auteur
Julien Guiraud, Giovanni Addolorato, Mariangela Antonelli, Henri-Jean Aubin, Andrea de Bejczy, Amine Benyamina, Roberto Cacciaglia, Fabio Caputo, Maurice Dematteis, Anna Ferrulli, Anna E Goudriaan, Antoni Gual, Otto-Michael Lesch, Icro Maremmani, Antonio Mirijello, David J Nutt, François Paille, Pascal Perney, Roch Poulnais, Quentin Raffaillac, Jürgen Rehm, Benjamin Rolland, Claudia Rotondo, Bruno Scherrer, Nicolas Simon, Katrin Skala, Bo Söderpalm, Lorenzo Somaini, Wolfgang H Sommer, Rainer Spanagel, Gabriele A Vassallo, Henriette Walter, Wim van den Brink
article
Journal of Psychopharmacology, 2022, 36 (10), pp.1136-1145. ⟨10.1177/02698811221104063⟩
Accès au texte intégral et bibtex
https://inserm.hal.science/inserm-04057658/file/02698811221104063.pdf BibTex

2021

titre
Baseline severity and the prediction of placebo response in clinical trials for alcohol dependence: A meta‐regression analysis to develop an enrichment strategy
auteur
Bruno Scherrer, Julien Guiraud, Giovanni Addolorato, Henri-Jean Aubin, Andrea de Bejczy, Amine Benyamina, Wim van den Brink, Fabio Caputo, Maurice Dematteis, Anna E Goudriaan, Antoni Gual, Falk Kiefer, Lorenzo Leggio, Otto-Michael Lesch, Icro Maremmani, David Nutt, François Paille, Pascal Perney, Roch Poulnais, Quentin Raffaillac, Jürgen Rehm, Benjamin Rolland, Nicolas Simon, Bo Söderpalm, Wolfgang Sommer, Henriette Walter, Rainer Spanagel
article
Alcoholism: Clinical and Experimental Research, 2021, 45 (9), pp.1722-1734. ⟨10.1111/acer.14670⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03629845/file/Alcohol%20Clin%20%20%20Exp%20Res%20-%202021%20-%20Scherrer%20-%20Baseline%20severity%20and%20the%20prediction%20of%20placebo%20response%20in%20clinical%20trials%20for.pdf BibTex

2020

titre
Leverage the Average: an Analysis of KL Regularization in Reinforcement Learning
auteur
Nino Vieillard, Tadashi Kozuno, Bruno Scherrer, Olivier Pietquin, Rémi Munos, Matthieu Geist
article
NeurIPS - 34th Conference on Neural Information Processing Systems, Dec 2020, Vancouver / Online, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03137351/file/NeurIPS-2020-leverage-the-average-an-analysis-of-kl-regularization-in-reinforcement-learning-Supplemental.pdf BibTex
titre
Simulations de carrières et retraites à points dans 3 cadres macro-économiques: modèle du gouvernement Philippe (âge-pivot bloqué), modèle du gouvernement Philippe corrigé (âge-pivot glissant), modèle Destinie2 (avec revalorisation de la fonction publique)
auteur
Bruno Scherrer
article
[Rapport de recherche] INRIA. 2020
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03137362/file/book2.pdf BibTex
titre
Momentum in Reinforcement Learning
auteur
Nino Vieillard, Bruno Scherrer, Olivier Pietquin, Matthieu Geist
article
AISTATS 2020 - 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo / Virtual, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03137343/file/vieillard20a-supp.pdf BibTex

2019

titre
How to Combine Tree-Search Methods in Reinforcement Learning
auteur
Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor
article
AAAI 19 - Thirty-Third AAAI Conference on Artificial Intelligence, Jan 2019, Honolulu, Hawai, United States
Accès au bibtex
https://arxiv.org/pdf/1809.01843 BibTex
titre
Stability guarantees for nonlinear discrete-time systems controlled by approximate value iteration
auteur
Romain Postoyan, Mathieu Granzotto, Lucian Buşoniu, Bruno Scherrer, Dragan Nešić, Jamal Daafouz
article
58th IEEE Conference on Decision and Control, CDC 2019, Dec 2019, Nice, France
Accès au texte intégral et bibtex
https://hal.science/hal-02271268/file/03-cdc-avi-long%20-%20bis.pdf BibTex
titre
A Theory of Regularized Markov Decision Processes
auteur
Matthieu Geist, Bruno Scherrer, Olivier Pietquin
article
ICML 2019 - Thirty-sixth International Conference on Machine Learning, Jun 2019, Long Island, United States
Accès au bibtex
https://arxiv.org/pdf/1901.11275 BibTex

2018

titre
Multiple-step greedy policies in online and approximate reinforcement learning
auteur
Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor
article
NeurIPS 2018 - Thirty-second Conference on Neural Information Processing Systems, Dec 2018, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01927962/file/approximate_online_cr_final.pdf BibTex
titre
Convergence of Online and Approximate Multiple-Step Lookahead Policy Iteration
auteur
Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor
article
EWRL 2018 - 14th European workshop on Reinforcement Learning, Oct 2018, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01927977/file/ewrl_approx_cr_final.pdf BibTex
titre
Beyond the one-step greedy approach in reinforcement learning
auteur
Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor
article
ICML 2018 - 35th International Conference on Machine Learning, Jul 2018, Stockholm, Sweden
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01927939/file/beyond_final_camera_ready.pdf BibTex
titre
Anderson acceleration for reinforcement learning
auteur
Matthieu Geist, Bruno Scherrer
article
EWRL 2018 - 4th European workshop on Reinforcement Learning, Oct 2018, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01928142/file/ewrl_14_2018_paper_1.pdf BibTex

2017

titre
Aprotinin vs. tranexamic acid in isolated coronary artery bypass surgery
auteur
Elsa Deloge, Julien Amour, Sophie Provenchère, Bertrand Rozec, Bruno Scherrer, Alexandre Ouattara
article
European Journal of Anaesthesiology, 2017, 34 (5), pp.280-287. ⟨10.1097/EJA.0000000000000604⟩
Accès au bibtex
BibTex

2016

titre
Softened approximate policy iteration for Markov games
auteur
Julien Pérolat, Bilal Piot, Matthieu Geist, Bruno Scherrer, Olivier Pietquin
article
ICML 2016 - 33rd International Conference on Machine Learning, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01393328/file/nmz.pdf BibTex
titre
Improved and generalized upper bounds on the complexity of policy iteration
auteur
Bruno Scherrer
article
Mathematics of Operations Research, 2016, 41 (3), pp.758-774. ⟨10.1287/moor.2015.0753⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00829532/file/reportv2.pdf BibTex
titre
On the Use of Non-Stationary Strategies for Solving Two-Player Zero-Sum Markov Games
auteur
Julien Pérolat, Bilal Piot, Bruno Scherrer, Olivier Pietquin
article
19th International Conference on Artificial Intelligence and Statistics (AISTATS 2016), May 2016, Cadiz, Spain
Accès au bibtex
BibTex
titre
Contributions algorithmiques au contrôle optimal stochastique à temps discret et horizon infini
auteur
Bruno Scherrer
article
Optimisation et contrôle [math.OC]. Université de Lorraine (Nancy), 2016
Accès au texte intégral et bibtex
https://inria.hal.science/tel-01400208/file/hdr_full.pdf BibTex

2015

titre
Analysing time to event data in dementia prevention trials: The example of the guidage study of EGB761®
auteur
Bruno Scherrer, S. Andrieu, P. Ousset, G. Berrut, J. Dartigues, B. Dubois, F. Pasquier, F. Piette, P. Robert, Jacques Touchon, P. Garnier, H. Mathiex-Fortunet, B. Vellas
article
Journal of Nutrition, Health & Aging, 2015, pp.1009-11. ⟨10.1007/s12603-015-0582-0⟩
Accès au bibtex
BibTex
titre
Recherche locale de politique dans un espace convexe
auteur
Bruno Scherrer, Matthieu Geist
article
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2015, 29 (6), pp.685-704. ⟨10.3166/RIA.29.685-706⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01275247/file/ria_lps_hal_v2.pdf BibTex
titre
Approximate modified policy iteration and its application to the game of Tetris
auteur
Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Boris Lesner, Matthieu Geist
article
Journal of Machine Learning Research, 2015, 16, pp.1629−1676
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01091341/file/final.pdf BibTex
titre
Approximate dynamic programming for two-player zero-sum Markov games
auteur
Julien Perolat, Bruno Scherrer, Bilal Piot, Olivier Pietquin
article
International Conference on Machine Learning (ICML 2015), Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01153270/file/ICML_2015_JPBSBPOP.pdf BibTex
titre
On the rate of convergence and error bounds for LSTD(λ)
auteur
Manel Tagorti, Bruno Scherrer
article
ICML 2015, Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01186667/file/lstd.pdf BibTex
titre
Non-stationary approximate modified policy iteration
auteur
Boris Lesner, Bruno Scherrer
article
ICML 2015, Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01186664/file/icml2015.pdf https://inria.hal.science/hal-01186664/file/api-vs-nsapi-avg-crop.pdf https://inria.hal.science/hal-01186664/file/api-vs-nsapi-avg-crop2.pdf https://inria.hal.science/hal-01186664/file/fixed_lm_err_std-crop.pdf BibTex

2014

titre
Vitesse de convergence et borne d'erreur pour l'algorithme LSTD($\lambda$)
auteur
Manel Tagorti, Bruno Scherrer
article
JFPDA - 9èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, May 2014, Liège, Belgique
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00990508/file/tagorti-manel.pdf BibTex
titre
Modified policy iteration algorithms are not strongly polynomial for discounted dynamic programming
auteur
Eugene A. Feinberg, Jefferson Huang, Bruno Scherrer
article
Operations Research Letters, 2014, 42, pp.429 - 431. ⟨10.1016/j.orl.2014.07.006⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01091370/file/Feinberg_Huang_Scherrer.pdf BibTex
titre
Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search
auteur
Bruno Scherrer, Matthieu Geist
article
ECMLPKDD 2014, Sep 2014, Nancy, France. pp.35 - 50, ⟨10.1007/978-3-662-44845-8_3⟩
Accès au texte intégral et bibtex
https://centralesupelec.hal.science/hal-01086345/file/supelec886.pdf BibTex
titre
Off-policy Learning with Eligibility Traces: A Survey
auteur
Matthieu Geist, Bruno Scherrer
article
Journal of Machine Learning Research, 2014, 15 (1), pp.289-333
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00921275/file/jmlr.pdf BibTex
titre
Rate of Convergence and Error Bounds for LSTD($\lambda$)
auteur
Manel Tagorti, Bruno Scherrer
article
[Research Report] 2014
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00990525/file/report.pdf BibTex
titre
Approximate Policy Iteration Schemes: A Comparison
auteur
Bruno Scherrer
article
ICML - 31st International Conference on Machine Learning - 2014, Jun 2014, Pékin, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00989982/file/icml2014.pdf BibTex
titre
Guide pratique pour la conception de systèmes de culture légumiers économes en produits phytopharmaceutiques
auteur
Marine Launais, Ludovic Bzdrenga, Vianney Estorgues, Vincent V. Faloya, Benoit B. Jeannequin, Sylvain Lheureux, Laurent Nivet, Bruno Scherrer, Nicolas Sinoir, Sophie Szilvasi, Catherine Taussig, Anne Terrentroy, Yannie Trottin-Caudal, François Villeneuve
article
178 p., 2014
Accès au bibtex
BibTex
titre
Une étude comparative de quelques schémas d'approximation de type iterations sur les politiques
auteur
Bruno Scherrer
article
[Rapport de recherche] 2014
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00989991/file/scherrer.pdf BibTex
titre
Quand l'optimalité locale implique une garantie globale : recherche locale de politique dans un espace convexe et algorithme d'itération sur les politiques conservatif vu comme une montée de gradient fonctionnel
auteur
Bruno Scherrer, Matthieu Geist
article
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA'14), May 2014, Liège, Belgique
Accès au bibtex
BibTex
titre
Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search
auteur
Bruno Scherrer, Matthieu Geist
article
ECML, Sep 2014, Nancy, France. pp.35 - 50, ⟨10.1007/978-3-662-44845-8_3⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01091079/file/lps_guarantee_ecml14_final.pdf BibTex

2013

titre
Improved and Generalized Upper Bounds on the Complexity of Policy Iteration
auteur
Bruno Scherrer
article
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00921261/file/nips2013.pdf BibTex
titre
Policy Search: Any Local Optimum Enjoys a Global Performance Guarantee
auteur
Bruno Scherrer, Matthieu Geist
article
2013
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00829548/file/report.pdf BibTex
titre
Off-policy Learning with Eligibility Traces: A Survey
auteur
Matthieu Geist, Bruno Scherrer
article
[Research Report] 2013, pp.43
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00644516/file/jmlr.pdf BibTex
titre
Approximate Dynamic Programming Finally Performs Well in the Game of Tetris
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Bruno Scherrer
article
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00921250/file/tetris.pdf BibTex
titre
Abstraction Pathologies In Markov Decision Processes
auteur
Manel Tagorti, Bruno Scherrer, Olivier Buffet, Joerg Hoffmann
article
8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2013, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00907295/file/jfpda13-a.pdf BibTex
titre
Performance Bounds for Lambda Policy Iteration and Application to the Game of Tetris
auteur
Bruno Scherrer
article
Journal of Machine Learning Research, 2013, 14, pp.1175-1221
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00759102/file/article.pdf BibTex
titre
Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini
auteur
Bruno Scherrer, Boris Lesner
article
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France
Accès au bibtex
BibTex
titre
Abstraction Pathologies In Markov Decision Processes
auteur
Manel Tagorti, Bruno Scherrer, Olivier Buffet, Joerg Hoffmann
article
ICAPS'13 workshop on Heuristics and Search for Domain-independent Planning (HSDIP), Jun 2013, Rome, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00907315/file/hsdip13.pdf BibTex
titre
Tight Performance Bounds for Approximate Modified Policy Iteration with Non-Stationary Policies
auteur
Boris Lesner, Bruno Scherrer
article
2013
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00815996/file/report.pdf BibTex
titre
Quelques majorants de la complexité d'itérations sur les politiques
auteur
Bruno Scherrer
article
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00921287/file/scherrer-bruno.pdf BibTex
titre
On the Performance Bounds of some Policy Search Dynamic Programming Algorithms
auteur
Bruno Scherrer
article
2013
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00829559/file/report.pdf BibTex
titre
La carotte et le bâton... et Tetris
auteur
Alain Dutech, Bruno Scherrer, Christophe Thiery
article
Images des Mathématiques, 2013
Accès au bibtex
BibTex

2012

titre
On the Use of Non-Stationary Policies for Stationary Infinite-Horizon Markov Decision Processes
auteur
Bruno Scherrer, Boris Lesner
article
NIPS 2012 - Neural Information Processing Systems, Dec 2012, South Lake Tahoe, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00758809/file/nips2012.pdf BibTex
titre
Approximations de l'Algorithme Itérations sur les Politiques Modifié
auteur
Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist
article
Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p
Accès au bibtex
BibTex
titre
On the Use of Non-Stationary Policies for Infinite-Horizon Discounted Markov Decision Processes
auteur
Bruno Scherrer
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00682172/file/nonstationary.pdf BibTex
titre
Approximate Modified Policy Iteration
auteur
Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00697169/file/article.pdf BibTex
titre
A Dantzig Selector Approach to Temporal Difference Learning
auteur
Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh
article
ICML-12, Jun 2012, Edinburgh, United Kingdom. pp.1399-1406
Accès au bibtex
BibTex
titre
Approximate Modified Policy Iteration
auteur
Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Matthieu Geist
article
29th International Conference on Machine Learning - ICML 2012, Jun 2012, Edinburgh, United Kingdom
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00758882/file/icml-short.pdf BibTex
titre
Un sélecteur de Dantzig pour l'apprentissage par différences temporelles
auteur
Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh
article
Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00736229/file/3.pdf BibTex

2011

titre
Moindres carrés récursifs pour l'évaluation off-policy d'une politique avec traces d'éligibilité
auteur
Bruno Scherrer, Matthieu Geist
article
6ème Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes - JFPDA 2011, Jun 2011, Rouen, France
Accès au bibtex
BibTex
titre
Classification-based Policy Iteration with a Critic
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Bruno Scherrer
article
International Conference on Machine Learning (ICML), Jun 2011, Seattle, United States. pp.1049-1056
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00644935/file/dpi-critic.pdf BibTex
titre
Performance Bounds for Lambda Policy Iteration and Application to the Game of Tetris
auteur
Bruno Scherrer
article
[Research Report] Inria. 2011, pp.54
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00185271/file/article.pdf BibTex
titre
Classification-based Policy Iteration with a Critic
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Bruno Scherrer
article
2011
Accès au texte intégral et bibtex
https://hal.science/hal-00590972/file/dpi-critic-techReport.pdf BibTex
titre
l1-penalized projected Bellman residual
auteur
Matthieu Geist, Bruno Scherrer
article
European Wrokshop on Reinforcement Learning (EWRL 11), Sep 2011, Athens, Greece
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00644507/file/gs_ewrl_l1_cr.pdf BibTex
titre
Recursive Least-Squares Learning with Eligibility Traces
auteur
Bruno Scherrer, Matthieu Geist
article
European Wrokshop on Reinforcement Learning (EWRL 11), Sep 2011, Athens, Greece
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00644511/file/ewrl.pdf BibTex

2010

titre
Least-Squares λ Policy Iteration : optimisme et compromis biais-variance pour le contrôle optimal
auteur
Christophe Thiery, Bruno Scherrer
article
Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes, Jun 2010, Besançon, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00520843/file/thiery-christophe.pdf BibTex
titre
Performance bound for Approximate Optimistic Policy Iteration
auteur
Bruno Scherrer, Christophe Thiery
article
[Technical Report] 2010
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00480952/file/opi_proof.pdf BibTex
titre
Partially Observable Markov Decision Processes
auteur
Alain Dutech, Bruno Scherrer
article
Olivier Sigaud and Olivier Buffet. Markov Decision Processes in Artificial Intelligence, ISTE Ltd and John Wiley & Sons Inc, 2010, inria-00439123
Accès au bibtex
BibTex
titre
Should one compute the Temporal Difference fix point or minimize the Bellman Residual? The unified oblique projection view
auteur
Bruno Scherrer
article
27th International Conference on Machine Learning - ICML 2010, Jun 2010, Haïfa, Israel
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00537403/file/article.pdf BibTex
titre
Least-Squares λ Policy Iteration: Bias-Variance Trade-off in Control Problems
auteur
Christophe Thiery, Bruno Scherrer
article
International Conference on Machine Learning, Jun 2010, Haifa, Israel
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00520841/file/article.pdf BibTex

2009

titre
Improvements on Learning Tetris with Cross Entropy
auteur
Christophe Thiery, Bruno Scherrer
article
International Computer Games Association Journal, 2009, 32
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00418930/file/article.pdf BibTex
titre
Une approche modifiée de Lambda-Policy Iteration
auteur
Christophe Thiery, Bruno Scherrer
article
Journées Francophones Planification Décision Apprentissage, UPMC-Paris 6, Jun 2009, Paris, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00418910/file/thiery-christophe.pdf BibTex
titre
Construction d'un joueur artificiel pour Tetris
auteur
Christophe Thiery, Bruno Scherrer
article
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2009, Modélisation et décision pour les jeux, 23 (2-3), pp.387-407. ⟨10.3166/ria.23.387-407⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00418922/file/article.pdf BibTex
titre
Building Controllers for Tetris
auteur
Christophe Thiery, Bruno Scherrer
article
International Computer Games Association Journal, 2009, 32, pp.3-11
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00418954/file/article.pdf BibTex

2008

titre
Embedded harmonic control for trajectory planning in large environments
auteur
Cesar Torres-Huitzil, Bernard Girau, Amine Boumaza, Bruno Scherrer
article
International Conference on ReConFigurable Computing and FPGAs - ReConFig 08, Dec 2008, Cancun, Mexico
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00337628/file/reconfig08.pdf BibTex
titre
Error Reducing Sampling in Reinforcement Learning
auteur
Bruno Scherrer, Shie Mannor
article
NIPS-08 Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Whistler, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00337659/file/scherrer.pdf BibTex
titre
Biasing Approximate Dynamic Programming with a Lower Discount Factor
auteur
Marek Petrik, Bruno Scherrer
article
Twenty-Second Annual Conference on Neural Information Processing Systems -NIPS 2008, Dec 2008, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00337652/file/finaldiscount.pdf BibTex
titre
Processus décisionnels de Markov partiellement observables
auteur
Alain Dutech, Bruno Scherrer
article
O. Sigaud and O. Buffet. Processus décisionnels de Markov en intelligence artificielle, 1 - principes généraux et applications, Lavoisier - Hermes Science Publications, pp.89-133, 2008, IC2 - informatique et systèmes d'information, 978-2746220577
Accès au bibtex
BibTex
titre
Analyse d'un algorithme d'intelligence en essaim pour le fourragement
auteur
Amine Boumaza, Bruno Scherrer
article
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2008, 22 (6), pp.791-816
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00172200/file/boumaza-2008.pdf BibTex
titre
Block-synchronous harmonic control for scalable trajectory planning
auteur
Bernard Girau, Amine Boumaza, Bruno Scherrer, Cesar Torres-Huitzil
article
Aleksandar Lazinica. Robotics, Automation and Control, I-Tech Publications, pp.85-110, 2008
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00337634/file/itech08.pdf BibTex

2007

titre
Convergence and rate of convergence of simple ant models
auteur
Amine Boumaza, Bruno Scherrer
article
2007
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00263536/file/article.pdf BibTex
titre
Convergence and rate of convergence of a simple ant model
auteur
Amine Boumaza, Bruno Scherrer
article
International Conference on Autonomous Agents and Multiagent Systems - AAMAS'07, May 2007, Honolulu Hawaii, United States. pp.607-609
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00170186/file/aamas.pdf BibTex
titre
Convergence and Rate of Convergence of a Foraging Ant Model
auteur
Amine Boumaza, Bruno Scherrer
article
IEEE Congress on Evolutionary Computation - IEEE CEC 2007, Sep 2007, Singapour, Singapore. 8 p
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00170183/file/article.pdf BibTex
titre
Convergence and rate of convergence of a simple ant model
auteur
Amine Boumaza, Bruno Scherrer
article
[Research Report] 2007, pp.8
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00121341/file/article.pdf BibTex
titre
Optimal control subsumes harmonic control
auteur
Amine Boumaza, Bruno Scherrer
article
IEEE International Conference on Robotics and Automation - ICRA 07, Apr 2007, Rome, Italy. pp.2841-2846
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00170185/file/icra.pdf BibTex

2006

titre
Convergence et taux de convergence d'un algorithme fourmi simple
auteur
Amine Boumaza, Bruno Scherrer
article
[Research Report] 2006, pp.24
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00119238/file/article.pdf BibTex
titre
Une condition suffisante pour l'implémentation connexionniste asynchrone
auteur
Bruno Scherrer
article
1ère Conférence Francophone Neurosciences Computationnelles - NeuroComp, Oct 2006, Pont-à-Mousson, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00119230/file/neurocomp.pdf BibTex
titre
Optimal control subsumes harmonic control
auteur
Amine Boumaza, Bruno Scherrer
article
[Research Report] 2006, pp.8
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00119243/file/article.pdf BibTex

2005

titre
Asynchronous Neurocomputing for optimal control and reinforcement learning with large state spaces
auteur
Bruno Scherrer
article
Neurocomputing, 2005, New Aspects in Neurocomputing: 11th European Symposium on Artificial Neural Networks., 23, pp.229-251
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00000722/file/neurocomputing2004.pdf BibTex
titre
Navigation, fonctions harmoniques et contrôle optimal stochastique
auteur
Amine Boumaza, Bruno Scherrer
article
Cinquièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA 2005, Jun 2005, Lille/France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00000644/file/pdmia05.pdf BibTex

2004

titre
Error reducing sampling in reinforcement learning
auteur
Bruno Scherrer, Shie Mannor
article
[Research Report] 2004, pp.15
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00098352/file/papier.pdf BibTex
titre
Approche connexionniste du contrôle optimal
auteur
Bruno Scherrer
article
JEDAI - Journal électronique d'intelligence artificielle, 2004, 4, 10 p
Accès au bibtex
BibTex

2003

titre
Modular self-organization for a long-living autonomous agent
auteur
Bruno Scherrer
article
[Intern report] A03-R-053 || scherrer03b, 2003, 7 p
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00107753/file/A03-R-053.pdf BibTex
titre
Modular self-organization for a long-living autonomous agent
auteur
Bruno Scherrer
article
Eighteenth International Joint Conference on Artificial Intelligence - IJCAI'03, Aug 2003, Acapulco, Mexico
Accès au bibtex
BibTex
titre
Planning Cooperative Homogeneous Multiagent System Using Markov Decision Processes
auteur
Iadine Chadès, Bruno Scherrer, François Charpillet
article
5th International Conference on Enterprise Information Systems - ICEIS 2003, 2003, Angers, France
Accès au bibtex
BibTex
titre
Apprentissage de représentation et auto-organisation modulaire pour un agent autonome
auteur
Bruno Scherrer
article
Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2003. Français. ⟨NNT : 2003NAN10018⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00003377/file/tel-00003377.pdf BibTex
titre
Modular self-organization
auteur
Bruno Scherrer
article
[Research Report] 2003, pp.16
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00098315/file/article.pdf BibTex
titre
Parallel asynchronous distributed computations of optimal control in large state space Markov Decision Processes
auteur
Bruno Scherrer
article
11th European Symposium on Artificial Neural Networks - ESANN'03, Apr 2003, Bruges, Belgique, 6 p
Accès au bibtex
BibTex

2002

titre
Coevolutive Planning In Markov Decision Processes
auteur
Bruno Scherrer, François Charpillet
article
First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Palazzo Re Enzo, Bologna, Italy, 2 p
Accès au bibtex
BibTex
titre
A Heuristic Approach for Solving Decentralized-POMDP : Assessment on the Pursuit Problem
auteur
Iadine Chadès, Bruno Scherrer, François Charpillet
article
ACM Symposium on Applied Computing - SAC'2002, Mar 2002, Madrid, Spain, 6 p
Accès au bibtex
BibTex
titre
Cooperative Co-learning: A Model-based Approach for Solving Multi Agent Reinforcement Problems
auteur
Bruno Scherrer, François Charpillet
article
14th IEEE International Conference on Tools with Artificial Intelligence - ICTAI 2002, 2002, Washington, USA, 6 p
Accès au bibtex
BibTex
titre
A connectionist architecture that adpats its representation to complex tasks
auteur
Bruno Scherrer
article
International Joint Conference on Neural Networks - IJCNN 2002, 2002, Hilton hawaiian Village, Honolulu, HI, 6 p
Accès au bibtex
BibTex

2001

titre
Learning to use contextual information for solving POMDP
auteur
Alain Dutech, Bruno Scherrer
article
European Workshop on Reinforcement Learning - EWRL-5, Oct 2001, Utrecht, The Netherlands, 2 p
Accès au bibtex
BibTex
titre
A Heuristic Approach for Solving Decentralized-POMDP: Assessment on the Pursuit Problem
auteur
Iadine Chadès, Bruno Scherrer, François Charpillet
article
[Intern report] A01-R-017 || chades01a, 2001, 6 p
Accès au bibtex
BibTex
titre
Auto-organisation modulaire d'une architecture intelligente
auteur
Bruno Scherrer
article
Valgo numéro 01-02, La revue en ligne de l'Association des Connexionnistes en THèse, Association des Connexionnistes en THèse, Oct 2001, Montélimar, France, 8 p
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00099399/file/A01-R-260.pdf BibTex

2000

titre
Modélisation stochastique d'une population de neurones, méta-apprentissage dans un problème de classification
auteur
Bruno Scherrer, Frédéric Alexandre, François Charpillet, Stéphane Vialle
article
Neurosciences et sciences de l'ingénieur, 2000, Dinard, France, 4 p
Accès au bibtex
BibTex

1972

titre
Migration et autres types de déplacements de la mésange noire parus ater en transit au col de la Goleze. I
auteur
Bruno Scherrer
article
Revue d'Écologie, 1972, 1, pp.54-97
Accès au texte intégral et bibtex
https://hal.science/hal-03531405/file/bitstream_118770.pdf BibTex
titre
Migration et autres types de déplacements de la mésange noire parus Ater en transit au col de la Goleze. II
auteur
Bruno Scherrer
article
Revue d'Écologie, 1972, 2, pp.257-313
Accès au texte intégral et bibtex
https://hal.science/hal-03531439/file/bitstream_118777.pdf BibTex