2019

auteur
Nicolas Denoyelle, Brice Goglin, Aleksandar Ilic, Emmanuel Jeannot, Leonel Sousa
titre
Modeling Non-Uniform Memory Access on Large Compute Nodes with the Cache-Aware Roofline Model
article
IEEE Transactions on Parallel and Distributed Systems, Institute of Electrical and Electronics Engineers, In press
Resume_court
NUMA platforms, emerging memory architectures with on-package high bandwidth memories bring new oppo .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01924951/file/HAL.pdf BibTex

2018

auteur
Guillaume Aupy, Anne Benoit, Brice Goglin, Loïc Pottier, Yves Robert
titre
Co-scheduling HPC workloads on cache-partitioned CMP platforms
article
IEEE Cluster 2018, Sep 2018, Belfast, United Kingdom. pp.335-345, 2018, Proceedings the 20th IEEE Cluster Conference
Resume_court
Co-scheduling techniques are used to improve the throughput of applications on chip multiprocessors .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01874154/file/cluster18.pdf BibTex
auteur
Guillaume Aupy, Anne Benoit, Brice Goglin, Loïc Pottier, Yves Robert
titre
Co-scheduling HPC workloads on cache-partitioned CMP platforms
article
[Research Report] RR-9154, Inria. 2018
Resume_court
With the recent advent of many-core architectures such as chip multiprocessors (CMP), the number of .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01719728/file/RR-9154.pdf BibTex
auteur
Brice Goglin
titre
Memory Footprint of Locality Information on Many-Core Platforms
article
IEEE. 6th Workshop on Runtime and Operating Systems for the Many-core Era (ROME 2018), held in conjunction with IPDPS, May 2018, Vancouver, BC, Canada. pp.10, 2018
Resume_court
Exploiting the power of HPC platforms requires knowledge of their increasingly complex hardware topo .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01644087/file/article%20%281%29.pdf BibTex
auteur
Brice Goglin, Emmanuel Jeannot, Farouk Mansouri, Guillaume Mercier
titre
A Hierarchical Model to Manage Hardware Topology in MPI Applications
article
[Research Report] RR-9077, Inria Bordeaux Sud-Ouest; Bordeaux INP; LaBRI - Laboratoire Bordelais de Recherche en Informatique. 2018, pp.32
Resume_court
The MPI standard is a major contribution in the landscape of parallel programming. Since its incepti .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01538002/file/RR-9077.pdf BibTex

2017

auteur
Cyril Bordage, Clément Foyer, Brice Goglin
titre
Netloc: a Tool for Topology-Aware Process Mapping
article
Euro-Par 2017: Parallel Processing Workshops, Aug 2017, Santiago de Compostela, Spain. Springer, 10659, 2017, Lecture Notes in Computer Science. 〈10.1007/978-3-319-75178-8_13〉
Resume_court
Interconnection networks in parallel platforms can be made of thousands of nodes and hundreds of swi .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01614437/file/article.pdf BibTex
auteur
Nicolas Denoyelle, Brice Goglin, Aleksandar Ilic, Emmanuel Jeannot, Leonel Sousa
titre
Modeling Large Compute Nodes with Heterogeneous Memories with Cache-Aware Roofline Model
article
Stephen Jarvis; Steven Wright; Simon Hammond. High Performance Computing systems - Performance Modeling, Benchmarking, and Simulation - 8th International Workshop, PMBS 2017, Nov 2017, Denver (CO), United States. Springer, 10724, pp.91-113, 2017, Lecture Notes in Computer Science. 〈10.1007/978-3-319-72971-8_5〉
Resume_court
In order to fulfill modern applications needs, computing systems become more powerful, heterogeneous .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01622582/file/Paper.pdf BibTex
auteur
Brice Goglin
titre
On the Overhead of Topology Discovery for Locality-aware Scheduling in HPC
article
PDP2017 - 25th Euromicro International Conference on Parallel, Distributed and Network-Based Processing, Mar 2017, St Petersburg, Russia. IEEE Computer Society, pp.9, 2017, Proceedings of the 25th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP2017). 〈http://pdp2017.org/〉. 〈10.1109/PDP.2017.35〉
Resume_court
The increasing complexity of parallel computing platforms requires a deep knowledge of the hardware .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01402755/file/article.pdf BibTex

2016

auteur
Nicolas Denoyelle, Aleksandar Ilic, Brice Goglin, Leonel Sousa, Emmanuel Jeannot
titre
Automatic Cache Aware Roofline Model Building and Validation Using Topology Detection
article
NESUS Third Action Workshop and Sixth Management Committee Meeting, Oct 2016, Sofia, Bulgaria. I, 2016, 〈http://www.nesus.eu/event/third-action-workshop-and-sixth-management-committee-meeting?instance_id=292〉
Resume_court
The ever growing complexity of high performance computing systems imposes significant challenges to .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01381982/file/roofline_model_extension.pdf BibTex
auteur
Brice Goglin
titre
Towards the Structural Modeling of the Topology of next-generation heterogeneous cluster Nodes with hwloc
article
[Research Report] Inria. 2016
Resume_court
Parallel computing platforms are increasingly complex, with multiple cores, shared caches, and NUMA .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01400264/file/article.pdf BibTex
auteur
Brice Goglin
titre
Exposing the Locality of Heterogeneous Memory Architectures to HPC Applications
article
1st ACM International Symposium on Memory Systems (MEMSYS16), Oct 2016, Washington, DC, United States. ACM, The Second International Symposium on Memory Systems Proceedings (MEMSYS16), 2016, 〈http://memsys.io/2016/〉. 〈10.1145/2989081.2989115〉
Resume_court
High-performance computing requires a deep knowledge of the hardware platform to fully exploit its c .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01330194/file/article.pdf BibTex

2015

auteur
Nicolas Denoyelle, Brice Goglin, Emmanuel Jeannot
titre
A Topology-Aware Performance Monitoring Tool for Shared Resource Management in Multicore Systems
article
Springer. Proceedings of Euro-Par 2015: Parallel Processing Workshops, Aug 2015, Vienna, Austria. 2015, Lecture Notes in Computer Science
Resume_court
Nowadays, performance optimization involves careful data and task placement to deal with parallel ap .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01183083/file/ROME-workshop-camera-ready.pdf BibTex
auteur
Jack Dongarra, Alexandre Denis, Brice Goglin, Emmanuel Jeannot, Guillaume Mercier
titre
Proceedings of the 22nd European MPI Users' Group Meeting
article
Sep 2015, Bordeaux, France. ACM, pp.149, 2015, 978-1-4503-3795-3. 〈https://dl.acm.org/citation.cfm?id=2802658〉
Accès au bibtex
BibTex

2014

auteur
Marcelo Alaniz, Sergio Nesmachnow, Brice Goglin, Santiago Iturriaga, Veronica Gil Costa, Marcela Printista
titre
MBSPDiscover: An Automatic Benchmark for MultiBSP Performance Analysis
article
First HPCLATAM - CLCAR Joint Latin American High Performance Computing Conference, Oct 2014, Valparaiso, Chile. Springer, 485, pp.158-172, 2014, Communications in Computer and Information Science (CCIS)
Resume_court
Multi-Bulk Synchronous Parallel (MultiBSP) is a recently proposed parallel programming model for mul .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01062528/file/MultiBSP-Benchmark.pdf BibTex
auteur
Brice Goglin
titre
Vers des mécanismes génériques de communication et une meilleure maîtrise des affinités dans les grappes de calculateurs hiérarchiques
article
Calcul parallèle, distribué et partagé [cs.DC]. Université de Bordeaux, 2014
Resume_court
Avec l'utilisation de plus en plus répandue de la simulation numérique dans de nombreuses branches .....
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00979512/file/hdr.pdf BibTex
auteur
Brice Goglin, Joshua Hursey, Jeffrey M. Squyres
titre
netloc: Towards a Comprehensive View of the HPC System Topology
article
Fifth International Workshop on Parallel Software Tools and Tool Infrastructures (PSTI 2014), Sep 2014, Minneapolis, United States. IEEE, 2014
Resume_court
The increasing complexity of High Performance Computing (HPC) server architectures and networks has .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01010599/file/article.pdf BibTex
auteur
Brice Goglin
titre
Managing the Topology of Heterogeneous Cluster Nodes with Hardware Locality (hwloc)
article
International Conference on High Performance Computing & Simulation (HPCS 2014), Jul 2014, Bologna, Italy. IEEE, 2014
Resume_court
Modern computing platforms are increasingly complex, with multiple cores, shared caches, and NUMA ar .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00985096/file/article.pdf BibTex
auteur
Bertrand Putigny, Benoit Ruelle, Brice Goglin
titre
Analysis of MPI Shared-Memory Communication Performance from a Cache Coherence Perspective
article
PDSEC - The 15th IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing, held in conjunction with IPDPS, May 2014, Phoenix, AZ, United States. IEEE, 2014
Resume_court
Shared memory MPI communication is an important part of the overall performance of parallel applicat .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00956307/file/article.pdf BibTex
auteur
Bertrand Putigny, Brice Goglin, Denis Barthou
titre
A Benchmark-based Performance Model for Memory-bound HPC Applications
article
International Conference on High Performance Computing & Simulation (HPCS 2014), Jul 2014, Bologna, Italy. IEEE, 2014
Resume_court
The increasing computation capability of servers comes with a dramatic increase of their complexity .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00985598/file/benchmark_based_memory_model.pdf BibTex
auteur
Adrian Tate, Amir Kamil, Anshu Dubey, Armin Größlinger, Brad Chamberlain, Brice Goglin, Carter Edwards, Chris J. Newburn, David Padua, Didem Unat, Emmanuel Jeannot, Frank Hannig, Tobias Gysi, Hatem Ltaief, James Sexton, Jesus Labarta, John Shalf, Karl Fürlinger, Kathryn O’brien, Leonidas Linardakis, Maciej Besta, Marie-Christine Sawley, Mark Abraham, Mauro Bianco, Miquel Pericàs, Naoya Maruyama, Paul H. J. Kelly, Peter Messmer, Robert B. Ross, Romain Cledat, Satoshi Matsuoka, Thomas Schulthess, Torsten Hoefler, Vitus J. Leung
titre
Programming Abstractions for Data Locality
article
[Research Report] PADAL Workshop 2014, April 28--29, Swiss National Supercomputing Center (CSCS), Lugano, Switzerland. 2014, pp.54
Resume_court
The goal of the workshop and this report is to identify common themes and standardize concepts for l .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01083080/file/PADAL-report.pdf BibTex

2013

auteur
Brice Goglin
titre
Les réseaux pour le calcul haute performance : facteur, livreur ou déménageur ?
article
Interstices, INRIA, 2013, 〈https://interstices.info/reseaux-hpc〉
Resume_court
Les réseaux utilisés pour interconnecter les machines dans les supercalculateurs doivent être ext .....
Accès au bibtex
BibTex
auteur
Brice Goglin, Bertrand Putigny
titre
Idée reçue: Comparer la puissance de deux ordinateurs, c'est facile !
article
Interstices, INRIA, 2013, pp.1. 〈https://interstices.info/jcms/p_80885/idee-recue-comparer-la-puissance-de-deux-ordinateurs-c-est-facile〉
Resume_court
Il y a une quinzaine d'années, quand on achetait un nouvel ordinateur, on avait une idée assez pr .....
Accès au bibtex
BibTex
auteur
Brice Goglin, Stéphanie Moreaud
titre
KNEM: a Generic and Scalable Kernel-Assisted Intra-node MPI Communication Framework
article
Journal of Parallel and Distributed Computing, Elsevier, 2013, 73 (2), pp.176-188. 〈10.1016/j.jpdc.2012.09.016〉
Resume_court
The multiplication of cores in today's architectures raises the importance of intra-node communicati .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00731714/file/article.pdf BibTex
auteur
Antoine Rousseau, Aurélie Darnaud, Brice Goglin, Céline Acharian, Christine Leininger, Christophe Godin, Clarisse Holik, Claude Kirchner, Diane Rives, Elodie Darquie, Erwan Kerrien, Fabrice Neyret, Florent Masseglia, Florian Dufour, Gérard Berry, Gilles Dowek, Hélène Robak, Hélène Xypas, Irina Illina, Isabelle Gnaedig, Joanna Jongwane, Jocelyne Ehrel, Laurent Viennot, Laure Guion, Lisette Calderan, Lola Kovacic, Marie Collin, Marie-Agnès Enard, Marie-Hélène Comte, Martin Quinson, Martine Olivi, Mathieu Giraud, Mathilde Dorémus, Mia Ogouchi, Muriel Droin, Nathalie Lacaux, Nicolas Rougier, Nicolas Roussel, Pascal Guitton, Pierre Peterlongo, Rose-Marie Cornus, Simon Vandermeersch, Sophie Maheo, Sylvain Lefebvre, Sylvie Boldo, Thierry Viéville, Véronique Poirel, Aline Chabreuil, Arnaud Fischer, Claude Farge, Claude Vadel, Isabelle Astic, Jean-Pierre Dumont, Loic Féjoz, Patrick Rambert, Pierre Paradinas, Sophie De Quatrebarbes, Stéphane Laurent
titre
Médiation Scientifique : une facette de nos métiers de la recherche
article
[Interne] none. 2013, pp.34
Resume_court
Dans ce monde devenu numérique nous savons que c'est une de nos missions d'acteur de la recherche p .....
Accès au bibtex
BibTex

2011

auteur
Brice Goglin
titre
NIC-assisted cache-efficient receive stack for message passing over Ethernet
article
Concurrency and Computation: Practice and Experience, Wiley, 2011, Special Issue: Euro-Par 2009, 23 (2), pp.199-210. 〈10.1002/cpe.1632〉
Resume_court
High-speed networking in clusters usually relies on advanced hardware features in the NICs, such as .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00496301/file/article.pdf BibTex
auteur
Brice Goglin
titre
High-Performance Message Passing over generic Ethernet Hardware with Open-MX
article
Parallel Computing, Elsevier, 2011, 37 (2), pp.85-100. 〈10.1016/j.parco.2010.11.001〉
Resume_court
In the last decade, cluster computing has become the most popular high-performance computing archite .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00533058/file/article.pdf BibTex
auteur
Brice Goglin, Stéphanie Moreaud
titre
Dodging Non-Uniform I/O Access in Hierarchical Collective Operations for Multicore Clusters
article
IEEE. CASS 2011: The 1st Workshop on Communication Architecture for Scalable Systems, held in conjunction with IPDPS 2011, May 2011, Anchorage, United States. 7p, 2011, 〈10.1109/IPDPS.2011.222〉
Resume_court
The increasing number of cores led to scalability issues in modern servers that were addressed by us .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00566246/file/article.pdf BibTex
auteur
Brice Goglin
titre
De votre boulangerie à un système d'exploitation multiprocesseur
article
Interstices, INRIA, 2011, 〈http://interstices.info/multiprocesseur〉
Resume_court
Vous entrez dans votre boulangerie préférée pour acheter une baguette, une des serveuses disponib .....
Accès au bibtex
BibTex
auteur
Brice Goglin
titre
Et plus vite si affinités...
article
Interstices, INRIA, 2011, 〈http://interstices.info/affinites〉
Resume_court
La révolution des processeurs multicœurs lance le défi de la gestion des affinités dans les ordi .....
Accès au bibtex
BibTex
auteur
Brice Goglin, Jeffrey Squyres, Samuel Thibault
titre
Hardware Locality: Peering under the hood of your server
article
Linux Pro Magazine, Linux New Media USA, LLC, 2011, pp.28-33
Resume_court
Internal server topology is getting more and more complex; understanding where your processes are ru .....
Accès au bibtex
BibTex
auteur
Teng Ma, George Bosilca, Aurélien Bouteiller, Brice Goglin, Jeffrey Squyres, Jack Dongarra
titre
Kernel Assisted Collective Intra-node MPI Communication Among Multi-core and Many-core CPUs
article
IEEE. 40th International Conference on Parallel Processing (ICPP-2011), Sep 2011, Taipei, Taiwan. 2011, 〈10.1109/ICPP.2011.29〉
Resume_court
Shared memory is among the most common approaches to implementing message passing within multi-core .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00602877/file/collknem.pdf BibTex
auteur
Bertrand Putigny, Denis Barthou, Brice Goglin
titre
Modélisation du coût de la cohérence de cache pour améliorer le tuilage de boucles
article
Quatrièmes rencontres de la communauté française de compilation, Dec 2011, Saint-Hippolyte, France. 2011
Resume_court
Nous présentons un modèle exprimant le coût de la cohérence de cache au sein de processeurs mult .....
Accès au bibtex
BibTex
auteur
Bertrand Putigny, Brice Goglin, Denis Barthou
titre
Performance modeling for power consumption reduction on SCC
article
Hasso Plattner Institute at University of Potsdam. 4th Many-core Applications Research Community (MARC) Symposium, Dec 2011, Potsdam, Germany. 2011
Resume_court
As power is becoming one of the biggest challenge in high performance computing, we are proposing a .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00649635/file/Performance_modeling_for_power_consumption_reduction_on_SCC_-_INIRA_Putigny_Goglin_Barthou.pdf BibTex
auteur
Pascale Vicat-Blanc Primet, Brice Goglin, Romaric Guillier, Sebastien Soudan
titre
Computing Networks: From Cluster to Cloud Computing
article
Wiley-ISTE, pp.261, 2011, 978-1-84821-286-2
Resume_court
Computing Networks" explores the core of the new distributed computing infrastructures we are using .....
Accès au bibtex
BibTex

2010

auteur
François Broquedis, Olivier Aumage, Brice Goglin, Samuel Thibault, Pierre-André Wacrenier, Raymond Namyst
titre
Structuring the execution of OpenMP applications for multicore architectures
article
IEEE. International Parallel and Distributed Symposium (IPDPS 2010), Apr 2010, Atltanta, United States. 2010, 〈10.1109/IPDPS.2010.5470442〉
Resume_court
The now commonplace multi-core chips have introduced, by design, a deep hierarchy of memory and cach .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00441472/file/PID1125911.pdf BibTex
auteur
François Broquedis, Jérôme Clet-Ortega, Stéphanie Moreaud, Nathalie Furmento, Brice Goglin, Guillaume Mercier, Samuel Thibault, Raymond Namyst
titre
hwloc: a Generic Framework for Managing Hardware Affinities in HPC Applications
article
IEEE. PDP 2010 - The 18th Euromicro International Conference on Parallel, Distributed and Network-Based Computing, Feb 2010, Pisa, Italy. 2010, 〈10.1109/PDP.2010.67〉
Resume_court
The increasing numbers of cores, shared caches and memory nodes within machines introduces a complex .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00429889/file/main.pdf BibTex
auteur
François Broquedis, Nathalie Furmento, Brice Goglin, Pierre-André Wacrenier, Raymond Namyst
titre
ForestGOMP: an efficient OpenMP environment for NUMA architectures
article
International Journal of Parallel Programming, Springer Verlag, 2010, 〈10.1007/s10766-010-0136-3〉
Resume_court
Exploiting the full computational power of current hierarchical multiprocessor machines requires a v .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00496295/file/IJPP.pdf BibTex
auteur
Brice Goglin
titre
Réseaux rapides et stockage distribué dans les grappes de calculateurs
article
Editions Universitaires Européennes, pp.194, 2010, 978-613-1-51872-0
Resume_court
Le calcul scientifique haute performance (HPC) repose essentiellement sur des grappes de calculateur .....
Accès au bibtex
BibTex
auteur
Teng Ma, George Bosilca, Aurélien Bouteiller, Brice Goglin, Jeffrey Squyres, Jack Dongarra
titre
Kernel Assisted Collective Intra-node Communication Among Multicore and Manycore CPUs
article
[Research Report] 2010, pp.11
Resume_court
More memory hierarchies, NUMA architectures and network-style interconnection are widely used in mod .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00544872/file/kernel-assisted-comm-multicore.pdf BibTex
auteur
Stéphanie Moreaud, Brice Goglin, Raymond Namyst
titre
Adaptive MPI Multirail Tuning for Non-Uniform Input/Output Access
article
Springer. The 17th European MPI Users Group conference, Sep 2010, Stuttgart, Germany. 6305, pp.239-248, 2010, Lecture Notes in Computer Science. 〈10.1007/978-3-642-15646-5_25〉
Resume_court
Multicore processors have not only reintroduced Non-Uniform Memory Access (NUMA) architectures in no .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00486178/file/article.pdf BibTex
auteur
Stéphanie Moreaud, Brice Goglin, David Goodell, Raymond Namyst
titre
Optimizing MPI Communication within large Multicore nodes with Kernel assistance
article
IEEE. Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2010, Apr 2010, Atlanta, United States. 7 p., 2010, 〈10.1109/IPDPSW.2010.5470849〉
Resume_court
As the number of cores per node increases in modern clusters, intra-node communication efficiency be .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00451471/file/CAC10.pdf BibTex
auteur
Pascale Vicat-Blanc Primet, Romaric Guillier, Sebastien Soudan, Brice Goglin
titre
Réseaux de calcul - des grappes aux nuages de calcul
article
Hermès Science - Lavoisier, pp.213, 2010, 978-2-7462-3006-4
Resume_court
Réseaux de calcul étudie le cœur de trois nouvelles architectures informatiques distribuées : le .....
Accès au bibtex
BibTex

2009

auteur
François Broquedis, Nathalie Furmento, Brice Goglin, Raymond Namyst, Pierre-André Wacrenier
titre
Dynamic Task and Data Placement over NUMA Architectures: an OpenMP Runtime Perspective
article
International Workshop on OpenMP (IWOMP), Jun 2009, Dresden, Germany. 2009, 〈10.1007/978-3-642-02303-3_7〉
Resume_court
Exploiting the full computational power of current hierarchical multiprocessor machines requires a v .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00367570/file/cameraReadyVersion.pdf BibTex
auteur
Darius Buntinas, Brice Goglin, David Goodell, Guillaume Mercier, Stéphanie Moreaud
titre
Cache-Efficient, Intranode, Large-Message MPI Communication with MPICH2-Nemesis
article
IEEE. 38th International Conference on Parallel Processing (ICPP-2009), Sep 2009, Vienne, Austria. 2009, 〈10.1109/ICPP.2009.22〉
Resume_court
The emergence of multicore processors raises the need to efficiently transfer large amounts of data .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00390064/file/article.pdf BibTex
auteur
Brice Goglin
titre
NIC-assisted Cache-Efficient Receive Stack for Message Passing over Ethernet
article
Springer Verlag. 15th International Euro-Par Conference, Aug 2009, Delft, Netherlands. 2009, Lecture Notes in Computer Science. 〈10.1007/978-3-642-03869-3_981〉
Resume_court
High-speed networking in clusters usually relies on advanced hardware features in the NICs, such as .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00379168/file/EuroPar09-submit.pdf BibTex
auteur
Brice Goglin, Nathalie Furmento
titre
Memory Migration on Next-Touch
article
Linux Symposium, Jul 2009, Montreal, Canada. 2009
Resume_court
NUMA abilities such as explicit migration of memory buffers enable flexible placement of data buffer .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00378580/file/goglin.pdf BibTex
auteur
Brice Goglin, Nathalie Furmento
titre
Finding a Tradeoff between Host Interrupt Load and MPI Latency over Ethernet
article
IEEE. Cluster 2009, Sep 2009, New Orleans, United States. 2009, 〈10.1109/CLUSTR.2009.5289165〉
Resume_court
Achieving high-performance message passing on top of generic Ethernet hardware suffers from the NIC .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00397328/file/article.pdf BibTex
auteur
Brice Goglin, Nathalie Furmento
titre
Enabling High-Performance Memory Migration for Multithreaded Applications on Linux
article
IEEE. MTAAP'09: Workshop on Multithreaded Architectures and Applications, held in conjunction with IPDPS 2009, May 2009, Rome, Italy. 2009, 〈10.1109/IPDPS.2009.5161101〉
Resume_court
As the number of cores per machine increases, memory architectures are being redesigned to avoid bus .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00358172/file/article.pdf BibTex
auteur
Brice Goglin
titre
Decoupling Memory Pinning from the Application with Overlapped on-Demand Pinning and MMU Notifiers
article
IEEE. Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2009, May 2009, Rome, Italy. 2009, 〈10.1109/IPDPS.2009.5160888〉
Resume_court
High-performance cluster networks achieve very high throughput thanks to zero-copy techniques that r .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00356236/file/article.pdf BibTex
auteur
Brice Goglin
titre
High Throughput Intra-Node MPI Communication with Open-MX
article
IEEE. 17th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP2009), Feb 2009, Weimar, Germany. 2009, 〈10.1109/PDP.2009.20〉
Resume_court
The increasing number of cores per node in high-performance computing requires an efficient intra-no .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00331209/file/article.pdf BibTex

2008

auteur
Brice Goglin
titre
Improving Message Passing over Ethernet with I/OAT Copy Offload in Open-MX
article
IEEE. Cluster 2008, Sep 2008, Tsukuba, Japan. 2008, 〈10.1109/CLUSTR.2008.4663775〉
Resume_court
Open-MX is a new message passing layer implemented on top of the generic Ethernet stack of the Linux .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00288757/file/Open-MX-IOAT.pdf BibTex
auteur
Brice Goglin
titre
Design and Implementation of Open-MX: High-Performance Message Passing over generic Ethernet hardware
article
Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2008, Apr 2008, Miami, United States. 2008, 〈10.1109/IPDPS.2008.4536140〉
Resume_court
Open-MX is a new message passing layer implemented on top of the generic Ethernet stack of the Linux .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00210704/file/CAC-383-paper-1.pdf BibTex
auteur
Brice Goglin, Olivier Glück, Pascale Primet
titre
Interaction efficace entre les réseaux rapides et le stockage distribué dans les grappes de calcul
article
Revue des Sciences et Technologies de l'Information - Série TSI : Technique et Science Informatiques, Lavoisier, 2008, 27 (7/2008), pp.911-940
Resume_court
Les applications parallèles s'exécutant sur les grappes nécessitent à la fois des communications .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00491732/file/INRIA-RR-5806.pdf BibTex

2007

auteur
Brice Goglin
titre
Efficient Interaction between High-Speed Networks and Distributed Storage in Clusters
article
[Research Report] 2007, pp.28
Resume_court
Parallel applications running on clusters require both high-performance communications between nodes .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00070218/file/article.pdf BibTex
auteur
Stéphanie Moreaud, Brice Goglin
titre
Impact of NUMA Effects on High-Speed Networking with Multi-Opteron Machines
article
PDCS, Nov 2007, Cambridge, United States. 2007
Resume_court
The ever-growing level of parallelism within the multi-core and multi-processor nodes in clusters le .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00175747/file/PDCS07.pdf BibTex
auteur
Samuel Thibault, François Broquedis, Brice Goglin, Raymond Namyst, Pierre-André Wacrenier
titre
An Efficient OpenMP Runtime System for Hierarchical Architectures
article
International Workshop on OpenMP (IWOMP), Jun 2007, Beijing, China. pp.148--159, 2007
Resume_court
Exploiting the full computational power of always deeper hierarchical multiprocessor machines requir .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00154502/file/main.pdf BibTex

2006

auteur
Brice Goglin
titre
What HPC Networking Requires from the Linux Kernel
article
Initially published at http://www.hpcwire.com/hpc/811570.html as part of HPCwire's Daily Coverage.. 2006
Resume_court
High performance computing is a realm in which Linux dominates over the other operating systems. In .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00975608/file/Goglin-HPCWire-811570.pdf BibTex
auteur
Brice Goglin
titre
High-Speed Networking in Clusters without OS-bypass and Zero-copy
article
[Research Report] 2006, pp.3
Resume_court
High-performance computing requires low latency and high bandwidth communications. The emergence of .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00691967/file/noosbypass-nozerocopy.pdf BibTex
auteur
Atchley Scott, Brice Goglin
titre
Comparing Lustre Performance using Myricom 10G Dual Protocol NICs
article
[Research Report] 2006, pp.25
Resume_court
In this paper, we look at how Lustre performs using Myricom's 10 Gb/s NICs. Lustre clients and serve .....
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00691977/file/lustre-myri10g.pdf BibTex

2005

auteur
Brice Goglin
titre
Réseaux rapides et stockage distribué dans les grappes de calculateurs : propositions pour une interaction efficace
article
Réseaux et télécommunications [cs.NI]. Ecole normale supérieure de lyon - ENS LYON, 2005. Français
Resume_court
L'objectif de ce travail est d'étudier l'exploitation des réseaux haute performance des grappes da .....
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00408722/file/these.pdf BibTex
auteur
Brice Goglin, Olivier Glück, Pascale Vicat-Blanc Primet
titre
Accès optimisés aux fichiers distants dans les grappes disposant d'un réseau rapide
article
RenPar'16, Apr 2005, Le Croisic, France. pp.37-46, 2004
Resume_court
L'exécution performante d'applications parallèles sur grappes de calcul interconnectées par des r .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00070548/file/RR-5458.pdf BibTex
auteur
Brice Goglin, Olivier Glück, Pascale Vicat-Blanc Primet
titre
An Efficient Network API for in-Kernel Applications in Clusters
article
IEEE Computer Society Press. International Conference on Cluster Computing, Sep 2005, Boston, United States. pp.18, 2005, 〈10.1109/CLUSTR.2005.347044〉
Resume_court
Running parallel applications on clusters with high-speed local networks requires fast communication .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00070445/file/RR-5561.pdf BibTex

2004

auteur
Brice Goglin, Loïc Prylli, Olivier Glück
titre
Optimizations of Client's side communications in a Distributed File System within a Myrinet Cluster
article
IEEE Computer Society Press. Workshop on High-Speed Local Networks (HSLN), held in conjunction with the 29th IEEE LCN Conference, Nov 2004, Tampa, United States. pp.726-733, 2004, 〈10.1109/LCN.2004.92〉
Resume_court
This paper presents a study of the interaction between high-speed interconnects and a distributed fi .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00071414/file/RR-5174.pdf BibTex
auteur
Brice Goglin, Loïc Prylli
titre
Performance Analysis of Remote File System Access over High Bandwidth Local Network
article
IEEE Computer Society Press. Workshop on Communication Architecture for Clusters (CAC'04), held in conjunction with the 18th IEEE IPDPS Conference, Apr 2004, Santa Fe, United States. 2004, 〈10.1109/IPDPS.2004.1303196〉
Resume_court
We study the performance of file servers, comparing NFS implementation in Linux to our experimental .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00071791/file/RR-4795.pdf BibTex
auteur
Brice Goglin, Loïc Prylli
titre
Transparent Remote File Access through a Shared Library Client
article
CSREA Press. International Conference on Parallel and Distributed Processing Techniques and Applications (PDPTA'04), Jun 2004, Las Vegas, United States. 3, pp.1131-1137, 2004
Resume_court
This paper presents the implementation of the ORFA client. ORFA aims at providing an efficient acces .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00071527/file/RR-5056.pdf BibTex

2003

auteur
Brice Goglin, Loïc Prylli
titre
Design and Implementation of ORFA
article
[Research Report] 2003, pp.15
Resume_court
ORFA is a user-level protocol that aims at providing an efficient remote file system access. It uses .....
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00408749/file/orfa-design.pdf BibTex