Parallel 2012 » Agenda »
Effiziente Multicore-Programmierung
Der Vortrag gibt zunächst einen Überblick über die Architektur moderner Multicore-Prozessoren und der Systeme, in denen sie zum Einsatz kommen. Besonderheiten wie gemeinsame bzw. separate Caches, Bandbreiten-Engpässe und ccNUMA-Charakteristiken werden eingehend erläutert, und der Einfluss der Systemtopologie und der Thread-Affinität auf die Performance typischer Konstrukte im parallelen Programmieren wird anhand von Benchmarks demonstriert. Der Vortrag schließt mit aus der Erfahrung geborenen "Best Practices" für die Performance-Analyse und das effiziente Programmieren auf Multicore-Hardware.
Referent
Gerhard Wellein
studierte und promovierte in theoretischer Physik an der Universität Bayreuth, und ist seit 2009 Professor für Hochleistungsrechnen am Department Informatik der Universität Erlangen-Nürnberg. Gleichzeitig leitet er die HPC-Gruppe des Regionalen Rechenzentrums Erlangen (RRZE). Seine Forschung dreht sich um Algorithmen zur Lösung großer dünn besetzter Eigenwertprobleme, die Performancemodellierung und die architekturspezifische Codeoptimierung. Zusammen mit Georg Hager ist er Autor des Lehrbuches "Introduction to High Performance Computing for Scientists and Engineers".