Der Lehrstuhl Angewandte Informatik II lödt ein:

ZUM THEMA

Fehlertoleranz für Lifeline-basierte Taskpools

Prof. Dr. Claudia Fohry

Fachbereich Informatik, University Kassel

Wann: Donnerstag, 23.04.2015 um 14 Uhr s.t.

Wo: Seminarraum S 112 (AI)

ABSTRACT

Mit der Skalierung paralleler Berechnungen auf immer größere Systeme wächst die Bedeutung von Fehlertoleranz. Neue Konzepte paralleler Programmiersysteme, beispielsweise das Auslösen einer Ausnahme nach permanentem Knotenausfall in Resilient X10, ermöglichen die Behandlung von Fehlern auf Anwendungsebene. Um den Programmieraufwand zu begrenzen, erscheint dabei die Implementierung von Fehlertoleranz in Bibliotheken besonders sinnvoll.

Der Vortrag beschreibt ein Fehlertoleranzschema für Taskpools. Dieses verbreitete Pattern des parallelen Rechnens wird unter anderem für die globale Lastenbalancierung bei irregulären Anwendungen verwendet. Wir beziehen uns auf die Lifeline-Variante von Taskpools, die im Kontext der Programmiersprache X10 entwickelt und im Global Load Balancing Framework (GLB) dieser Sprache implementiert wurde.

Unser Algorithmus verbindet mehrere, teils neue Ideen, um Effizienz zu erreichen. So werden nur diejenigen Tasks in die Sicherung einbezogen, die sich über einen längeren Zeitraum hinweg im Pool befinden. Im Zuge der Lastenbalancierung verschobene, und damit duplizierte, Tasks werden unter Umständen nicht zusätzlich gesichert. Durch Einsatz eines Actor-artigen Schemas bleibt die Programmstruktur trotz asynchroner Kommunikation übersichtlich.

Der Vortrag beginnt mit Hintergrundinformationen zu Fehlertoleranz, parallelen Programmiersystemen und Taskpools. Danach werden die Grundideen des Fehlertoleranzschemas erklärt und aktuelle Arbeiten zur Implementierung in GLB skizziert.

PDF öffnen/downloaden

Universität Bayreuth -