Flash informatique 2009 - no 5

Page 1

éCOLE POLYTECHNIQUE FéDéRALE DE LAUSANNE

p/a EPFL - Domaine IT - CP 121 - CH 1015 Lausanne 15 - tél. +41 21 69 322 11 - Web: http://dit.epfl.ch

Parallélisme extrême sur le Blue Gene/L

Sommaire FI 5/2009

Jonas.Latt@epfl.ch, EPFL – Laboratoire d’ingénierie numérique

Introduction Depuis l’introduction du circuit intégré dans les années 1950, le marché de l’informatique suit une tendance caractérisée par l’augmentation exponentielle de la puissance de calcul au fil des années. Souvent citée sous le nom de loi de Moore d’après une constatation du cofondateur d’Intel Gordon E. Moore sur l’évolution de la microtechnique, cette tendance s’applique à des aspects variés de l’informatique tels que la vitesse d’exécution des processeurs ou encore la quantité de mémoire disponible dans les ordinateurs. La loi de Moore fait le bonheur des chercheurs dans le domaine du calcul numérique, car elle leur permet de fréquemment augmenter la rapidité de leurs simulations et la taille des problèmes simulés, permettant ainsi de nouvelles percées scientifiques. Depuis plusieurs années, ce bel optimisme dans le domaine du calcul numérique se trouve cependant freiné. Alors que la loi de Moore reste valable, elle ne s’exprime plus en termes d’augmentation de la performance brute des processeurs mais plutôt en termes d’augmentation du nombre d’unités de calcul dans des processeurs multi-cœurs. Cette nouvelle tendance entraîne deux changements importants pour le calcul scientifique. En premier lieu, le développement de programmes parallèles est devenu un besoin de base

et non plus un luxe destiné à pousser les performances aux limites du réalisable. Par exemple, la plupart des ordinateurs de bureau modernes possèdent des processeurs à deux ou quatre cœurs. Même pour l’exécution d’une simulation modeste sur un ordinateur personnel, un programme parallélisable est requis, sous peine de renoncer à la moitié voire aux trois quarts de la performance offerte par le processeur. Une deuxième conséquence est l’augmentation massive du nombre de cœurs disponibles dans des ordinateurs parallèles destinés au calcul scientifique. Alors que récemment encore, beaucoup de groupes de recherche effectuaient leurs calculs sur des grappes d’ordinateurs avec une centaine de processeurs environ, des machines consistantes de plusieurs milliers de cœurs sont en train de devenir monnaie courante. Ce phénomène est parfois désigné sous le nom de extreme-scale parallelism, qu’on traduirait par parallélisme extrême en français. Comme d’autres mots-clés à la mode, ce terme ne possède pas de signification précise, mais reflète plutôt un changement qualitatif ressenti dans la communauté, avec un impact sur la culture de programmation pour l’implantation de modèles numériques.

suite en page

3

1 Parallélisme extrême sur le Blue Gene/L Jonas Lätt 2 Des petits trous, des petits trous, toujours des petits trous Appoline Raposo 2 Il y a 20 ans dans le FI 7 Programme des cours 13 Parfaire une barre de planning Visio en 20 minutes chrono Jacqueline Frey 15 Forum IT du 7 mai 2009 Jacqueline Dousson 16 DIT-info

Prochaines parutions No

Délai de rédaction

Parution

6

04.06.09

23.06.09

SP

30.06.09

01.09.09

7

03.09.09

22.09.09

8

08.10.09

27.10.09

9

05.11.09

24.11.09

10

03.12.09

22.12.09

FI 5 – 26 mai 2009 – page 1


Des petits trous, des petits trous, toujours des petits trous Appoline.Raposo@epfl.ch, Domaine IT

sprang_eco_sans_regular

Pourquoi Ecofont?

C’est le nom de cette fonte basée sur la police open source Vera Sans respectueuse de l’environnement et par là-même de votre portefeuille. En effet, de minuscules évidements circulaires dans leurs corps rendent les caractères moins consommateurs d’encre. L’utilisation avec une taille de casse courante est tout à fait lisible et les petits trous ne se remarquent pas contrairement à ce que nous montre le logo ecofont avec ces caractères grossis de façon exagérée. Bien entendu, le résultat dépendra aussi des logiciels et des écrans utilisés. Ecofont s’intègre très bien dans OpenOffice, Appleworks et MS Office et les meilleurs résultats s’obtiennent avec une imprimante Laser. Ecofont est issue d’une police open source, son utilisation est gratuite; elle est disponible pour Mac, PC et Linux. Vous la trouverez sur le site: www.ecofont.eu/ ecofont_fr.html.

Ecofont a été développée par SPRANQ creative communications, sur une idée originale de Colin Willems pour promouvoir la préservation de l’environnement. SPRANG donne les conseils suivants: Utilisateurs: n’imprimez que ce qui est vraiment nécessaire. Utilisez un copieur moderne et efficace, avec du papier recyclé. Graphistes: faites appel à des techniques modernes de séparation des couleurs, pour éviter de gaspiller l’encre. Pensez toujours à l’environnement dans vos choix de papier Offset: évitez les techniques Laser modernes, qui rendent l’encre indivisible du papier. Misez sur des innovations comme l’encre à base de soja, … Imprimerie: investissez dans des produits écologiques et innovants.n

Il y a 20 ans dans le FI François Roulet écrivait dans son article: Messagerie électronique sur Macintosh, paru dans le FI du 21 février 89: Depuis plusieurs années déjà, les ingénieurs de notre École et quelques rares secrétaires font usage de systèmes de courrier électronique. En quoi cela peut-il bien consister ? En fait, il s’agit essentiellement d’un télex fonctionnant au travers des ordinateurs, et permettant d’atteindre des correspondants équipés de la même manière, pour la plupart des universités ou des centres de recherche. Récemment, nous avons mis à disposition une de ces messageries électroniques, appelée QuickMail, sur la majorité des Macintosh de l’École qui sont raccordés entre eux par les réseaux AppleTalk et Ethernet. L’intérêt de ce produit est d’être très convivial, accessible pendant la journée (si on laisse son Mac enclenché) et dans beaucoup de bureaux puisque les secrétaires ont presque toutes une station à leur place de travail. De quoi cette messagerie se compose-t-elle ? Tout d’abord, il faut constituer une armoire de cases courrier ou serveur de messagerie, qui n’est qu’un Mac qu’on fera fonctionner si possible 24 heures sur 24, afin de pouvoir y déposer des messages même en l’absence des destinataires. Relevons que cette station ne doit pas nécessairement être dédiée à cette tâche, mais peut être utilisée normalement. [...] Installation actuelle dans l’École Il n’y a pour l’instant qu’un serveur de messagerie Macintosh public dans l’École, situé au SIC et portant le nom de POLYMAC regroupant des personnes de plusieurs départements. Dans un futur proche, nous installerons un serveur par département. Il ne s’agit pas d’une restriction, puisque tous les serveurs communiquent entre eux pour se passer des messages jusqu’à leur destinataire final. Télex: Le premier grand réseau Télex fut mis en place en Allemagne dans les années 1930. Il était destiné aux communications au sein du gouvernement. En France, le réseau Télex fut inauguré par le Général de Gaulle le 18 juin 1946. À un débit de 45,5 bits par seconde, énorme pour l’époque, une unique ligne téléphonique à longue distance pouvait être subdivisée en 25 canaux Télex. Ainsi, le Télex était le moyen de communication fiable et à longue distance le moins coûteux. [Wikipédia] FI 5 – 26 mai 2009 – page 2


Parallélisme extrême sur le Blue Gene/L

suite de la première page Dans le cas du parallélisme extrême, ce changement s’est manifesté en premier lieu en tant que difficulté rencontrée dans plusieurs secteurs du calcul numérique: des programmes parallèles qui originalement étaient développés pour des grappes d’une petite dizaine de nœuds, qui ensuite ont pu être adaptés sans trop de difficultés aux machines à une ou même plusieurs centaines de nœuds, soudainement se trouvent impuissants face à la nouvelle génération de machines parallèles et refusent une mise à l’échelle d’un nouvel ordre de grandeur par rapport au nombre de nœuds. Afin d’illustrer les enjeux rencontrés lors de la parallélisation sur des milliers de nœuds, et dans l’espoir de faciliter à d’autres programmeurs le passage à la nouvelle génération de machines parallèles, cet article raconte l’histoire du logiciel SPECULOOS [1]. Ce logiciel, dont l’acronyme signifie SPECtral Unstructured eLements Object-Oriented System, permet des simulations en dynamique des fluides à l’aide d’une méthode numérique dite d’éléments spectraux. Développé au début des années 1990 dans le laboratoire d’ingénierie numérique (LIN) de l’EPFL, le code de SPECULOOS s’est patiemment adapté à l’évolution du matériel informatique pour finalement refuser ses services sur des plates-formes à plusieurs milliers de cœurs. À plusieurs reprises, le code a dû être disséqué et analysé jusqu’à ce que son profil de performance soit établi et que des modifications appropriées puissent être amenées. Cet effort a été gratifiant, puisque SPECULOOS est maintenant capable d’exploiter la pleine puissance de la machine parallèle Blue Gene/L, qui fait la fierté de l’EPFL avec ses 8192 cœurs, répartis sur 4096 nœuds bi-cœurs. Nous montrons comment cette adaptation a été possible, et de quelle manière cette percée affecte la qualité de la recherche menée. En outre, le Blue Gene/L est mis en perspective avec d’autres plates-formes de calcul à haute performance plus économiques, et l’impact du choix de la machine sur la dynamique du travail scientifique dans un groupe est mis en évidence.

Évaluation de l’enjeu et du gain d’une parallélisation Avant de pouvoir paralléliser un code, il est important de comprendre de quelle manière se répartissent ses besoins en termes de ressources de calcul. Une telle évaluation se fait par un bilan qu’on appelle le profil de complexité, qui permet entre autres d’estimer le gain de performance que peut amener une parallélisation, et de juger de la qualité de la parallélisation lors des exécutions expérimentales du code obtenu. En dynamique des fluides, on cherche à calculer ou simuler l’évolution de certaines variables représentant l’état du fluide, telle que la vitesse instantanée de l’écoulement en chaque point du fluide. Dans la méthode d’éléments spectraux, le domaine occupé par le fluide est découpé en sous-domaines appelés les éléments. A l’intérieur de chaque élément, les variables du fluide sont considérées comme des fonctions dépendantes de la position spatiale, et ces fonctions sont représentées de manière approchée par des

polynômes. On appellera N le degré de ces polynômes, et on dira qu’un domaine spatial tri-dimensionnel est subdivisé en E*E*E=E 3 éléments. Dans la stratégie de parallélisation adoptée par SPECULOOS, on distribue les éléments sur la machine parallèle en en attribuant un ou plusieurs à chaque coeur. Le programme décompose ensuite son évolution temporelle en cycles successifs, durant lesquels chaque cœur effectue d’abord des calculs sur les éléments qui lui sont attribués, puis les cœurs se transmettent des valeurs calculées situées sur la surface de leurs éléments. Cette manière de paralléliser un code est élégante et efficace, et ne possède essentiellement que trois facteurs limitatifs pouvant affecter la performance. En premier lieu, la parallélisation nécessite une communication entre processeurs qui est effectuée en plus du calcul proprement dit, et qui peut devenir coûteuse. La parallélisation n’en vaut donc la peine que si le temps de communication est fortement inférieur au temps de calcul requis par chaque élément. En deuxième lieu, la performance peut être affectée par un déséquilibre des charges entre cœurs. Si un cœur se voit attribuer moins d’éléments que les autres, ou si le calcul sur certains éléments s’avère moins onéreux que sur d’autres, le cœur peut gaspiller une partie de son temps à attendre la communication provenant de ses partenaires. Le dernier facteur potentiellement limitant est représenté par des petites composantes non parallélisables du code qui sont exécutées par chaque cœur en plus du travail sur les éléments, et qui ne profitent donc pas de la parallélisation. Il s’agit là d’un aspect de la parallélisation sur lequel nous insistons particulièrement dans cet article, et qui sera repris en détail dans un chapitre ultérieur. Pour améliorer la précision du calcul numérique, on peut choisir, soit d’améliorer la résolution spatiale du domaine simulé en augmentant le paramètre E et donc le nombre d’éléments, soit d’améliorer la précision du modèle en augmentant le degré polynomial N. Il est en effet connu que l’erreur de l’approximation numérique est proportionnelle à la valeur 1/E (N+1) dans tout problème dont la solution est suffisamment régulière. En vue d’une parallélisation efficace, il est souvent considéré comme plus favorable d’augmenter le paramètre N, avec l’effet d’augmenter fortement la charge de calcul de chaque élément en n’augmentant que légèrement le volume de données à communiquer entre cœurs. Ainsi, le coût relatif de la communication se trouve diminué. D’un autre côté, une augmentation du nombre d’éléments est favorable à l’équilibrage des charges entre cœurs, car elle entraîne une flexibilité accrue dans le choix de l’attribution d’éléments aux cœurs. Cet argument est particulièrement pertinent lors d’une parallélisation à un niveau extrême, puisqu’il n’est pas rare de se retrouver avec un nombre d’éléments inférieur à celui de cœurs, et donc d’atteindre une limite naturelle à la possibilité de paralléliser le code. C’est pourquoi nous considérons surtout des situations dans lesquelles le degré polynomial est choisi préalablement comme un paramètre constant, et le nombre d’éléments est ajusté en fonction de la précision de calcul souhaitée ou de la taille de la machine parallèle utilisée. Revenons-en donc au code SPECULOOS et à une estimation (simplifiée) de sa complexité. Un cycle temporel consiste en un processus itératif, durant lequel une opération spécifique est appliquée à chacun des E 3 éléments durant chaque itération, contribuant ainsi à la complexité du code FI 5 – 26 mai 2009 – page 3


Parallélisme extrême sur le Blue Gene/L d’un facteur E 3 par pas d’itération. Le coût de l’opération en question varie quant à lui en fonction du degré polynomial par une loi de puissance à exposant 4, ce qui rajoute un facteur N 4 à l’estimation de complexité. Finalement, il est connu que le processus itératif converge en un nombre d’itérations augmentant linéairement avec le paramètre E, et de même avec le paramètre N. Le temps de calcul T d’un cycle temporel est donc estimé comme étant T = l E 4 N 5 [Equation 1] lors d’une exécution séquentielle (c’est-à-dire non parallèle). Le paramètre l dépendant du matériel informatique utilisé et de différents choix dans l’implantation du code, mais pas de E ni de N. Dans ce qui suit, nous étudions les enjeux inhérents à la parallélisation d’un problème à taille constante. Nous choisissons donc le nombre d’éléments et le degré polynomial, E et N, comme paramètres constants, et mesurons le temps de calcul nécessité lors d’une exécution sur un nombre variable de processeurs p. Une telle mesure ne reflète pas toujours le gain de la parallélisation perçu en pratique, car il est commun dans le quotidien scientifique d’augmenter la taille du domaine de calcul lors de l’augmentation du nombre de cœurs d’une machine parallèle. D’un autre côté, les processeurs modernes, constitués d’un grand nombre de cœurs, encouragent de plus en plus les chercheurs à opter pour un parallélisme massif autant pour de grands que pour de petits problèmes. Nous choisissons donc cette vision plus exigeante du parallélisme (il est plus difficile de paralléliser un petit qu’un grand problème) afin que les conclusions soient généralement valables. Le temps de calcul est alors estimé comme étant T = 1/p l E 4 N 5 + T(séquentiel) + T(communication) [Equation 2] Par cette formule, on suppose que l’équilibrage de charge entre les cœurs est parfait, et on tient compte de la partie de code non parallélisable par le paramètre T(séquentiel) ainsi que du temps de communication entre les cœurs, T(communication).

fig. 1– Représentation bidimensionnelle de l’écoulement dans une cavité entraînée FI 5 – 26 mai 2009 – page 4

Exemple d’application Afin d’illustrer les concepts exposés dans le chapitre précédent, nous introduisons un problème bien connu en dynamique des fluides décrivant un écoulement dans une cavité cubique, entraîné par un mouvement constant sur la face supérieure de la boîte, ainsi qu’il est illustré par la figure 1. Ce problème, qui a été étudié durant de longues années et par différentes approches dans le laboratoire d’ingénierie numérique, met en évidence un comportement riche et intriguant, en dépit de sa simplicité apparente. Déjà lorsque la vitesse d’entraînement du fluide est faible, on observe, en plus de deux grands tourbillons centraux dans la cavité, une séquence infinie de tourbillons dans les coins de la cavité, avec une structure passablement complexe. À des vitesses plus élevées, le fluide entre dans ce que l’on appelle un régime turbulent, dans lequel la structure de l’écoulement est chaotique dans l’espace et dans le temps. Il devient alors impossible, même d’un point de vue théorique, de trouver une solution exacte aux équations des fluides, et on se borne à décrire le résultat par l’intermédiaire de propriétés statistiques. Au vu des difficultés de cette entreprise, cette tâche est à ce jour encore un sujet de recherche active. Les résultats obtenus ont des répercussions non seulement sur la théorie des fluides turbulents, mais aussi dans des domaines d’ingénierie, car ils mènent à une meilleure compréhension générale des écoulements de fluides dans des espaces confinés. Les différents régimes d’un écoulement sont décrits par un paramètre du nom de nombre de Reynolds, désigné par l’acronyme Re, qui dépend de la vitesse d’entraînement du fluide, ainsi que de sa viscosité et de la taille de la cavité. Dans un régime turbulent, caractérisé par un nombre de Reynolds élevé, la simulation des fluides est rendue difficile par l’apparition de tourbillons de différentes tailles, allant de la taille de la cavité entière jusqu’à de très petites échelles. Indépendamment de leur taille, ces tourbillons ont un impact décisif sur le comportement du fluide et doivent donc tous être entièrement simulés. Pour ne pas faciliter les choses, la taille e des plus petits tourbillons diminue à une vitesse polynomiale lorsque le nombre de Reynolds augmente, selon la loi suivante: e ~ Re -(3/4). La seule manière de suivre cette évolution dans une simulation, lorsque le degré polynomial N est choisi comme un paramètre constant, consiste à adapter le paramètre E de manière équivalente: E ~ Re (3/4). Le nombre total d’éléments croît donc à une vitesse effrayante, proportionnelle à E 3 ~ Re (9/4). En plus du nombre d’éléments, la durée de la simulation croît fortement à cause de l’occurrence d’événements rares ne pouvant être observés que dans des simulations suffisamment longues. Face à ces difficultés, il est courant dans les domaines d’ingénierie de recourir à des modèles de la turbulence dans lesquels on ne simule que les grands tourbillons, et remplace la physique des petits tourbillons par des lois simplifiées. Une telle approche n’est par contre pas admissible en sciences fondamentales, lorsqu’il s’agit d’obtenir des informations aussi précises que possible sur la physique des fluides. Dans l’ère de l’avant Blue Gene, le nombre de Reynolds pouvant être atteint dans les simulations s’élevait aux environs de Re = 10’000, ce qui correspond par exemple au régime d’écoulement de l’air autour d’un piéton marchant


Parallélisme extrême sur le Blue Gene/L à une vitesse modeste. D’autre part, le nombre de Reynolds correspondant à beaucoup de situations d’intérêt industriel, tel que l’écoulement de l’air autour d’une voiture en mouvement, s’élève à des valeurs d’un million ou plus. Alors que ces valeurs restent inatteignables sans le recours à des modèles de la turbulence, une machine telle que le Blue Gene/L permet néanmoins de s’y approcher de manière significative en atteignant des valeurs aussi élevées que Re = 100’000. Il s’agit là d’un régime exhibant des phénomènes physiques fondamentalement différents à ceux des nombres de Reynolds inférieurs, permettant une compréhension de nouveaux aspects de la turbulence. 8

Mesure sur BG/L Référence

7

Performance

6 5 4 3 2 1 1024 2048

4096

Nombre de cœurs

8192

fig. 2 – Performance d’exécution du logiciel SPECULOOS sur le Blue Gene/L La figure 2 met en évidence la performance du logiciel SPECULOOS lors d’une simulation de la cavité entraînée sur le Blue Gene/L. Cette étude de performance est régie par une vision forte du parallélisme, gardant le nombre d’éléments constant d’une exécution du programme à l’autre. Le nombre d’éléments est choisi de manière à n’attribuer qu’un seul élément à chaque cœur lors de l’utilisation des 8192 cœurs de la machine. Il s’agit là d’un test extrêmement exigeant pour un programme parallèle, permettant de mettre en évidence un éventuel défaut dans la stratégie de parallélisation. Le nombre de cœurs varie d’une valeur de 1024 à une valeur de 8192. La courbe affiche une mesure de la performance du programme, donnée par l’inverse du temps d’exécution, et renormalisée par le temps d’exécution sur 1024 cœurs. L’équation 2 permet d’interpréter cette courbe de la manière suivante. Si les composantes rédhibitoires à la parallélisation, T(séquentiel) et T(communication), sont nulles, la valeur de performance est égale au nombre de cœurs p divisé par 1024, tel qu’il est indiqué par la courbe pointillée sur le graphique. Pour des raisons développées dans le chapitre suivant, les anciennes versions de SPECULOOS possédaient des composantes non parallélisables difficiles à identifier, menant à un très grand écart entre les courbes de parallélisation mesurées et la valeur idéale représentée par la courbe pointillée. Une fois ces composantes éliminées, on voit sur la figure 2 que l’écart en question s’est réduit à une valeur d’environ 20%. Des mesures ont montré que cet écart incombe entièrement aux temps de communication, réfléchissant une perte incontournable et inhérente au processus de parallélisation. À ce stade, le

logiciel SPECULOOS exploite donc de façon souhaitable les ressources offertes par la machine Blue Gene/L.

Parallélisme extrême la règle du zéro-séquentiel Trois étapes sont usuellement parcourues pour améliorer la performance parallèle d’un programme. La première consiste à établir le profil de complexité et une estimation théorique du gain de la parallélisation, et la deuxième à déterminer expérimentalement les éventuels fautifs d’une mauvaise performance, en choisissant parmi le déséquilibre des charges, le temps de communication et les composantes séquentielles du programme. Durant la troisième étape, on étudie finalement si les problèmes détectés peuvent être corrigés dans le laps de temps à disposition pour le projet. Il s’est avéré dans le cas de SPECULOOS que la partie la plus difficile de ce procédé consiste à en respecter la rigueur et à éviter les conclusions hâtives. En effet, la plupart de l’analyse du code s’est effectué sous l’avis à priori que la composante séquentielle du code devait être nulle. La décomposition spatiale du problème et l’attribution aux cœurs étant simples, autant en théorie que dans l’implantation du code, il semblait inconcevable qu’une partie du programme soit exécutée de manière séquentielle. Générant une confusion nourrie en plus par une analyse de complexité incomplète, cet avis hâtif a longuement empêché de tirer la conclusion évidente: le code possédait bel et bien une composante séquentielle, invisible sur dix cœurs, presque invisible sur cent cœurs, mais réduisant à néant les efforts de parallélisation dès que l’on utilisait plusieurs milliers de cœurs. La partie du code en cause se manifestait lors de la détermination des éléments attribués à chaque cœur. Cette partie est courte, mais non parallélisable, puisqu’elle consiste à effectuer un nombre d’opérations logiques proportionnel au nombre total de cœurs. En outre, cette partie était ré exécuté à chaque cycle temporel, alors qu’il aurait suffi de ne l’exécuter qu’une seule fois et d’en sauvegarder le résultat. Afin de discuter de l’impact de cette composante séquentielle sur la performance du programme, admettons que l’attribution des éléments aux cœurs prenne un millième du temps d’exécution d’un cycle temporel du programme. L’auteur original de la parallélisation de SPECULOOS a donc renoncé au calcul unique et préalable de cette opération en appliquant correctement un des principes fondamentaux du génie logiciel, selon lequel uniquement les parties coûteuses en temps d’exécution sont rendues efficaces, alors que les autres parties sont gardées aussi simples que possible. Cette décision s’avère par contre fâcheuse dans le contexte du parallélisme extrême. Alors que la charge de calcul de chaque cœur est divisée par le nombre de cœurs pour les composantes parallélisables, elle reste constante pour les composantes séquentielles. Sur mille cœurs, la charge relative de notre opération non parallélisée est donc démultipliée d’un facteur mille, et cette contribution originalement négligeable finit par prendre la moitié du temps d’exécution du programme. La leçon tirée de cette expérience se formule sous forme de la règle du zéro-séquentiel, demandant que le temps séquentiel investi dans un programme parallélisé doive être entièrement nul. Il ne suffit pas de le réduire à une taille FI 5 – 26 mai 2009 – page 5


Parallélisme extrême sur le Blue Gene/L considérée comme négligeable sur les ordinateurs contemporains, car leur importance relative croît dans le temps avec le nombre de cœurs des machines parallèles. Quoique simple à comprendre, cette règle n’est pas simple à utiliser, car elle va à l’encontre de l’intuition du programmeur qui se base sur la séparation entre parties importantes et négligeables d’un code. Une manière élégante de la mettre en œuvre tout en évitant des omissions consiste à adopter une vision locale du parallélisme dans laquelle chaque cœur n’a conscience que des partenaires avec lesquels il entre en contact. Pour garantir le succès de cette stratégie, on omettra simplement de fournir aux cœurs toute information globale, telle que le nombre de cœurs présents dans la machine parallèle. Si l’algorithme marche sans cette information, il y a de fortes chances qu’il survive sans trop de difficultés au transfert sur les futures générations de machines parallèles.

L’avenir du calcul scientifique: plate-forme généraliste ou matériel dédié? Les nœuds du Blue Gene/L sont constitués de processeurs généralistes, ou autrement dit, de machines à tout faire. Du point de vue de leur architecture, ces processeurs sont similaires à ceux que l’on trouve par exemple dans un ordinateur de bureautique. Aux processeurs généralistes s’opposent les unités de calcul dédiées à une tâche particulière. On peut mentionner comme exemple les cartes graphiques destinées au calcul du rendu d’objets géométriques à l’écran. Il peut sembler comme un gâchis d’utiliser du matériel généraliste dans un but aussi spécifique que le calcul scientifique. Cependant, une telle utilisation est devenue très commune grâce à l’évolution impressionnante de la performance des processeurs et au coût modeste du matériel, rendu possible par leur vente en grand nombre dans le domaine de la bureautique et de l’utilisation domestique. Depuis que la performance brute des processeurs a cessé son augmentation rapide, les processeurs dédiés sont cependant réapparus sur le marché comme concurrents sérieux. L’article de Francis Lapique, Les GPU ne sont pas uniquement faits pour les consoles de jeux du FI2/09 (ditwww.epfl.ch/SIC/SA/SPIP/ Publications/spip.php?article1715) montre par exemple que les cartes graphiques peuvent être utilisées pour certains types de calcul scientifique et permettent de gagner un facteur 10 ou même 100 en termes de coût financier et de consommation d’énergie, comparé aux processeurs généralistes. Une autre plate-forme de calcul dédiée dont les performances s’approchent de celles des cartes graphiques est proposée par IBM sous la forme du processeur Cell, le processeur utilisé à l’intérieur de la console de jeux PlayStation 3. L’incroyable performance des cartes graphiques, du Cell et d’autres solutions de calcul dédiées a mené à une véritable ruée vers l’or dans le domaine du calcul scientifique, dont l’ampleur initiale s’est néanmoins estompée face aux difficultés rencontrées à la programmation d’un tel matériel. Étant donné l’actualité de ce sujet, nous allons donc exposer ici les arguments qui ont été soulevés, lors du développement de SPECULOOS, en faveur et en défaveur des plates-formes dédiées, et qui ont finalement mené à la décision de préserver ce logiciel sous une forme généraliste. FI 5 – 26 mai 2009 – page 6

Les deux principales difficultés qui se posent lors de la programmation sur du matériel dédié sont le besoin d’adresser des questions techniques de bas niveau ainsi que le manque de portabilité d’une plate-forme à l’autre. Alors que les machines généralistes proposent des couches d’abstraction permettant de programmer avec une certaine facilité et garantissant une vision unifiée de la machine d’un producteur de matériel à un autre, le matériel dédié demande une compréhension des particularités techniques du matériel, ce qui rend impossible le transfert vers le matériel d’un autre producteur. Un bon exemple est fourni par les mécanismes de transfert des données entre la mémoire principale d’une machine et le processeur. Alors qu’une machine généraliste gère automatiquement ce transfert en se basant sur des techniques de mémoire cache, la plupart des machines dédiées demandent au programmeur d’intervenir manuellement dans ce processus. Cette gestion explicite de la mémoire peut mener à des gains de performance très importants, mais elle détourne le programmeur de son but initial, le calcul scientifique, dans un domaine hautement technique. À première vue, autant les cartes graphiques que les processeurs Cell offrent une structure assez semblable à celle du Blue Gene/L, consistant d’une multitude d’unités de calcul petites, mais efficaces. Il semble donc naturel de retenter l’astuce de la parallélisation en décomposition spatiale, par l’attribution d’un certain nombre d’éléments à chaque unité de calcul. L’impossibilité d’une telle entreprise se manifeste très vite à travers le fait que SPECULOOS peut n’être ni compilé ni exécuté, ni sur une unité de calcul du Cell, ni sur une carte graphique. Les cartes graphiques ne peuvent être programmées qu’à travers un langage de programmation dédié à la machine, comme le langage CUDA pour les cartes graphiques de NVIDIA. On serait donc obligé d’entièrement reprogrammer le programme, ce qui est peu encourageant pour une application comme SPECULOOS qui a pris quinze ans à être écrite. Sur le Cell, la difficulté est encore plus monumentale. Afin d’exploiter le potentiel de cette machine, une partie importante du travail doit être transférée à des unités de calcul du processeur qui portent le nom de SPE (Synergistic Processing Element). Ces SPE se caractérisent par leur très grande vitesse de calcul, mais aussi par la très petite taille de leur mémoire. Bien qu’il soit imaginable de transférer la mémoire de travail associée à un élément spectral sur l’un de ces SPE, il n’est pas possible de transférer le code de SPECULOOS dans son intégralité sur un SPE, car le code lui-même dépasse largement la taille de la mémoire disponible! Il est par conséquent impossible, ou en tout cas très difficile, de faire exécuter par un SPE l’intégralité des opérations requises pour un élément spectral. L’utilisation de matériel dédié impose donc une approche hybride dans laquelle quelques parties du code uniquement, jugées cruciales, sont confiées à un SPE du Cell, ou encore à une carte graphique. SPECULOOS par exemple invoque beaucoup de fonctions d’algèbre linéaire de base, qui sont implantées dans des librairies comme BLAS et LAPACK. On pourrait donc espérer un gain de performance en se référant à des versions de ces librairies qui s’exécutent sur des plates-formes dédiées. De nombreuses difficultés doivent par contre être surmontées avant que cette fin soit atteinte, telles que la limitation de mémoire sur un SPE du Cell, la limitation de bande passante connectant une carte graphique


Parallélisme extrême sur le Blue Gene/L à la mémoire centrale, le non-respect des règles de standard pour l’exécution de calculs en virgule flottante pour le Cell et la carte graphique, le manque de précision des calculs en virgule flottante pour les cartes graphiques, et bien d’autres. Le travail de programmation à effectuer doit être considéré comme particulièrement coûteux, car il ne peut être effectué que par une personne ou une équipe de personnes hautement qualifiée dans le domaine d’application du logiciel considéré, dans les domaines de l’analyse numérique, du génie logiciel et de la programmation proche de la machine. Cette discussion montre que le choix entre une plateforme généraliste et un matériel dédié revient finalement à une question de répartition des coûts. Alors que dans le premier cas de fortes sommes d’argent sont investies dans l’achat de matériel, c’est le travail de personnel qualifié qui s’avère particulièrement coûteux dans le second cas. En outre, au-delà des considérations de prix, le choix de la plate-forme de programmation aura un impact sur le type et sur la qualité de recherche menés, puisqu’une plate-forme généraliste libère le programmeur de beaucoup de tâches techniques et accorde plus de temps au sujet scientifique en question. Le travail avec ces différentes plates-formes de calcul à haute performance nous a donc fait clairement pencher en faveur du Blue Gene/L pour le code SPECULOOS. De manière générale, le Blue Gene/L et des machines semblables s’avèrent

être des outils de travail indispensables pour maintenir le rythme imposé par la recherche de pointe dans un institut tel que l’EPFL.

Remerciements La version massivement parallèle du code SPECULOOS est le résultat d’un travail pluridisciplinaire de la part de nombreux intervenants. Nous mentionnerons en particulier le soutien théorique et les connaissances détaillées du code SPECULOOS offerts par Michel Deville et Roland Bouffanais, ainsi que le travail d’analyse de code, d’étude et de mesure de performance fourni par Ralf Gruber, Sohrab Kehtari, Vincent Keller et Christoph Bosshard. En outre, l’exploitation efficace du BlueGene/L n’a été possible que grâce à un soutien intensif de la part de l’équipe HPC du Domaine IT, et en particulier grâce aux conseils avisés de Christian Clémençon.

Référence [1] Le logiciel libre OpenSPECULOOS: www.sourceforge. net/projects/openspeculoos/ n

Programme des cours organisés par le Domaine IT de l’EPFL

Renseignements (les matins des lu, ma & ve) Daniele.Gonzalez@epfl.ch ✆ 021/69 353 14 Fax: 021/69 322 20

Ces cours sont ouverts à tous, membres ou non de l’EPFL. Pour le personnel de l’EPFL, le DIT se charge des frais de cours. Les descriptifs des cours sont sur Internet: dit.epfl.ch/formation Vous pouvez nous atteindre à l’adresse: cours.dit@epfl.ch

Renseignements (tous les matins) Josiane.Scalfo@epfl.ch ✆ 021/69 322 44 Fax: 021/69 322 20

CONDITIONS D’INSCRIPTION

En cas d’empêchement à suivre le(s) cours, l’élève avertira le Domaine IT au minimum une semaine à l’avance (sauf cas exceptionnel), faute de quoi le DIT se réserve le droit de facturer à son unité les frais occasionnés pour le cours. Une confirmation parviendra à l’élève avant le(s) cours. S’il est déjà complet, l’élève sera informé de suite et son nom placé en liste d’attente. Dès qu’un cours identique sera fixé, il recevra un courriel l’informant des nouvelles dates. Le DIT se réserve le droit d’annuler un cours si le nombre minimum de 4 participants n’est pas atteint ou pour des raisons indépendantes de sa volonté. Aucune compensation ne sera due par le DIT.

introduction au poste de travail Nom du cours système n° date(s) Nouveau Le B.A.-BA... de la messagerie et d’Internet sur PC 09-0303 27.05.09 Mac OS X optimiser la gestion de vos dossiers et documents 09-0335 28.05.09 rapido: Mail et Carnet d’adresses 09-0336 03.06.09 Windows Vista rapido l’essentiel des nouveautés 09-0209 17.06.09

horaire

1/2 j.

13:30 - 17:00 1 08:30 - 12:00 1 08:30 - 10:30 1 08:30 - 10:30 1

FI 5 – 26 mai 2009 – page 7


Formation

Nom du cours LabVIEW Basics I Basics II Basics II Real-Time

Acquisition et traitement de données système

date(s)

09-0036 09-0034 09-0037 09-0035

22 au 24.06.09 28 & 29.05.09 25 & 26.06.09 17 au 19.06.09

horaire

1/2 j.

08:30 - 17:00 08:30 - 17:00 08:30 - 17:00 08:30 - 17:00

6 4 4 6

applications de gestion de l’EPFL Nom du cours système n° date(s) horaire 1/2 j. Accréditation Accréditation EPFL 09-0267 02.06.09 13:30 - 17:00 1 Service financier et CCSAP Comptabilité EPFL, Infocentre, notes de frais 09-0045 24, 25 & 29.06.09 08:30 - 12:00 3 Comptabilité EPFL, Infocentre, notes de frais 09-0046 02, 03 & 07.09.09 08:30 - 12:00 3

Nom du cours Access 2007 2-avancé FileMaker Pro 9 5-développement d’une base de données MySQL prise en main et développement

Nom du cours Nouveau EndNote création et intégration de fichiers de références Word 2007 rapido: publipostage (mailing) transition et nouveautés transition et nouveautés Word Mac 2004 ou PC 2003 création de modèles personnalisés les longs documents

FI 5 – 26 mai 2009 – page 8

date(s)

horaire

1/2 j.

09-0161

15, 22 & 24.06.09 08:30 - 12:00 3

09-0181

04, 09 & 11.06.09 13:30 - 17:00 3

09-0285

08 & 09.10.09 08:30 - 17:00 4

dessin - image système n°

Nom du cours Illustrator CS3 introduction PhotoShop CS3 retouche d’images

Nom du cours MindManager Pro 7 MindManager Pro 7 Outlook 2007 calendrier, tâches et note messagerie et contacts Project 2007 1-introduction VisualMind VisualMind

base de données système n°

date(s)

horaire

1/2 j.

09-0216

22 & 24.06.09 13:30 - 17:00 2

09-0257

16, 18, 23 & 25.06.09 13:30 - 17:00 4

édition système n°

date(s)

horaire

1/2 j.

09-0300

12 & 16.06.09 08:30 - 12:00 2

09-0225 09-0207 09-0210

03.06.09 08:30 - 10:30 1 27.05.09 08:30 - 12:00 1 22.06.09 13:30 - 17:00 1

09-0261 09-0235

23.06.09 08:30 - 12:00 1 09 & 11.06.09 08:30 - 12:00 2

organisation - planification système n°

date(s)

horaire

1/2 j.

09-0226

09.06.09 08:30 - 12:00 1

09-0214 09-0213

11.06.09 08:30 - 12:00 1 04.06.09 08:30 - 12:00 1

09-0227

15 & 17.06.09 13:30 - 17:00 2

09-0228

10.06.09 13:30 - 17:00 1


Formation

Nom du cours PowerPoint 2007 rapido: 3-diaporama rapido: transition et nouveautés PowerPoint Mac 2004 ou PC 2003 rapido: 1-dessin et objets rapido: 2-modèles et masques rapido: 3-diaporama

Nom du cours AJAX développement d’applications Web 2.0 C++ Nouveau templates et STL Nouveau C++ programming (in English) A Comprehensive Hands-On Introduction Nouveau Google API utiliser les Google APIs dans vos pages Web HPC (in English) DIT HPC servers usage MPI (in English) an introduction to parallel programming PHP5 développer un site Web Dynamique Nouveau Spring 2.5 le framework Spring 2.5 Nouveau Struts 2 développer des applications Web MVC

Nom du cours Linux 4-sécurité

Nom du cours Excel 2007 1-introduction 2-feuilles de calcul base de données rapido: les graphiques rapido: les tableaux croisés dynamiques rapido: transition et nouveautés VBA 1-introduction Excel Mac 2004 ou PC 2003 base de données rapido: les tableaux croisés dynamiques

présentation système n°

09-0262 09-0263 09-0264

12.06.09 08:30 - 10:30 1 19.06.09 08:30 - 10:30 1 26.06.09 08:30 - 10:30 1

date(s)

horaire

1/2 j.

09-0286

19 au 21.10.09 08:30 - 17:00 6

09-0283

01 & 02.10.09 08:30 - 17:00 4

09-0279

08 au 12.06.09 08:30 - 17:00 10

09-0290

15 & 16.06.09 08:30 - 17:00 4

09-0298

17.06.09 08:30 - 17:00 2

09-0270

22 au 25.06.09 08:30 - 17:00 8

09-0284

05 au 07.10.09 08:30 - 17:00 6

09-0282

22 au 24.09.09 08:30 - 17:00 6

09-0281

02 au 04.09.09 08:30 - 17:00 6

09-0287

tableur système n°

09-0197 09-0198 09-0200 09-0199 09-0201 09-0208 09-0289

1/2 j.

05.06.09 08:30 - 10:30 1 19.06.09 08:30 - 10:30 1

système système n°

horaire

09-0241 09-0238

programmation système n°

date(s)

09-0195 09-0196

date(s)

horaire

1/2 j.

26 au 28.10.09 08:30 - 17:00 6

date(s)

horaire

03.06.09 09, 11 & 16.06.09 23.06.09 18.06.09 25.06.09 08.06.09 31.08 & 01.09.09

1/2 j.

13:30 - 17:00 13:30 - 17:00 13:30 - 17:00 13:30 - 15:30 13:30 - 15:30 13:30 - 15:30 08:30 - 17:00

1 3 1 1 1 1 4

29.05.09 08:30 - 12:00 1 05.06.09 08:30 - 10:30 1

FI 5 – 26 mai 2009 – page 9


Formation www - web système n°

Nom du cours Dreamweaver CS3 HTML et feuilles de styles Inform création de formulaires EPFL Jahia 4 création de sites Web EPFL

date(s)

horaire

1/2 j.

09-0184

08 & 10.06.09 08:30 - 12:00 2

09-0248

25.06.09 08:30 - 12:00 1

09-0190

02 & 04.06.09 08:30 - 12:00 2

Y Y Y Y Y Y Y Y Y Y Y

C

Y ours d été Y Y Y Y Y Y Y Y Y Y Y Y

Semaine Nom du cours LaTeX (français-English) les bases pour un travail de secrétariat LabVIEW DAQ FileMaker Pro 9 de l’intro aux scripts Jahia 4 création de sites web EPFL Le B.A.-BA... de la messagerie et d’Internet sur PC Excel 2007 VBA 2-avancé

27 - du 29 juin au 3 juillet système

date(s)

horaire

1/2 j.

09-0269 29, 30.06, 02 & 03.07.09 08:30 - 17:00 8 09-0038

29.06 au 01.07.09 08:30 - 17:00 6

09-0176

29.06 au 02.07.09 08:30 - 11:00 4

09-0311

29.06 au 01.07.09 13:00 - 15:30 3

09-0304

30.06.09 08:30 - 12:00 1

09-0288

02 & 03.07.09 08:30 - 17:00 4

Nouveau

Semaine Nom du cours Word 2007 de l’intro aux différentes mises en page Windows Vista l’essentiel des nouveautés Nom du cours

système

date(s)

horaire

1/2 j.

09-0316

06 au 09.07.09 13:00 - 15:30 4

09-0322

10.07.09 08:30 - 11:00 1

Semaine 29 - du 13 au 17 juillet

Word Mac 2004 ou PC 2003 de l’intro aux différentes mises en page Accréditation Accréditation EPFL Word 2007 transition et nouveautés FI 5 – 26 mai 2009 – page 10

28 - du 6 au 10 juillet

système

date(s)

horaire

1/2 j.

09-0317

13 au 16.07.09 13:00 - 15:30 4

09-0333

14.07.09 08:30 - 12:00 1

09-0323

15 & 17.07.09 08:30 - 11:00 2


Formation

Nom du cours Mac OS X de la gestion des dossiers au Mail Dreamweaver CS3 introduction Project et MindManager 2007 introduction LabWindows/CVI I LabWindows/CVI I Excel 2007 transition et nouveautés

Nom du cours Excel 2007 de l’intro à la feuille de calcul TestStand I TestStand I PowerPoint 2007 de l’intro au diaporama Illustrator CS3 introduction PowerPoint Mac 2004 ou PC 2003 de l’intro au diaporama

Semaine 30 - du 20 au 24 juillet système

Nom du cours Flash CS3 introduction Excel 2007 transition et nouveautés

09-0307

20 au 24.07.09 13:00 - 15:30 5

09-0319

20 au 23.07.09 13:00 - 15:30 4

09-0039

22 au 24.07.09 08:30 - 17:00 6

09-0324

23.07.09 08:30 - 11:00 1

date(s)

horaire

1/2 j.

09-0308

27 au 30.07.09 08:30 - 11:00 4

09-0040

27 au 29.07.09 08:30 - 17:00 6

09-0321

27 au 29.07.09 13:00 - 15:30 3

09-0309

27 au 29.07.09 13:00 - 15:30 3

09-0329

29 au 31.07.09 08:30 - 11:00 3

Semaine 33 - du 10 au 14 août système

date(s)

horaire

1/2 j.

03 & 04.08.09 13:00 - 15:30 2 05 au 07.08.09 08:30 - 11:00 3 06 & 07.08.09 08:30 - 11:00 2

date(s)

horaire

1/2 j.

09-0175

10 au 21.08.09 08:30 - 12:00 10

09-0332

10 au 13.08.09 13:00 - 16:30 4

09-0310

10 au 13.08.09 13:00 - 15:30 4

Semaine 34 - du 17 au 21 août système

1/2 j.

20 & 21.07.09 08:30 - 11:00 2

Semaine 32 - du 3 au 7 août Nom du cours système n° Word 2007 transition et nouveautés 09-0326 EndNote création et intégration de fichiers de références 09-0325 Inform création de formulaires EPFL 09-0314

Nom du cours Cours de base apprentis PhotoShop CS3 retouche d’images InDesign CS3 introduction

horaire

09-0315

Semaine 31 - du 27 au 31 juillet système

date(s)

date(s)

horaire

1/2 j.

09-0330

17 au 21.08.09 13:00 - 15:30 5

09-0328

17.08.09 08:30 - 11:00 1

FI 5 – 26 mai 2009 – page 11


Formation FileMaker Pro 9 de l’intro aux scripts Outlook 2007 de la messagerie au calendrier LabVIEW FPGA

Nom du cours LabVIEW Basics I Access 2007 1-introduction Linux 3-administration et réseau Jahia 4 création de sites web EPFL Word 2007 les longs documents Excel Mac 2004 ou PC 2003 de l’intro à la feuille de calcul LabVIEW Basics II Windows Vista l’essentiel des nouveautés Accréditation Accréditation EPFL

09-0331

17 au 20.08.09 13:00 - 15:30 4

09-0320

19 au 21.08.09 08:30 - 11:00 3

09-0337

19 au 21.08.09 08:30 - 17:00 6

Semaine 35 - du 24 au 28 août système

date(s)

horaire

1/2 j.

09-0338

24 au 26.08.09 08:30 - 17:00 6

09-0306

24 au 27.08.09 08:30 - 12:00 4

09-0280

24 au 27.08.09 08:30 - 17:00 8

09-0312

24 au 26.08.09 08:30 - 11:00 3

09-0318

24 au 27.08.09 13:00 - 15:30 4

09-0313

24 au 27.08.09 13:00 - 15:30 4

09-0339

27 au 28.08.09 08:30 - 17:00 4

09-0327

28.08.09 08:30 - 11:00 1

09-0334

28.08.09 08:30 - 12:00 1

INSCRIPTION POUR LES COURS ORGANISÉS PAR LE DIT A retourner à Josiane Scalfo ou à Danièle Gonzalez, DIT-EPFL, CP 121, 1015 Lausanne 15 Je, soussigné(e) Nom:_____________________________________ Prénom:_ ___________________________ E-Mail:________________________________________________ Tél.: _______________________________ Fonction:______________________________________________ Institut: _______________________________________________ Faculté:_____________________________ Adresse:_ ___________________________________________________________________________________ m’engage à suivre le(s) cours dans son (leur) intégralité et à respecter l’horaire selon les conditions d’inscription: Nom du cours

N° du cours

N° cours de remplacement

Date du cours

__________________________________________________________________________________________ __________________________________________________________________________________________ Date:_ ______________________________________________

signature:___________________________

Autorisation du chef hiérarchique:_ _____________________________________________________________ Nom lisible:____________________________________________

signature:_ _________________________

Description ou titre des cours que je souhaite voir organiser par le DIT:_ ______________________________________ __________________________________________________________________________________________

FI 5 – 26 mai 2009 – page 12


Parfaire une barre de planning Visio en 20 minutes chrono Jacqueline Frey, arobasque, frey@arobasque.ch

Rappelez-vous;

en mars dernier votre barre de planning Visio vous avait valu moult éloges lors de la présentation de votre projet. S’il vous reste encore un peu de temps, nous allons aujourd’hui la fignoler un peu – mais pas trop non plus, car comme dirait un très cher ami à moi: c’est dans le moins qu’on trouve le plus.

Zoomer sur une partie de la barre de planning = créer une barre de planning

étendue Si une phase du projet doit être plus détaillée que les autres, utilisez la barre de planning étendue. Celle-ci permet d’étendre un segment d’une barre de planning existante comme une deuxième barre de planning pour afficher plus de détails. Pour pouvoir utiliser la fonctionnalité barre de planning étendue, il faut bien entendu qu’une barre de planning figure déjà sur la page de dessin. J’espère donc que vous avez conservé votre exercice du mois précédent: Présenter un projet avec Visio en 24 minutes chrono – ditwww.epfl.ch/ SIC/SA/SPIP/Publications/spip.php?article1724. z Faites glisser depuis le gabarit la forme Barre de planning étendue sur la page (par exemple en dessous de la barre de planning figurant déjà sur la page). z Dans la boîte de dialogue Configurer la barre de planning, indiquez les options souhaitées pour la barre de planning étendue dans les onglets Période et Format de l’heure. Bien entendu, les dates de début et de fin doivent se situer dans la période de la barre de planning d’origine:

w des jalons et intervalles communs. Ils sont synchronisés automatiquement; si vous les modifiez sur une barre de planning, ils changent également sur l’autre. Remarquez que par défaut la barre de planning étendue reprend la même apparence que la barre de planning d’origine. z Mettez en forme et configurez la barre de planning étendue en cliquant sur celle-ci à l’aide du bouton droit de la souris. Choisissez la commande Configurer l’intervalle et tapez une description:

z Toujours à l’aide du bouton droit de la souris, choississez la commande Définir le type d’intervalle pour modifier l’apparence de la barre étendue :

z La barre de planning étendue apparaît sur la page de dessin et affiche les éléments suivants: w des traits en pointillés gris indiquant la section de la barre de planning d’origine représentée par la barre de planning étendue; sur la barre de planning principale ces traits pointillés se terminent par de petits losanges jaunes. Faites-les glisser pour modifier l’étendue de la section qui doit être représentée.

z Complétez la barre étendue en ajoutant des jalons et des intervalles. Si souhaité, modifiez les paramètres de chacun d’eux à l’aide du bouton droit de la souris. FI 5 – 26 mai 2009 – page 13


Parfaire une barre de planning Visio en 20 minutes chrono

Ajouter un marqueur de date actuelle

z Si la barre bleue représentant la durée écoulée se trouve en avant-plan par rapport aux jalons, modifiez l’ordre de ces différents éléments.

Ajouter un marqueur de durée écoulée

z Depuis le gabarit, faites glisser le Marqueur Aujourd’hui sur votre barre de planning (pas celle qui est étendue... l’autre). z Pour modifier le texte d’exemple Aujourd’hui, sélectionnez le marqueur puis tapez simplement le nouveau texte. z Depuis le gabarit, faites glisser l’élément Durée écoulée sur votre barre de planning (pas celle qui est étendue... plutôt l’autre). Comme les deux barres sont synchronisées, la durée écoulée sera représentée sur les deux barres.

w Demandez l’affichage de la barre d’outils Action (Affichage > Barre d’outils). w Sélectionnez les jalons à l’aide de la touche CTRL. w Dans la barre d’outils Action, cliquez sur le bouton Mettre au premier plan.

J’espère que cet exercice vous aura donné envie d’utiliser Visio et peut-être d’en savoir plus... A bientôt ! n FI 5 – 26 mai 2009 – page 14


du 7 mai 2009 Jacqueline.Dousson@epfl.ch, Domaine IT

Les

ForumIT sont l’occasion pour le DIT de faire l’état des lieux de certaines de ses prestations et de faire connaître des nouveaux projets à un public de responsables informatique de l’EPFL. Voici un résumé des présentations de ce ForumIT de printemps.

IT@EPFL, survol des six derniers mois

Jean-Claude Berney

HPC (calcul haute performance)

Dans le but de maîtriser les besoins, une nouvelle stratégie de financement HPC a été mise en place à l’EPFL, basée sur une hiérarchie des infrastructures de calcul où le rapport financement central/local varie d’une catégorie à l’autre (voir l’article Stratégie de financement HPC à l’EPFL, dans le FI3/2009, ditwww.epfl.ch/SIC/SA/SPIP/Publications/spip. php?article1581). Le projet CADMOS (Center for Advanced Modelling System) prend forme; sur le modèle du CIBM, cette mise en commun des ressources (cantons de Vaud et de Genève, EPFL) devrait permettre d’assurer l’après BlueGene. La problématique des salles serveurs devient préoccupante: on arrive à saturation des installations existantes du point de vue logistique (refroidissement, alimentation); la construction d’un data center central pourrait être envisagée.

Crédits IT centraux

Rappel: ils sont réservés aux infrastructures pour l’enseignement (renouvellement de salles et logiciels); cette année six demandes sont en cours d’analyse, elles seront acceptées moyennant quelques coupures.

Achats

Le règlement des achats a été mis à jour, ainsi qu’un guide des achats spécifiques aux achats IT.

Réseau

Les points forts de ces 6 mois ont été la connexion à 1Gbit pour l’IMT de Neuchâtel et la mise en service du nouveau bâtiment des Sciences de la vie. Le DIT est impliqué également dans les nouvelles constructions (Rolex Learning Center, logements pour étudiants, quartier de l’innovation) où il sera en charge de la gestion du réseau informatique.

Sécurité et disponibilité des services

critiques De plus en plus de services critiques sont connectés à un répartiteur de charges (voir l’article Server Load Balancing, le réseau s’en charge, dans le FI6/2008, ditwww.epfl.ch/SIC/ SA/SPIP/Publications/spip.php?article1486). Un nouveau serveur VPN a été mis en service; le protocole PPTP, n’offrant qu’un faible niveau de sécurité, n’est plus supporté sur ce nouveau serveur. Certains PDA ne supportant

pas encore L2TP/IPSec, l’ancien serveur VPN reste accessible pendant quelques mois (voir l’article Un nouveau serveur VPN, FI3/2009, ditwww.epfl.ch/SIC/SA/SPIP/Publications/ spip.php?article1718).

Stockage

Le cahier des charges pour le renouvellement de l’infrastructure NAS du DIT a été publié.

Virtualisation

232 machines virtuelles sont aujourd’hui hébergées au DIT dont 69 serveurs de Faculté.

Messagerie

z Seuls les protocoles sécurisés sont autorisés depuis décembre 2008 (MAPI, IMAPS, POPS). z Les utilisateurs peuvent consulter l’historique de leur consommation disque: https://ewa.epfl.ch/tools. z Un audit a donné un avis positif sur l’infrastructure Exchange.

Active Directory

D’ici quelques semaines, toutes les facultés seront intégrées dans l’outil de synchronisation MIIS.

MyPrint

Depuis la mise en place du système de comptabilisation (15 septembre 2008), 900’000 pages ont été imprimées sur 70 imprimantes installées. La répartition des responsabilités entre DIT (gestion du logiciel et des serveurs), CAMIPRO (monétique) et service de reprographie (choix des modèles multi-fonctions) a été clairement établie. La politique d’impression sera définie dans les prochains mois.

Postes des services centraux

La solution Atempo Livebackup est proposée aux utilisateurs, pour sauvegarder leur poste en temps réel.

KIS

z Un nouveau CMS (voir article Content Management System de l’EPFL, serez-vous tous contents ?, du FI4/2009, ditwww.epfl.ch/SIC/SA/SPIP/Publications/ spip.php?article1743) sera mis en place fin 2009, en même temps qu’une nouvelle charte graphique actuellement au concours. z La solution GED de Alfresco se déploie : une version de base pour secrétariat standard et une solution en cours de développement pour le SAC. z SWITCH AAA: deux projets EPFL sont retenus, ils seront financés à 50% par Switch.

Services UNIX

Les annuaires OpenDirectory et Native LDAP seront mis en place pour les mondes Solaris et MacOSX. FI 5 – 26 mai 2009 – page 15


ForumIT du 7 mai 2009

PDA

La configuration des modèles les plus courants (pour synchronisation Exchange, connexion WiFi et client VPN) est publiée. Un wiki (wiki.epfl.ch/pda) est ouvert à tous pour échanger d’autres informations.

Infrastructure de backup centralisée

Aristide Boisseau

L’infrastructure de backup proposée par le DIT est en pleine évolution. Début 2009, elle était basée sur du matériel SUN, un master serveur et trois media serveurs, deux drives qui supportent le protocole NDMP, huit pour les autres protocoles. Environ 8 TB sont sauvegardés par jour (un peu plus de 50 % par le protocole NDMP). La nouvelle infrastructure, basée sur du matériel SUN plus récent, supportant une meilleure bande passante va permettre un meilleur service notamment par l'introduction du backup sur disque. Cet automne, le robot va être déplacé, afin de séparer géographiquement les moyens de stockage et sauvegarde, ce qui entraînera une indisponibilité d’une semaine pour les données sur cartouche.

Expérience de virtualisation au DIT

Jean-Claude de Giorgi, Eric Krejci, Christian Zufferey

Les quatre salles de cours du DIT sont chacune dédiée à un environnement système; pendant une même semaine, des cours différents se les partagent, ce qui induit des difficultés d’exploitation. La virtualisation des postes personnels de ces salles facilitera le déploiement des environnements, une machine virtuelle pourra être attribuée à chaque utilisateur qui retrouvera ses données personnelles pendant toute la durée du cours (même s’il est étalé sur des jours non consécutifs), et les salles ne seront plus obligatoirement dédiées à un système. La solution VMware View est tout à fait prometteuse même si certains détails restent à résoudre au niveau des clients View. Les performances pour l’utilisation des logiciels d’applica-

DIT-info Présentation de Julien Delasoie Julien Delasoie vient renforcer

l’équipe Infoscience et permettre ainsi d’accélérer le développement du module Curator qui facilitera le processus de soumission des chercheurs et le travail de suivi des bibliothécaires scientifiques. Julien, après avoir fait des études à la HEG de Sierre, a travaillé plusieurs années comme informaticien indépendant pour le compte de sa propre société. Spécialisé dans les outils modernes de développement comme Ruby on Rails ou Django (Python), Julien apporte ses précieuses compétences au KIS, où il sera en poste pour une année. Pierre.Mellier@epfl.ch, Domaine IT

FI 5 – 26 mai 2009 – page 16

tion sont tout à fait satisfaisantes. Cette expérience au DIT pourrait être étendue à d’autres salles de l’EPFL. VMware View est la solution VDI de VMware: VDI est un standard qui vise à séparer le bureau de l’utilisateur de la machine physique, il pourra ainsi accéder à son bureau depuis n’importe où. C’est un domaine en pleine évolution avec d’autres acteurs que VMware sur le marché. Dans la solution pilote déployée au DIT, une cinquantaine de machines virtuelles (Vista et XP) ont été déployées. Ces VM ont un disque de 36 GB, avec 2 GB de RAM. Ce déploiement a duré moins de 50 minutes. Les disques virtuels sont créés sur notre SAN. De plus, nous avons utilisé la technologie dite du linked Clone, qui nous permet d’économiser de manière significative de la place disque sur le SAN, ce qui signifie que la taille du disque virtuel passe ainsi à 2GB au lieu de 36.

L’insécurité se cache dans les URL

Martin Ouwehand

Rappel des consignes données dans l’article éponyme paru dans le FI4/2009, ditwww.epfl.ch/SIC/SA/SPIP/Publications/spip.php?article1745: z être attentif quand on copie/colle une adresse URL à ne pas y faire figurer des informations liées à des sessions authentifiées; z pour les sites Web: préférer les cookies, vérifier la durée de vie des jetons, empêcher les robots d’indexer des pages privées; z et quand c’est trop tard, www.google.com/webmasters/ tools pour nettoyer les caches de Google! Comme d’habitude les présentations sont accessibles sur la page: dit.epfl.ch/page55589.html. Rendez-vous à l’automne! Entre-temps n’hésitez pas à nous faire part de vos suggestions pour les thèmes à aborder ou la forme de ces rencontres biannuelles.n

flash informatique Les articles ne reflètent que l’opinion de leurs auteurs. Toute reproduction, même partielle, n’est autorisée qu’avec l’accord de la rédaction et des auteurs. Abonnement à la version électronique du FI en envoyant un courrier à: fi-subscribe@

listes.epfl.ch

Rédacteur en chef: Jacqueline Dousson, fi@epfl.ch Mise en page & graphisme: Appoline Raposo de Barbosa Comité de rédaction: Aristide Boisseau, Paulo de Jesus, Patrice Fumasoli, Jean-Damien Humair, Laurent Kling, Vittoria Rezzonico, François Roulet, Christophe Salzmann, Predrag Viceic & Jacques Virchaux Impression: Atelier de Reprographie EPFL Tirage: 4000 exemplaires Adresse Web: dit.epfl.ch/FI-spip Adresse: Domaine IT EPFL CP 121, CH-1015 Lausanne 15 Téléphone: +4121 69 32246 & 32247

ISSN 1420-7192


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.