5
12.06.2012
FlashInformatique.epfl.ch
p/a EPFL - Domaine IT - Station 8 - CH 1015 Lausanne - tél. +41 21 69 322 11
Actualités
page 15 Actualités Un nouveau centre de calcul à l’EPFL Aristide Boisseau
DIT-info z Nouveau technicien au DIT-SUP
16
Numéro spécial été 2012 – le document et les données z Appel aux articles
1
16
À votre service Réalisations de GED à l’EPFL Patricia Plaza Gruber
10
Logiciel libre Graphiques avec R Vittoria Rezzonico
2
Kickstart pour Ubuntu Benjamin Barras
12
Rencontres Mondiales du Logiciel Libre 2012 Benjamin Barras, Anne Possoz & Vittoria Rezzonico
15
Prochaines parutions No Délai de rédaction Parution SP
02.07.12
21.08.12
6
16.08.12
14.09.12
7
27.09.12
16.10.12
tout public public averti expert
Un nouveau centre de calcul à l’EPFL Aristide.Boisseau@epfl.ch, EPFL, Domaine IT, responsable infrastructure IT
New datacenter at EPFL, an innovative passive water cooling solution has been set up. Nouveau centre de calcul à l’EPFL, une solution innovante de refroidissement passif a été mise en place.
Introduction Un nouveau centre de calcul (datacenter) est entré en fonction en mai 2012 à l’EPFL. La puissance disponible pour les serveurs sera de 1MW, une grande partie de celle-ci sera dédiée aux clusters HPC (High Performance Computing) les plus gros consommateurs en terme de puissance. De l’espace et de la puissance sont également prévus pour les besoins d’hébergement IT des facultés ainsi que ceux des services centraux (DIT). Cet article présente les différentes étapes du projet et les technologies utilisées pour l’exploitation de ce nouvel outil IT à disposition de l’École.
Pourquoi un nouveau datacenter ? Les principales infrastructures IT actuelles de l’École — la zone souple du DIT (500kW) et la salle IT de SB (150kW environ) — ne suffisant plus à répondre à la
demande d’hébergement, la Direction de l’École a décidé d’investir dans un nouveau local IT en 2011. Cette nouvelle infrastructure, si les prévisions se confirment, devrait être totalement occupée d’ici 2014.
Historique Le projet a démarré au début 2011, la méthode de gestion de projet retenue fut celle développée par l’Administration fédérale suisse: HERMES, www.hermes.admin.ch. Ce projet avait un objectif double: z mise en place d’un datacenter de 1MW, z rénovation de la centrale technique du bâtiment IN. Le datacenter est situé dans le bâtiment INJ (salles INJ012 et INJ019), il occupe une surface de 250m2 environ et un volume d’environ 1000m3. Les locaux [INJ011, INJ012, INJ016] et INJ019 ont été regroupés pour obtenir ces deux nouvelles salles. Le nouveau datacenter a pris la place d’anciennes salles serveurs (INJ011, INJ016 et INJ019), d’où des contraintes supplémentaires pendant les travaux: faire le moins de poussière possible et perturber le moins possible le service IT déjà en place (pas de coupure de courant dans la mesure du possible, limiter la poussière). Les infrastructures (centrale technique) pour le datacenter occupent environ la même surface, soit 250m2. ../.. Suite page 6
Logiciel libre
Graphiques avec R Vittoria.Rezzonico@epfl.ch, EPFL - Coordination des systèmes d’information, coordinatrice CSE
R, a powerful environment for statistical computing, can be used to plot your data in a variety of formats. In this article, several easy examples will be shown. No need to be a statistician to appreciate the features of R! R, puissant environnement pour le calcul en statistiques, peut être utilisé pour afficher vos données dans une multitude de formats. Dans cet article, plusieurs exemples simples seront montrés. Pas besoin d’être statisticien pour apprécier les fonctionnalités de R!
Il est peut-être réducteur de vouloir utiliser R uniquement pour générer des graphiques, mais cela a plusieurs avantages: z une uniformisation de vos graphiques, idéal lorsqu’on rédige une thèse; z possibilité de manipuler les données (post-processing) avant de les afficher; z plusieurs formats de fichiers possibles en sortie, que vous écriviez vos documents avec LibreOffice, LaTeX ou que vous publiiez vos images sur le Web, R a un pilote de sortie adapté. Dans l’article R: un logiciel libre pour l’analyse de vos données [1] paru dans le numéro précédent du FI, vous avez découvert le logiciel R. Ici, je vais donner quelques exemples simples qui vous permettront de créer des graphiques professionnels que vous pourrez inclure dans vos documents.
Formats de fichiers
Fiche descriptive R
Domaine ✦ Statistique, représentations graphiques
Licence
langue
version
✦ GPLv2+
✦ multilingue
✦ 2.15
Autres alternatives libres ✦ NumPy/SciPy/MatPlotLib/Mayavi ✦ Octave ✦ GNUPlot ✦ Paquetages Tex, Tikz et PFG
Alternatives non libres ✦ S-Plus
Sites Web ✦ Projet et téléchargement: www.r-project.org
Plates-formes
R peut générer différents formats de fichiers via les graphic device drivers. On a deux types de pilotes: z ceux pour l’affichage à l’écran; z ceux pour écrire dans un fichier. L’affichage à l’écran se fait par défaut, lorsqu’on appelle une fonction d’affichage (par exemple, plot) sans rien spécifier auparavant. Nous allons nous intéresser aux device drivers pour écrire dans un fichier des graphiques générés destinés à être ensuite inclus dans d’autres documents.
Formats bitmap Le format le plus utilisé de cette catégorie est sans doute PNG. Pour écrire votre graphique dans un fichier PNG, il suffit d’entourer vos commandes d’affichage: png("fichier.png", width=400, height=400) # commandes d'affichage dev.off()
La largeur et la hauteur sont spécifiées en pixels par défaut.
Impressum Revue consacrée aux technologies de l’information, éditée par le Domaine IT de l’EPFL (DIT). Les articles n’engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d’autres entités). Toute reproduction, même partielle, n’est autorisée qu’avec l’accord de la rédaction et des auteurs.
2 flash informatique
Rédacteur en chef: Jacqueline Dousson, fi@epfl.ch Mise en page & graphisme: Appoline Raposo de Barbosa Comité de rédaction: Jean-Daniel Bonjour, Patrice Fumasoli, Florence Hagen, Laurent Kling, Julia Paolini, François Roulet, Christophe Salzmann, Richard Timsit & Predrag Vicei´c
Impression: Atelier de Reprographie EPFL Tirage: 4000 exemplaires Adresse Web: flashinformatique.epfl.ch Adresse: Domaine IT EPFL Station 8, CH-1015 Lausanne Téléphone: +41 21 69 32246 & 32247 Abonnement au FI par e-mail à: fi-subscribe@listes.epfl.ch
Graphiques avec R
Formats non bitmap (vectoriels) Si vous souhaitez inclure votre graphique dans un fichier TeX, vous avez trois drivers à votre disposition: postscript, pdf et tikz. Pour écrire votre graphique dans un PDF ou un fichier TeX, il suffit de faire pdf("fichier.pdf", width=5, height=5) # commandes d'affichage dev.off()
ou tikz("fichier.tex", width=4, height=4) # commandes d'affichage dev.off()
respectivement. La largeur et la hauteur sont spécifiées en pouces. D’autres drivers sont disponibles, citons WMF, PostScript, TIFF, BMP et je vous laisse explorer l’aide en ligne de R.
theme4pw <- c( rgb(149,193,26, maxColorValue = 255), rgb(179,207,94, maxColorValue = 255), rgb(207,224,154, maxColorValue = 255), rgb(231,239,208, maxColorValue = 255), rgb(229,229,229, maxColorValue = 255)) theme3b <- c( rgb(149,193,26, maxColorValue = 255), rgb(196,217,130, maxColorValue = 255), rgb(226,236,197, maxColorValue = 255)) theme3l <- c( rgb(149,193,26, maxColorValue = 255), rgb(176,209,83, maxColorValue = 255), rgb(136,136,136, maxColorValue = 255)
Camemberts Commençons par l’incontournable camembert tant demandé par les managers. Ignorons, pour un instant, l’aide en ligne de R qui nous dit que les camemberts sont à éviter:
Le driver Tikz Le driver Tikz mérite une attention particulière. Il nous permet de générer des fichiers que l’on peut inclure directement dans des documents LaTeX (voir aussi l’article TeX Live, distribution TeX/ LaTeX libre [2] de Benjamin Barras dans le FI 6/2011) de la façon suivante: \documentclass[11pt]{article}
Note: Pie charts are a very bad way of displaying information. The eye is good at judging linear measures and bad at judging relative areas. A bar chart or dot chart is a preferable way of displaying this type of data. Importons des données depuis un fichier pie.txt: toplot <- read.table("pie.txt") ltext=rownames(toplot)
\usepackage{tikz} \begin{document}
purchased used g1 51 24.3 g2 23.6 14.6 g3 7.6 11.8 g4 8 49.3 free 9.8 0
\begin{center} \input{R-graph.tex} \end{center} \end{document}
Pour avoir accès au driver Tikz sous R, il faut installer le paquetage correspondant, depuis l’environment R, avec la commande: install.packages("tikzDevice")
et importer le paquetage avant d’utiliser le driver : require(tikzDevice) tikz("R-graph.tex", width=4, height=4) # commandes d'affichage dev.off()
flchier pie.txt
Nous pouvons afficher la première colonne (purchased) dans un camembert (fig. 1): pie(toplot[,1], labels=ltext, col=theme4pw)
Pour rendre encore plus heureux les managers, nous pouvons afficher un camembert 3D (fig. 2). require(plotrix) pie3D(toplot[,1], labels=ltext, col=theme4pw, explode=0.1)
Quelques exemples pratiques
g1
g1
Maintenant que vous avez installé les paquetages nécessaires et choisi votre format de fichier favori, nous sommes prêts à montrer quelques exemples. Les images de cet article ont été générées avec le driver PDF. Dans la suite des exemples de cet article, je vais uniquement indiquer les commandes d’affichage, à vous de rajouter le nécessaire pour rediriger la sortie vers un fichier. Il faut d’abord définir des palettes de couleurs qui nous seront utiles par la suite:
free
free
g2 g2
g4
g3
g4
g3
fig. 1 – camembert
fig. 2 – camembert 3D
Histogrammes cumulatifs Les histogrammes cumulatifs (fig. 3), par rapport aux camemberts, nous donnent une meilleure idée des grandeurs comparées: 12 JUIN 2012 - N°5
3
Graphiques avec R
La commande Plot
barplot(as.matrix(toplot), col=theme4pw, xlim=c(0,3.5)) abline(h=(0:10)*10, lty=3, col='gray') legend("topright", ltext[length(ltext):1], col='black', pch=c(22), pt.bg=theme4pw[length(theme4pw):1], bty='n')
1 3457.6953 6020.6509 3314.5898 2 5268.7849 11918.0629 4884.5262 4 5541.83 20878.2638 9534.0259 8 5543.9268 28863.862 18089.6665 16 NA NA 29723.2094
100
fichier cluster-data.txt
Souvent, on souhaite afficher des données y versus x. Dans R, ceci est possible avec la commande plot. L’ajout de graphes supplémentaires sur la même figure est possible avec la commande points. Un exemple de ce type de graphe est montré dans la figure 5.
40
points(cdata[,1],cdata[,3],type='b',col=theme3l[2],pch=2) points(cdata[,1],cdata[,4],type='b',col=theme3l[3],pch=3)
purchased
legend("topleft", legend=c("Callisto","Antares","Jupiter"), col=theme3l, pch=c(1,2,3))
used
30
fig. 3 – histogramme cumulatif
25
Histogrammes
Callisto Antares Jupiter
20
Foggy Sunny 3.2 1.8 1.2 0.9 1.5 2.0 1.2 1.0 4.1 1.5 1.4 1.3
GB/s 15
Rainy Dark "player 1" "player 2" "player 3" fichier bars.txt
Nous pouvons utiliser les histogrammes sans les empiler (fig. 4), toujours avec la commande barplot.
10
0
cdata=read.table("cluster-data.txt") plot(cdata[,1], cdata[,2], log="x", type='b', xlab='threads',ylab='GB/s',ylim=c(3000,30000), xaxt='n', yaxt='n', pch=1, col=theme3l[1]) axis(1,at=c(1,2,4,8,16)) axis(2,at=c(5000,10000,15000,20000,25000,30000), lab=c(5,10,15, 20,25, 30))
20
60
80
free g4 g3 g2 g1
5
times <- read.table("bars.txt")
4
barplot(as.matrix(times),col=theme3b,beside=TRUE, xlab='weather', ylab='time to destination [h]') abline(h=(1:4), lty=3, col='gray') abline(h=0, lty=1, col='black') legend("topright", legend=rownames(times), col='black', pch=c(22), pt.bg=theme3b, bty='n')
time to destination [h] 2 3
player 1 player 2 player 3
1
2
4
8
16
threads
fig. 5 – graphiques à l’aide des fonctions plot et points
Maintenant, explorons d’autres types de graphes réalisables avec R. Vous verrez que les possibilités sont nombreuses. De plus, le paquetage CRAN augmente encore la palette.
Timeline
0
1
Afficher une ligne temporelle n’a jamais été si simple – il suffit de connaître les bonnes commandes R. Le prochain exemple illustre les plates-formes et les initiatives en calcul haute performance à l’EPFL entre 1990 et 2004.
Rainy
Dark
Foggy weather
fig. 4 – histogramme simple
4 flash informatique
Sunny
"Pascal" "1993/11/01" "1999/05/01" "Merope/J90se" "1997/03/21" "2001/02/05" "Orion" "1997/02/01" "1999/06/01" "Eridan" "1997/12/01" "2005/05/01" "Swiss-T0" "1998/05/01" "2000/08/01" "Swiss-T0 dual" "1998/10/01" "1999/09/01" "Swiss-T1 baby" "1999/08/01" "2003/06/01" "Swiss T1" "2000/01/01" "2003/01/01" flchier hpctimeline.txt
Graphiques avec R require(plotrix) hpctimeline=read.table("hpctimeline.txt") Ymd.format<-"%Y/%m/%d" vgridpos<-as.POSIXct(strptime(c( "1992/01/01", "1994/01/01", "1996/01/01", "1998/01/01", "2000/01/01", "2002/01/01" ), format=Ymd.format)) vgridlab<- c( "1992", "1994", "1996", "1998", "2000", "2002") startend=as.POSIXct(strptime(c("1992/06/01", "2004/01/01"), format=Ymd.format)) gantt.info <- list( labels=hpctimeline[,1], starts=as.POSIXct(strptime(hpctimeline[,2], format=Ymd.format)), ends=as.POSIXct(strptime(hpctimeline[,3], format=Ymd.format))) gantt.chart(gantt.info, vgridpos=vgridpos, vgridlab=vgridlab, hgrid=TRUE, priority. legend=FALSE, taskcolors=theme3l[1], xlim=startend)
1994
1996
1998
2000
2002
Pascal Merope/J90se Orion Eridan Swiss−T0 Swiss−T0 dual Swiss−T1 baby
fig. 7 – exemple de graphe orienté
Conclusion Dans cet article, je vous ai fourni des recettes toutes prêtes pour afficher vos données avec certains types de graphiques. Si R n’est généralement pas facile d’accès, j’espère vous avoir donné un avant-goût qui puisse vous motiver à explorer ce logiciel. La qualité des graphiques générés ainsi que l’uniformité entre les différentes représentations et l’intégration aisée dans tout type de document font de R un allié dans la rédaction de documents techniques ou scientifiques. Lorsqu’on dispose de beaucoup de données à afficher, le fait de pouvoir importer les fichiers bruts et scripter la génération des graphiques donne à R un avantage notable, par exemple, sur les tableurs.
Swiss T1
fig. 6 – HPC - historique entre 1994 et 2002
Graphes R est aussi capable d’afficher les graphes orientés ou non-orientés, en voici un exemple: require(igraph) adjmat<-matrix(0,5,5) colnames(adjmat)=c("rock", "paper", "scissors", "spock", "lizard") rownames(adjmat)=c("rock", "paper", "scissors", "spock", "lizard") adjmat[2,1]=adjmat[3,2]=adjmat[4,3]=adjmat[5,4]= adjmat[1,5]=1 adjmat[4,1]=adjmat[5,2]=adjmat[1,3]=adjmat[2,4]= adjmat[3,5]=1 gs <- graph.adjacency(adjmat) # affichage plot.igraph(gs, layout=layout.circle, vertex.label=c("rock", "paper", "scissors", "spock", "lizard"), vertex.size=80, vertex. color=theme4pw[3], edge.color=theme3b[1])
L’affichage des données est un art, qui nécessite comme base de bonnes données à afficher. Du post-processing est parfois nécessaire pour faire un tri dans les données, ainsi qu’un certain savoirfaire pour mettre en évidence la partie des données souhaitée. Aucun programme ne remplace ce savoir-faire, mais peut-être que R vous motiverait à l’acquérir.
Références [1] flashinformatique.epfl.ch/spip.php ?article2540 [2] flashinformatique.epfl.ch/spip.php ?article2315.
Article du FI-EPFL 2012 sous licence CC BY-SA 3.0 / V. Rezzonico
Dans la figure 7, les étiquettes (nœuds du graphe) ont été remplacées par les pictogrammes correspondants.
12 JUIN 2012 - N°5
5
Un nouveau centre de calcul à l’EPFL ../.. Suite de la première page
Les choix technologiques, les différentes analyses (risques, budgets, planning des travaux, etc.) se sont déroulés de janvier à septembre 2011. Ces choix ont été validés par le comité de pilotage du projet: Domaine IT, Vice-Présidence pour la Planification et la Logistique (VPPL), faculté Informatique & Communications (IC), Domaine Immobilier et Infrastuctures (DII). Les travaux de rénovation et d’infrastructures ont été supervisés par le DII. Les travaux ont débuté en août 2011 et se terminent (je l’espère , à la date de l’écriture de cet article) tout début mai 2012; le datacenter sera alors opérationnel. Nous devrons affiner notre maîtrise de l’infrastructure encore quelques mois pour clore le projet cet été ou cet automne. Ensuite nous serons dans un mode standard d’exploitation de l’infrastructure.
Spécifications Tiering- redondance Les infrastructures pour ce datacenter sont de type Tier 2. Cela veut dire que tous les composants de l’infrastructure sont à double, et permettent de faire face à une défaillance d’un composant (sur les chaînes de distribution de courant, d’eau et de ventilation) sans impact sur l’exploitation. Par exemple, l’eau du lac utilisée pour le refroidissement du datacenter est remplacée en cas de panne par l’eau potable. Les transformateurs du bâtiment sont doublés, un seul suffit à assurer la charge totale du datacenter ainsi que celle du bâtiment. Cette redondance permet également des opérations de maintenance sans coupure pour les différents utilisateurs du bâtiment et en particulier pour ceux du datacenter. Apportons un bémol pour le réseau hydraulique physique (les tuyaux): un seul chemin pour l’aller, pas deux (idem pour le retour).
Puissance La puissance à disposition pour les serveurs est de 1MW, le refroidissement est également prévu pour cette puissance. La puissance est fournie par deux transformateurs de 1600kVA. La puissance secourue (UPS & /ASI &) est de 300kW pour une durée de 20 minutes. Après ces 20 minutes, c’est la panne car il n’y a pas de génératrice prévue dans l’infrastructure ! C’est pourquoi une stratégie d’arrêt des serveurs sera mise en place en fonction du temps restant à disposition sur les batteries. Néanmoins, il est possible de connecter une génératrice portable à l’infrastructure en cas de maintenance programmée. Des solutions de secours basées sur les technologies de flying wheels + génératrice n’ont pu être étudiées pour des raisons de place, de délais et de coûts.
Nous avons la chance de pouvoir utiliser l’eau du lac pour le refroidissement. Cette eau est récupérée entre 6°C et 8°C par la station de pompage tout au long de l’année. Nous n’avons donc pas besoin de fabriquer de l’eau froide d’où une économie importante sur les infrastructures et leurs consommations. L’eau du lac est utilisée dans des échangeurs de 35kW montés dans les portes arrière des racks de 52U (240cm de haut). Le flux d’air nécessaire pour le passage de l’air chaud dans l’échangeur est fourni tout simplement par les ventilateurs des serveurs. Cette solution est déjà utilisée au DIT pour le dernier cluster mis en place fin 2011: ARIES (voir fig. 1). Cette solution nous permet d’équiper au fur et à mesure la salle selon les besoins, rack par rack. L’investissement pour le refroidissement est donc fractionné a contrario d’une solution avec de l’air pulsé où généralement on équipe l’ensemble de la salle dès le départ. Les coûts liés à l’exploitation et à la maintenance des CRAC sont, dans notre solution, évités. La température de l’air à l’entrée de l’échangeur est d’environ 40°C pour une sortie moyenne de 21°C dans le cas du cluster ARIES. Le réseau hydraulique dans les salles se trouve dans le faux plancher, les échangeurs s’y raccordent par des flexibles.
Régulation Nous avons mis en place une régulation du débit de l’eau avec des vannes thermostatiques à la sortie de l’échangeur (voir fig. 2). Ces vannes régulent le débit de l’eau en fonction d’une consigne de température donnée sur celles-ci. La température de l’eau en entrée est de 14°C, le ΔT souhaité dans un premier temps est de 6 degrés. Cette régulation permet d’adapter le débit d’eau en fonction de la puissance utilisée dans le rack ainsi que de changer les consignes (eau en sortie plus ou moins chaude) si l’on souhaite une augmentation ou une diminution du ΔT. Ce système permet d’optimiser la gestion de consommation d’eau. C’est via cette régulation que nous pourrons aussi adapter notre température dans la salle (température de l’air à la sortie des
Froid La particularité de ce datacenter est la technique de refroidissement utilisée. En règle générale, les datacenters utilisent de l’air frais pulsé (utilisation de CRAC &), mais dans notre infrastructure ce n’est pas le cas.
6 flash informatique
fig. 1 – arrière du cluster ARIES et échangeur
fig. 2 – échangeur et vanne de régulation
Un nouveau centre de calcul à l’EPFL échangeurs). Cette température de consigne (par exemple 21°C) est importante en cas de panne complète du refroidissement: elle conditionne la marge de temps que nous avons avant d’atteindre une température élevée (40°C) dans le datacenter. Pour une température de consigne de 21°C nous avons environ trois minutes avant d’atteindre le seuil des 40°C dans la salle ! Bien évidemment, il faudra prendre des mesures d’urgence dans ce cas de figure possible, mais très peu probable (arrêt des machines, dans quel ordre, …).
Récupération de l’énergie
montant auquel il faudra ajouter la consommation des infrastructures pour le refroidissement, la ventilation, la lumière… Soit un facteur égal au (PUE-1). Dans notre exemple: 2.63x(1,2-1) = 525 kCHF. Si on diminue le PUE de 0,05, l’économie réalisée serait de 130kCHF. Sur dix ans une économie de 1.3MCHF ! Si on revalorise le ΔT (via des PAC par exemple) alors, les économies s’additionnent et le modèle général devient encore plus équilibré. Sur les anciennes infrastructures de l’EPFL le PUE moyen est sans aucun doute supérieur à 1,5 voire plus. La conclusion s’impose d’elle-même.
L’eau réchauffée de six degrés n’est pour l’instant pas valorisée, des projets sont à l’étude pour utiliser ce potentiel énergétique via des PAC (pompe à chaleur) par exemple. La régulation nous permettra de modifier ce ΔT , et nous pourrons fournir aux PAC de l’eau plus chaude entre 20 et 25°C voire plus.
Accès – Sécurité - Détection
L’ensemble des composants de l’infrastructure (pompes, ventilation, électricité, PDU &, UPS, etc.) sera équipé de sondes SNMP (Single Network Management Protocol) pour permettre le suivi de leurs utilisations/statuts. Nous pourrons donc mesurer les modifications d’un ou plusieurs paramètres appliqués à l’infrastructure afin d’affiner le pilotage du datacenter pour de meilleures performances: l’efficience. Bien évidemment nous suivrons le PUE & du datacenter (une des métriques, mais pas la seule), qui une fois à pleine charge devrait être autour de 1,2 voire inférieur (on l’espère) pour l’ensemble des zones. Une première estimation d’un PUE de 1,06 est avancée pour des machines n’utilisant pas le courant secouru ou très peu (par exemple le cluster des PS3). Un PUE de 2 exprime que pour 1W dédié aux serveurs IT il faut 1W pour le fonctionnement de l’infrastructure (froid, ventilation, batteries, lumières, etc.). Dans l’hypothèse d’un PUE de 1,2 il faudra donc prévoir une consommation de 200kW pour notre infrastructure. On voit donc l’intérêt d’avoir cette valeur le plus proche de 1 possible pour des raisons évidentes d’efficacités énergétique et économique. Prenons l’exemple d’une consommation électrique annuelle d’un serveur virtuel de 1MW à 30cts du kWh. La facture virtuelle pour cette consommation sera de: 1000x24x365x0.3 = 2.63 MCHF,
Agencement Le datacenter INJ est composé de deux salles à l’usage de l’ensemble de l’École (facultés, services centraux). INJ012 (agrégat de INJ011,INJ012 et INJ016) est une zone pour les serveurs de facultés (ZMD1 – Zone Moyenne Densité 1) et les clusters HPC (ZHD – Zone Haute Densité) tandis que INJ019 (ZMD2 – Zone Moyenne Densité 2) est une zone dédiée aux facultés (voir fig. 4). La capacité du datacenter en terme de rack sera d’environ 60 racks de 52 RU (Rack Unit), donc un total de 3120 RU: avantage indéniable en terme de densité de RU/m2, on optimise également l’hébergement. Les racks standards actuels offrent entre 40RU et 47RU, soit un gain en terme de place pour les serveurs allant de 10 à 25% ! Cette optimisation a été possible grâce à la hauteur sous plafond (>4m) disponible dans les locaux. Dans la zone ZHD, la puissance par rack devrait dépasser les 20kW alors que pour les zones ZMD1 et ZMD2 on devrait être à 10kW ou moins. Le premier cluster installé en INJ012 sera un cluster de la faculté SB (26RU soit la moitié d’un rack pour 15kW environ), le second sera BELLATRIX (cluster mutualisé tout comme ARIES) pour l’automne 2012. On attend également le successeur du projet CADMOS sans doute pour début 2013.
Q01 Q03 Q05
Q07 Q09 Q11 Q13 Q15 Q17 Q19 Q21 Q23 NET
R31 R29 R27
R25 R23 R21 R19 R17 R15 NET
R11
R07
R09
R13
TCOM21
R26 R18 R04 R24 R22 R20 R16 R14 R12 R10 R08 R06 R02 NET NET NET
TCOM31
R32 R30 R28
TCOM22
Q08 Q20 Q10 Q12 Q14 Q16 Q18 Q22 Q24 NET NET
TCOM32
Q02 Q04 Q06
R05 R03 R01
100
Métriques – PUE
fig. 3 – les nouveaux échangeurs et les nouvelles pompes
S12 S10 S08
S06 S04 S02 NET
100
Le contrôle d’accès en INJ012 sera géré comme les accès de la salle machine du DIT au MA (même système de contrôle). L’accès en INJ019 sera géré par le système CAMIPRO. Les salles seront équipées d’un système de vidéosurveillance ainsi que d’un système anti-effraction. Elles sont équipées d’un système de détection feu (plafond) et dans chaque rack il y aura une détection précoce du feu. Des détecteurs sont installés dans le faux plancher pour alerter en cas de fuites d’eau. Il n’y a pas de système d’extinction préventif (gaz inerte, brouillard d’eau, autre). Le risque de feu reste très faible et la mise en place d’un système d’extinction n’a pas été retenue pour le moment.
S11 S09 S07
S05 S03 S01 NET
fig. 4 – agencement du datacenter
12 JUIN 2012 - N°5
7
Un nouveau centre de calcul à l’EPFL La nouvelle installation du cluster de PS3 sera installée dans des racks standardisés de 240 cm de haut. Ces racks pourront être réutilisés pour des serveurs 19 pouces standards.
Infrastructures Circuit hydraulique Pour permettre le refroidissement de 1MW il a fallu enlever les installations existantes et construire un circuit hydraulique permettant d’amener jusqu’à 170m3/h d’eau (14°C) dans le datacenter. Pour l’instant, le datacenter a un unique réseau d’eau, un deuxième pourra être mis en place si besoin (température sensiblement différente, 55°C ou 60°C par exemple).
La puissance globale pour les salles INJ012 et INJ019 sera de 1MW dont 300kW secourus ce qui nous permettra d’avoir 20 minutes d’autonomie sur batteries en cas de panne générale de courant. Une stratégie d’arrêt des machines sur le courant secouru sera mise en place pour éviter des arrêts brutaux pour les applications sensibles telles que les serveurs de bases de données ou les serveurs de fichiers. La puissance non secourue sera principalement utilisée pour les configurations HPC pouvant s’arrêter sur une coupure brutale: en général les nœuds de calcul peuvent être sur le courant non secouru alors que leurs serveurs de fichiers, frontales, switchs sont quant à eux sur le courant secouru. L’ensemble de la distribution électrique dans les salles se fait par le plafond.
Ventilation L’air du datacenter est traité spécifiquement. L’humidité est contrôlée (tolérance entre 20% et 80% d’humidité relative, en général 50%), l’air est filtré et le volume de la salle renouvelé trois fois par heure.
Datacenter Le datacenter a été inauguré le 10 mai 2012. Dans chaque rack du datacenter, les serveurs seront attachés à des PDU intelligents qui nous permettront de connaître la puissance consommée de chaque machine hébergée. fig. 5 – nouveau réseau hydraulique central technique – © Alain Herzog
Voici quelques étapes du chantier.
Électricité Toute l’infrastructure électrique du bâtiment a été rénovée, les transformateurs du bâtiment ont été changés (2x1600kVA) pour satisfaire les nouveaux besoins.
fig. 7 – travaux dans le datacenter
fig. 8 – datacenter livré ! – © Alain Herzog
fig. 6 – livraison d’un tableau général basse tension dans la centrale technique par le saut de loup
8 flash informatique
La prochaine étape sera de tester et valider tous les scénarios de pannes éventuelles des infrastructures et les actions à prendre dans ces cas de figure. Cela fera l’objet d’un nouvel article en 2013 avec un point également sur le PUE et autres métriques du datacenter !
Un nouveau centre de calcul à l’EPFL
Appels à contributions Nous disposons d’un datacenter qui se rapproche d’une certaine façon d’un laboratoire. Nous souhaitons l’exploiter de manière optimale. Dans cette optique nous sommes demandeurs de compétences ou expertises pour nous aider à améliorer notre exploitation (outil/expertise CFD & applicable au datacenter par exemple) ! Nous allons également mettre au concours la décoration des racks. Pour l’ensemble du cluster nommé Bellatrix (4 à 6 racks), une Amazone pourrait apparaître sur le flanc des racks… Who knows !
Conclusions et remerciements Avec ce nouveau datacenter, l’EPFL double sa capacité d’hébergement IT. Cette infrastructure doit être pilotée et optimisée. Nous allons donc essayer d’en tirer le maximum par un résultat d’un coût d’exploitation minimum ! Il reste encore beaucoup de marge de manœuvre pour réaliser des datacenters plus efficaces, je pense notamment à l’arrivée du courant continu directement dans les salles machines. Pour faire court, on simplifie la chaîne de distribution électrique ASI en éliminant des conversions de courant AC->DC et DC->AC comme le montre la figure 9. UPS system (current)
IT equip.(Server, etc.)
UPS UPS
Switching board
AC
DC AC
ICT
AC
AC
Alternating current
AC
DC
DC12V
CPU
AC incoming
DC
Direct current
HVDC HVDC PS Rack
IT equip.(Server, etc.) ICT
HVDC
AC
DC
DC340V
DC
DC12V
CPU
AC incoming
fig. 9 – comparaison distribution AC/DC dans un datacenter (source NTT Data Intellilink Corp.)
Le courant continu est alors amené directement vers les serveurs. L’ensemble des composants d’un serveur fonctionne en courant continu (carte mère, carte d’extension, …) alors pourquoi avoir un transformateur AC/DC sur chaque serveur ? En éliminant ces convertisseurs, on diminue les pertes liées aux conversions multiples, on gagne de la place dans les serveurs, on simplifie l’infrastructure ASI (moins de composants, CAPEX & donc moins de maintenance, OPEX & !). Par contre la gestion du GLOSSAIRE
&
ASI: alimentation sans interruption – dispositif de l'électronique de puissance qui permet de fournir à un système électrique ou électronique une alimentation électrique stable et dépourvue de coupure ou de micro-coupure, quoi qu'il se produise sur le réseau électrique. W CAPEX: dépenses d'investissement de capital quant aux coûts de développement ou de fourniture des pièces nonconsommables pour un produit. W
courant continu en salle semble poser des problèmes de religions (à l’image des guerres de clochers Mac/Windows ou Linux-Pas Linux) jusqu’à présent. Peu d’intégrateurs de serveurs proposent à ce jour des machines DC. Les économies ne sont pas bonnes pour tout le monde … pour les vendeurs de convertisseurs peut-être ? La piste des datacenters LEGO sous forme de containers est également à retenir. Droit au but: on configure le contenu de la boite avec R racks, avec S serveurs, la définition du type de refroidissement (air/eau), le type de redondance, la couleur… Ensuite il suffit de fournir la surface et les infrastructures nécessaires: la prise de courant et éventuellement les raccords pour l’eau lorsque le container est livré et prêt à l’emploi. Le datacenter se construit et évolue selon la demande sur la base de containers plus ou moins grands. Avant de passer aux remerciements, je vous mets en garde sur le respect des plannings dans le domaine du bâtiment: des promesses, toujours des promesses, et toujours du retard ! Une pensée ironique et amicale pour mes collègues du DII ! J’ai déjà eu leurs réponses: les spécifications IT changent/évoluent trop vite ! Les univers de l’informatique et de la rénovation d’un bâtiment sont antinomiques: poussières et étincelles de meule ne vont pas de pair avec des équipements informatiques habitués aux salles presque blanches, les fibres optiques ne supportent que très mal le passage d’un transpalette… Néanmoins et pour l’objectivité de mes propos, le datacenter est livré avec peu de retard sur le planning prévu (la date initialement prévue était le 1er avril, évidemment c’était un poisson…) sans aucune perturbation non planifiée (sauf pour la poussière !) sur l’IT pendant les travaux: bravo ! Je tiens à remercier la VPPL pour nous avoir soutenu et fait confiance, le comité de pilotage SI, le comité de pilotage et le groupe de travail du projet INJ-1MW ainsi que mes collègues du DIT et du DII qui m’ont épaulé et supporté pendant ces 18 mois. Un grand merci également aux utilisateurs des salles INJ011(DIT), INJ016(IC) et INJ019 (équipe du Professeur Lenstra pour le cluster des PS3) qui ont dû s’adapter aux travaux et à leurs impacts pendant 8 mois. Des remerciements pour les indigènes du bâtiment INJ qui ont été directement impactés par les travaux et leurs nuisances associées. Sans oublier l’ensemble des entreprises, des bureaux et des fournisseurs qui ont pris part à la rénovation du bâtiment et à la conception du datacenter en INJ. Et pour reprendre les propos de mon collègue Alain Dufour: «Nous sommes prêts pour la prochaine étape: un datacenter de 10MW voire plus ! »; avec une bonne récupération énergétique, on pourrait réchauffer beaucoup d’eau … assez d’énergie pour tout un campus ? n
CFD (Computational Fluid Dynamics): étude de la dynamique des fluides par la résolution numérique des équations la régissant. W CRAC (Computer Room Air Conditioning): climatisation de salle machine HPC (High Performance Computing) calcul à haute performance HVDC (High Voltage Direct Current): le courant continu haute tension est une technologie d'électronique de puissance utilisée pour le transport de l'électricité en courant continu haute tension. W
OPEX: dépenses d'exploitation, soit les coûts courants pour exploiter un produit, des entreprises, ou un système. W PDU (Power Distribution Unit): barre de distribution du courant dans les racks. PUE (Power Usage Effectiveness) : indicateur d'efficience énergétique utilisé pour qualifier l'efficacité énergétique d'un centre d'exploitation informatique. W UPS (Uninterruptible Power Supply): alimentation sans interruption - voir ASI. W = tiré de Wikipédia
12 JUIN 2012 - N°5
9
À votre service
Réalisations de GED à l’EPFL Patricia.Plaza@epfl.ch, EPFL - Domaine IT - KIS, responsable du projet GED
In the last two years, several EDM (Electronic Document Management) projects using Alfresco have been completed in our school. In this paper we present three EDM implementations, and we outline their common points as well as specific features. Nous parlerons dans cet article de différents projets de GED (Gestion électronique de documents) réalisés à l’EPFL avec le logiciel Alfresco, pour la gestion de documents administratifs. Il s’agit ici de présenter les systèmes installés dans trois secrétariats, leurs points communs et leurs spécificités. Nous avons déjà abordé, dans plusieurs articles précédents, ce qu’est un système de Gestion Électronique de Documents (GED) et traité des aspects métier liés à la gestion des documents et aux processus de travail. Pour rappel, une GED est un ensemble d’outils permettant de dématérialiser, capturer, classer, gérer, partager, éditer, stocker, rechercher, etc. des documents électroniques et les informations les concernant. Il est à distinguer d’un système de stockage et de partage de documents en ligne (tel que my.epfl), d’un CMS (comme Jahia) ou d’un système d’archivage électronique. Nous aborderons plus concrètement dans cet article, les GED mises en place dans l’Ecole par le DIT avec le logiciel Alfresco. L’étude des besoins de différents services intéressés par un tel système a permis de définir un modèle de GED de base, remplissant les cas d’utilisation communs à tous ces services. La réalisation de ce modèle de base a ensuite servi à intégrer Alfresco à l’infrastructure technique de l’EPFL (synchronisation avec l’annuaire LDAP de l’Ecole pour les personnes et les groupes, mise en place de l’environnement de haute disponibilité, etc.). Les différentes GED installées par la suite se sont appuyées sur ce modèle de base, qui a été complété par les fonctionnalités spécifiques dont chaque service avait besoin. Les fonctionnalités faisant partie du modèle de GED de base sont: z organisation hiérarchique de dossiers en plan de classement. Ce plan de classement est défini pour chaque service; z création, suppression, déplacement des dossiers dans le plan de classement; z importation, suppression, déplacement de documents; z accès à la GED via l’interface Web d’Alfresco et/ou via CIFS en se connectant directement au serveur de la GED; z indexation des documents, c’est-à-dire description des documents selon des critères prédéfinis (métadonnées). Ces métadonnées sont définies pour chaque service;
10 flash informatique
z héritage des métadonnées (du dossier père au dossier fils, du dossier au document), afin de faciliter l’indexation des documents; z capture des e-mails se trouvant sur une boîte e-mail; z gestion de la confidentialité. Par défaut, tous les documents dans la GED sont confidentiels, c’est-à-dire que seuls les collaborateurs du service y ont accès. Il est toutefois possible de gérer cette confidentialité en l’adaptant aux besoins de chaque secrétariat; z possibilité de lier les documents entre eux, afin de garder la relation d’un courrier papier et son annexe; z recherches simples et avancées. Le masque de recherche avancée est défini pour chaque secrétariat en fonction de ses besoin; z check in / check out des documents pour modification. Lorsqu’un collaborateur modifie un document, celui-ci apparaît comme verrouillé pour les autres utilisateurs. z archivage des dossiers/documents. Il ne s’agit pas d’une fonction d’archivage à proprement parler. Cette fonctionnalité permet d’occulter les dossiers et documents qui ne sont plus d’actualité afin qu’ils n’apparaissent pas lors de recherches. Le périmètre de la GED, tel qu’il a été défini au début du projet, ne prévoyait pas de traiter les aspects d’archivage pérenne des documents électroniques. De fait, les GED et les SAE (Système d’Archivage Électronique) ne couvrent pas les mêmes besoins et ne se situent pas au même moment du cycle de vie des documents. Néanmoins, nous avons recommandé certains formats de fichiers plutôt que d’autres, lorsque l’utilisation faite des documents de la GED le permettait. Les différentes réalisations de GED menées dans ce projet se répartissent en deux groupes. Le premier est constitué exclusivement par la GED dédiée à la gestion des dossiers d’étudiants. Projet beaucoup plus complexe, Alfresco s’interface, dans ce cas, avec l’application métier IS-Academia et le logiciel de numérisation Kofax. Cette réalisation fera l’objet d’un article ultérieurement. Le second groupe de GED, est constitué par ce que nous avons appelé les GED de secrétariats, pour lesquelles Alfresco a été installé et paramétré tout seul. Il s’agit de: z la GED du service des Affaires Professorales (APR); z la GED du Système de Contrôle Interne (SCI); z la GED du Service de Santé et Sécurité au Travail de la Faculté des Sciences de Base (SB-SST), encore dans sa phase de préproduction. Chacune de ces GED est un exemple de réalisation du modèle de base, avec ou sans développements spécifiques et avec un accompagnement plus ou moins fort dans les aspects métiers de la gestion de documents.
Réalisations de GED à l’EPFL
GED des Affaires Professorales (APR) Le service des APR est composé de trois personnes et s’occupe de la mise au concours des postes de professeurs (tout type de professeur), du processus d’engagement et d’évaluation de ces derniers, ainsi que de toutes les questions touchant leur nomination, leur arrivée dans la région et sur le campus. Le service des APR fait partie des initiateurs du projet de Gestion électronique de documents dans l’École: il a participé à l’appel d’offres public et à la sélection du logiciel Alfresco. Les besoins des collaborateurs de ce service étaient très clairs dès le début du projet: il s’agissait pour eux de disposer de versions électroniques des dossiers de professeurs, afin d’en assurer la sécurité au moyen de sauvegardes. Ces documents n’existant principalement que sous format papier, le projet devait comporter un volet de numérisation pour les documents existants et à venir. La possibilité de rechercher les documents en fonction de leur type (contrat, décision, congé de recherche, etc.), du nom du professeur, de son prénom ou de son numéro Sciper avait été demandée ainsi qu’un processus d’indexation simplifié. Le besoin premier de sauvegarde nous a conduit à définir ce système de GED comme un référentiel de documents ou coffre-fort, chargé de stocker les documents vitaux des dossiers de professeurs engagés (et qui seront engagés) à l’EPFL. Nous avons travaillé, dans un premier temps, à la définition de ces documents vitaux, en nous posant la question suivante: quels sont les documents essentiels à la constitution et au suivi d’un dossier de professeur ? Le plan de classement s’est ensuite tout naturellement imposé, comme reflet de ce corpus de documents. Le jeu de métadonnées a, quant à lui, été défini en fonction des clés de recherche. Afin de faciliter le travail des collaborateurs des APR, le processus de création de dossiers de professeur a été automatisé (développement spécifique). La structure du plan de classement reposant sur une hiérarchie de dossiers stricte et le jeu de métadonnées uniforme ont facilité cette automatisation. Lors de la création d’un nouveau dossier de professeur, les collaborateurs des APR saisissent les nom et prénom du professeur, ainsi que son numéro Sciper et l’arborescence de dossiers est créée automatiquement. Les dossiers héritent ensuite des métadonnées du dossier parent et les documents de celles du dossier dans lequel ils sont classés. Avant la mise en production de la GED, un travail de reprise des dossiers existants a été entrepris. Seuls les dossiers des professeurs encore en exercice ont été intégrés dans la GED. Cela a nécessité l’identification et la mise en évidence des documents vitaux dans chaque dossier de professeur, leur préparation pour la numérisation (enlever les agrafes, trombones, post-it, etc.) et leur numérisation. Le système de gestion électronique de documents des APR est en production depuis le début de l’année 2010 et contient un peu plus de 500 dossiers de professeurs.
GED du Système de Contrôle Interne (SCI)
Une vingtaine de personnes sont impliquées dans la définition de ces processus de gestion, dont la coordination est assurée par une seule. Des auditeurs externes à l’EPFL doivent également avoir accès à la documentation élaborée par le SCI. Avant l’installation d’Alfresco, le SCI disposait déjà d’un outil pour gérer cette documentation, mais celui-ci ne répondait plus totalement aux besoins, notamment sous l’aspect de la maintenance. Durant la période de constitution de la documentation relative au système de contrôle interne, nous nous sommes appuyés sur un logiciel de gestion documentaire facilitant le suivi en phase de projet. Arrivé en mode opérationnel, il nous est toutefois apparu que nous devions pouvoir disposer d’un système de GED robuste avec support assuré par les services de l’EPFL. Dès lors le logiciel Alfresco s’est avéré être l’outil qui nous permettait de gérer la base documentaire du SCI de l’EPFL sur le long terme et, chose importante, avec une gestion aisée des accès, tant pour des personnes internes, qu’externes à l’EPFL. Philippe Staub pour le SCI. Le système de GED mis en service au SCI est un exemple de déploiement du modèle de base. L’organisation des documents dans un plan de classement existait déjà dans l’ancien système utilisé par le SCI et donnait pleinement satisfaction, la description des documents était également déjà connue ainsi que les différents collaborateurs devant accéder aux documents et avec quels droits. La valeur ajoutée de cette GED a consisté en son installation sur une infrastructure qui garantisse, au niveau du DIT, les aspects de support, de maintenance et de haute disponibilité. Le système de gestion électronique du SCI est en production depuis le mois de décembre 2011.
La GED SB-SST Rattaché à la Faculté des Sciences de Base, le Service de la Sécurité et Santé au Travail a pour mission d’implémenter la gestion en matière de sécurité et santé au travail décidée par la Direction de la Faculté. Ce service emploie neuf personnes. Comme pour le SCI, le système de GED installé pour le service SB-SST reprend le modèle de base, sans développements annexes. L’accent dans ce projet a été mis sur l’accompagnement métier autour de la gestion des documents. À partir des documents partagés par les collaborateurs et stockés sur un serveur, nous avons travaillé, en collaboration avec le secrétariat, à l’élaboration d’un plan de classement, à la création d’un jeu de métadonnées pour les dossiers du plan de classement et les documents ainsi qu’à la définition d’un masque de recherches avancées. Nous avons également défini des groupes d’utilisateurs et leurs droits d’accès aux différents dossiers de la GED. Encore dans sa phase de pré-production, cette GED devrait être en production avant la fin de l’année académique. n
Le SCI encadre les risques sur les processus de gestion ayant une incidence sur les états financiers et assure la mise en place de contrôles de conduite. Il garantit un déroulement conforme des opérations financières à l’EPFL. 12 JUIN 2012 - N°5
11
Logiciel libre
Kickstart pour Ubuntu Benjamin.Barras@epfl.ch, EPFL - Domaine IT - responsable de la plate-forme Unix à l’EPFL
The aim of this paper is to present kickstart for Ubuntu using the same syntax as the RedHat kickstart, but not the same installer. Le but de cet article est de présenter kickstart pour Ubuntu utilisant la même syntaxe que le kickstart de RedHat, mais pas le même installeur.
Fiche descriptive Ubiquity
Domaine ✦ Installation de systèmes d’exploitation
Licence
langue
version
✦ GPLv2
✦ anglais
✦ 2.10.16
Autres alternatives libres ✦ ✦ ✦ ✦ ✦
boot.fedoraproject.org (BFO) Anaconda (Fedora & RedHat) AutoYaST (OpenSUSE) AI (OpenSolaris) FAI (fai-project.org)
Alternatives non libres ✦ Unattended Windows ✦ Jumpstart (Solaris)
Sites Web ✦ Projet et téléchargement: https://launchpad.net/ubiquity
Plates-formes supportées
Introduction Le présent article est rédigé dans le style démarrage rapide. Mais si vous souhaitez avoir un un éclairage supplémentaire sur le sujet, il peut être utile, mais pas obligatoire, de lire l’article Automatiser votre installation Linux avec Kickstart [1] du précédent Flash informatique, qui est bien plus complet. Le but ici n’est pas de redire ce qui a déjà été écrit, mais bien de guider le lecteur qui souhaite utiliser Kickstart pour installer Ubuntu. L’installeur d’Ubuntu s’appelle Ubiquity qui s’appuie lui-même sur le debian-installer (d-i). Ce dernier utilise des commandes connues sous le nom de preseed, et qui permettent de faire une installation automatisée à l’aide d’un fichier texte, méthode appelée preseeding method. Canonical a intégré un interpréteur Kickstart dans Ubiquity, afin de faire le lien avec la syntaxe
12 flash informatique
Kickstart et les commandes preseed, ce qui peut poser quelques problèmes de compatibilité entre ces deux différentes méthodes. Comme les liens hypertextes dans la suite du texte sont périssables, vous trouverez les mots-clés comme nom de lien qui vous permettront de retrouver facilement les documents cités.
Règles Le fichier Kickstart est un simple fichier texte, composé de sections, qui doivent être écrites dans l’ordre, soit: 1 La section des commandes qui va vous permettre de définir les paramètres de base de votre système et contient une liste d’éléments identifiés par un mot-clé suivi de ses paramètres. On utilisera l’outil graphique system-config-kickstart qui nous facilitera le travail, il se chargera de nous mettre les bons mots-clés et les paramètres associés. 2 La section %packages qui est la plus difficile, car pas documentée. Ici seul l’outil graphique va nous aider à démarrer rapidement. 3 Les sections %pre et %post qui permettent d’écrire un script de pré-installation ou de post-installation. C’est la seule manière de configurer notre système correctement.
Remarques w Des commentaires peuvent être ajoutés à l’aide du symbole # au début d’une ligne. w Chaque mot-clé ainsi que ses paramètres associés doivent être écrits sur une seule ligne. La bonne nouvelle est qu’Ubiquity permet d’ajouter des commandes preseed aux mots-clés Kickstart dans le même fichier. Une documentation complète de ces commandes se trouve ici: Automating the installation using preseeding [2]. Mais le plus simple est de lire directement l’exemple complet example-preseed.txt [3] dont la documentation ci-dessus s’est fortement inspirée. Il suffit de remplacer le mot-clé d-i du fichier précédent par le mot-clé preseed dans le fichier Kickstart. Il y a quelques commandes preseed dans l’exemple de fichier Kickstart ci-contre.
Compatibilité Toutes les fonctionnalités de Kickstart ne sont pas forcément implémentées, et peuvent même être incompatibles avec le debian-installer. Il est important de lire la liste des compatibilités concernant Kickstart pour Ubuntu qui se trouvent ici: Kickstart Compatibility [4] et Automatic Installation Ubuntu [5]. De plus, il est conseillé de bien faire des tests avant de se lancer dans une installation automatique.
Kickstart pour Ubuntu ### Generated by Kickstart Configurator ### ### Filename: ks.cfg ### ### System language lang en_US ### Language modules to install langsupport fr_CH --default=en_US ### System keyboard keyboard ch_fr ### System mouse mouse ### System timezone timezone Europe/Zurich ### Root password rootpw --disabled ### Initial user ### Tous les paramètres doivent être sur une ligne user barras --fullname "Admin User" --iscrypted --password $6$.WwbX…too long…e5LdwY1 ### Network ### Tous les paramètres doivent être sur une ligne network --bootproto=static --device=eth0 --ip=128.178.1.55 --netmask=255.255.255.0 --gateway=128.178.1.1 --nameserver=128.178.15.8 ### Si on utilise dhcp, mettre cette ligne et ### retirer l'autre ci-dessus ### network --bootproto=dhcp --device=eth0 ### ### Exemple de commandes preseed ### Rechercher ces deux commandes dans le fichier: ### example-preseed.txt preseed netcfg/get_hostname string ditsbpc13 preseed netcfg/get_domain string epfl.ch ### ### Reboot after installation reboot ### Si vous souhaitez voir une installation Ubuntu ### non graphique (rarissime) ### Use text mode install text ### Install OS instead of upgrade install ### Use Web installation url --url http://mirror.switch.ch/ftp/ubuntu ### System bootloader configuration bootloader --location=mbr ### Clear the Master Boot Record zerombr yes ### Partition clearing information clearpart --all ### Disk partitioning information part / --fstype=ext4 --size=120000 part swap --size=8000 ### System authorization infomation auth --useshadow --enablemd5 ### Firewall configuration firewall --disabled ### Package install information %packages @ubuntu-desktop ssh autofs ntp ### Post installation %post ### Modify rc.local mv /etc/rc.local /etc/rc.local.orig cat > /etc/rc.local <<EOT #!/bin/sh # # Script post installation if [ ! -e /root/postInstall.1 ]; then /root/postInstall.sh && touch /root/postInstall.1 fi exit 0 EOT
chmod a+x /etc/rc.local ### ### postinstall.sh cat > /root/postInstall.sh <<EOFPOST ### ### Log echo `date` > /root/post-install.log echo 'Begin log' >> /root/post-install.log ### ### Pakages installation (example) ### apt-get install ntp ### apt-get install gufw ### tasksel install edubuntu-desktop/server ### ### Profile /bin/cp /etc./profile /etc/profile.orig cat <<EOF>> /etc/profile # # B.Barras export HISTTIMEFORMAT=" %d.%m.%Y-%T " export HISTFILESIZE=5000 EOF ### ### SSH cd /root mkdir .ssh chmod 755 .ssh cat <<EOF>> .ssh/authorized_keys ssh-dss AAA…too long…eKZ8n benjamin.barras@epfl.ch EOF chmod 644 .ssh/authorized_keys cd / ### ### Restriction SSH cat <<EOF>> /etc/ssh/sshd_config # # B.Barras AllowUsers barras EOF /etc/init.d/ssh restart ### ### NTP cd /etc cp ntp.conf ntp.cpy sed 's/^server/#server/' < ntp.cpy > ntp.conf cat <<EOF>> /etc/ntp.conf # # EPFL server 128.178.1.1 EOF service ntp restart ### ### Autofs echo '/net -hosts' >> /etc/auto.master service autofs restart ln -s ../init.d/autofs /etc/rc2.d/S99autofs ### ### Restore rc.local mv -f /etc/rc.local.orig /etc/rc.local rm -f /root/postInstall.sh ### ### Log echo `date` >> /root/post-install.log echo 'End log' >> /root/post-install.log ### ### End exit 0 EOFPOST chmod a+x /root/postInstall.sh %end
exemple de fichier Kickstart
12 JUIN 2012 - N°5
13
Kickstart pour Ubuntu
Limitations Le point le plus important, à mes yeux, qui va limiter votre installation automatique est celui-ci: Although most questions used by debian-installer can be preseeded using this method, there are some notable exceptions. You must (re)partition an entire disk or use available free space on a disk; it is not possible to use existing partitions. Ce qui veut dire que vous ne POUVEZ PAS INSTALLER Ubuntu, de manière automatique (Kickstart ou debian-installer), si vous n’avez pas une partition LIBRE sur votre disque cible.
Sensibilité Kickstart pour Ubuntu est très peu sensible aux changements de version du système d’exploitation, contrairement à RedHat ou Fedora. Cela est dû à la grande stabilité, dans le temps, du debianinstaller. Ce qui signifie que votre fichier Kickstart fonctionnera tel quel au gré des versions d’Ubuntu. Cerise sur le gâteau, l’url qui pointe sur votre distribution Ubuntu dans le fichier Kickstart est toujours la même, la différence entre versions ne se fait qu’avec l’amorce que vous utilisez pour démarrer votre installation.
Premiers pas Il faut utiliser le system-config-kickstart pour générer son premier fichier Kickstart. Il vous permettra d’avoir la liste des paquetages à installer, ainsi que tous les mots-clés, d’une manière simple et efficace. Kickstart pour Ubuntu est très peu sensible aux changements de version du système d’exploitation, contrairement à RedHat ou Fedora. Cela est dû à la grande stabilité, dans le temps, du debianinstaller. Ce qui signifie que votre fichier Kickstart fonctionnera tel quel au gré des versions d’Ubuntu. Cerise sur le gâteau, l’url qui pointe sur votre distribution Ubuntu dans le fichier Kickstart est toujours la même, la différence entre versions ne se fait qu’avec l’amorce que vous utilisez pour démarrer votre installation.
Premiers pas Il faut utiliser le "system-config-kickstart" pour générer son premier fichier Kickstart. Il vous permettra d’avoir la liste des paquetages à installer, ainsi que tous les mots-clés, d’une manière simple et efficace.
Sur la page précédente, vous avez un exemple de fichier Kickstart, fonctionnant très bien, qui pourra vous servir par la suite. Dans cet exemple, la post-installation est volontairement longue, mais pas obligatoire, afin de bien montrer tout ce que l’on peut faire avant de mettre en route notre système.
Packages Dans la section %packages, une entrée par ligne, on spécifie soit un groupe (@) de paquetage ou juste un nom de paquetage. Vous pouvez voir la liste des groupes possibles, à l’aide de la commande suivante: tasksel --list-tasks
et la liste complète des paquetages se trouve ici: Ubuntu Packages [6].
Post-installation Ici aussi voir [1], la post-installation se fera non pas à l’installation du système, mais au premier démarrage du système. On utilise le service rc.local qui va exécuter notre script postInstall.sh qu’on a pris soin de mettre en place dans la partie %post de notre fichier Kickstart.
Installation Quelle que soit la méthode d’amorçage choisie, vous devez passer le paramètre ks=… comme paramètre de boot, voir [1]. Par exemple à l’invite de démarrage (boot prompt): linux ks=cdrom:/ks.cfg ou linux ks=http://http_server.epfl.ch/ks_dir/ks.cfg
Pour plus de détails concernant le passage de paramètres au démarrage, voir l’article Personnaliser vos images ISO Linux [7].
Conclusion Vous pouvez voir la liste complète des questions/réponses (format preseed) avec lesquelles votre système a été installé, en utilisant les commandes suivantes: sudo debconf-get-selections --installer > \ presseed.txt sudo debconf-get-selections >> presseed.txt
mais cela reste assez indigeste, raison pour laquelle je vous conseille d’utiliser Kickstart.
Références [1] flashinformatique.epfl.ch/spip.php ?article2539 [2] https://help.ubuntu.com/12.04/installation-guide/i386/appendix-preseed.html [3] https://help.ubuntu.com/12.04/installation-guide/examplepreseed.txt [4] https://help.ubuntu.com/community/KickstartCompatibility [5] https://help.ubuntu.com/12.04/installation-guide/i386/automatic-install.html [6] packages.ubuntu.com [7] flashinformatique.epfl.ch/spip.php ?article2203.
Article du FI-EPFL 2012 sous licence CC BY-SA 3.0 / B. Barras
14 flash informatique
Logiciel libre
Rencontres Mondiales du Logiciel Libre 2012 Benjamin.Barras@epfl.ch, EPFL - Domaine IT, responsable des lightning talks, Anne.Possoz@epfl.ch, EPFL - Domaine IT, responsable du programme & Vittoria.Rezzonico@epfl.ch, EPFL - CSE, responsable du thème Recherche et Université
The Libre Software Meeting 1 (LMS) is a great opportunity for the numerous actors of Free Software to meet and discuss for several days and share some fun, meet new people for the first time after a long time remote collaboration, create new projects. It is a place where creativity can be free in a casual and festive environment. Cette année les Rencontres Mondiales du Logiciel Libre 1 (RMLL) auront lieu à Genève, après Strasbourg en 2011, Bordeaux en 2010, Nantes en 2009, etc. 2 Une multitude d'activités autour du libre (conférences, festival, table rondes,...) émaillent ces six journées ouvertes à toutes et à tous, du grand public à l'expert.
Le programme Week-end grand public Les rencontres commencent par un week-end grand public qui aura lieu à la Maison communale de Plainpalais. À l’heure où nous écrivons ces lignes, le programme est encore en chantier mais devrait être une belle occasion pour tout un chacun de découvrir des outils libres, de demander de l’aide les concernant ou encore d’apprendre à participer à des projets libres. Des associations seront présentes, des ateliers organisés, des films projetés. Les jeunes ne seront pas oubliés.
La semaine de rencontre, ouverte au public Au cœur des 4 jours qui suivent, du 9 au 12 juillet, l’UNI-Mail sera le théâtre de conférences, d’ateliers et de tables rondes, en plus du boulevard du Libre, et hébergera diverses assemblées, toujours autour du Libre. Tout au long de l’évènement, le soir, aura lieu le Festival des Arts Numériques Libres.
Genève du 7 au 12 juillet 2012 Web: 2012.rmll.info Les Rencontres Mondiales du Logiciel Libre (RMLL) sont l’occasion pour de nombreux acteurs du libre de se rencontrer dans un même espace pendant quelques jours. Partager des moments ensemble, faire de nouvelles connaissances, voir pour la première fois d’autres personnes avec qui l’on est en relation électronique depuis longtemps, élaborer de nouveaux projets… un lieu de ressourcement et de créativité, dans une ambiance décontractée et festive. Ouvertes gratuitement au public, les RMLL sont aussi un vaste programme de conférences, tables rondes et ateliers pratiques autour du Logiciel Libre et de ses usages. Selon les années et les lieux de ces rencontres, les thèmes abordés varient. Les RMLL 2012 ayant lieu cette année à Genève, un thème Médias, radio, télévision et graphisme professionnel a vu le jour, profitant de la présence locale de l’EBU (European Broadcasting Union 3), association de diffuseurs nationaux de radio et télévision, qui vise à la coopération et l’échange de contenu. Pendant deux jours, l’EBU fera ses conférences au sein des RMLL en synergie avec le graphisme professionnel.
Les conférences, ateliers et tables rondes Plus de 200 conférences sont organisées en parallèle. Les thèmes abordés sont repris dans le programme de cette année 4. Le français et l’anglais sont les deux langues des conférences.
Lightning talks Pour la première fois lors des RMLL, nous avons prévu chaque jour une session de 10 lightning talks. Il s’agit de présenter en 5 minutes (et pas une plus…), un sujet ayant un rapport direct ou indirect avec le logiciel libre. Ce peut être un projet, une entreprise, un programme, du matériel, une technique, une idée ou toute autre chose que seul l’esprit humain est capable d’imaginer et qui en fait l’honneur… Le but est de donner la parole aux personnes qui ont quelque chose à présenter et à partager, mais qui ne souhaitent pas en faire une conférence ou pensent que le sujet ne s’y prête pas. Les pré-inscriptions se feront depuis le site des RMLL.
Help point Que ce soit pour installer ou utiliser des logiciels libres, pour apprendre à compléter des données dans OpenStreetMap ou dans Wikipédia, pour avoir un conseil sur le choix d’un logiciel, il sera possible de s’adresser à des libristes disponibles pour répondre à ces demandes.
3 4
1
2012.rmll.info
2
un historique de toutes les RMLL est préservé 2012.rmll.info/a-propos-des-rmll/historique www.ebu.ch/en/about/index.php 2012.rmll.info/programme
12 JUIN 2012 - N°5
15
Rencontres Mondiales du Logiciel Libre 2012
Festival des Arts Numériques Libres Pas de RMLL sans ses nocturnes, moment de détente festif, ouvert tant aux participants qu’à la population locale. Si le programme n’est pas encore en place, on sait déjà qu’il sera fait de concerts, spectacles, projection de films et autres performances artistiques, toujours dans la philosophie du Libre. Sans oublier les geeks qui, dans cette ambiance, continueront à coder…
Boulevard du libre Espace d’échange et de partage, le boulevard du libre est une occasion rare de rencontrer un grand nombre de communautés actives autour du libre. De nombreux stands présentent leurs diverses activités. Laissez-vous surprendre par la diversité des projets collaboratifs, dans un nombre étonnant de domaines différents.
Repas du libre L’avant dernier soir est toujours dédié au traditionnel repas du libre, occasion de découvrir la cuisine locale et de penser déjà aux prochaines RMLL.
Organisation L’organisation de ces RMLL est faite à cent pour cent par des bénévoles. À l’aide de wiki, mailing-listes, chat, site Web, les responsables des divers aspects construisent le programme. Les conférences sont sélectionnées suite à un appel à conférence. Des logements peu chers sont mis à disposition; cette année ce sera la caserne des Vernets; en plus de cela, un système de logement chez l’habitant a été mis en place 5. Les seuls frais pris en charge sont les frais de transport des conférenciers qui en font la demande.
Actualités
FI spécial été 2012 Le document et les données Appel aux articles – délai rédaction: 02.07.12 Le FI spécial été est l'occasion de rassembler autour d’un thème des articles en provenance de lieux et de spécialisations différentes. En 2012: les réflexions porteront sur le document et les données. Nous sommes, en effet, à l'époque charnière du presque tout numérique, où le document et les données, qui sont le cœur souvent méconnu de nos systèmes d’information, sont en pleine évolution. Quelques pistes sous forme d'interrogations: z Avec le stockage sur les nuages, nul ne sait plus où se trouvent physiquement ses données: d’où les interrogations sur leur pérennité, sur les droits d’accès (public, privé, limité), sur la pertinence d'en crypter certaines ? z À qui appartiennent les documents ? les DRM sont-ils légitimes, qu’est devenue la notion de copyright ? z Le dispositif de lecture (tablette, liseuse, smartphone …) modifie-t-il notre perception du document, et également sa production ? z Accès aux données: beaucoup d’initiatives militent pour un accès ouvert et gratuit à des données d’intérêt public (Open data, Web des données) ou scientifiques (Open Access), quels en sont les enjeux ? z Qui dit document ou données, dit format, éternel sujet de réflexion: quel est le format le plus pérenne, le plus ouvert, le plus adapté ? Comment structurer les données afin qu’elles soient réutilisables ? z Que deviennent les bibliothèques, elles qui ont toujours été des lieux de transmission de savoir ? z Nous laissons derrière nous des documents-traces de nos vies, comment et pourquoi se protéger ? Si ce vaste sujet vous inspire, n'hésitez pas à me contacter. Jacqueline.Dousson@epfl.ch, Domaine IT
DIT-info Nouveau technicien au DIT-SUP
Informations Pour plus d’informations, vous pouvez visiter le site Web rmll.info, et, lors de la manifestation, vous pourrez vous synchroniser sur la radio-tv RMLL 6 qui sera opérationnelle dès le début des festivités. Article du FI-EPFL 2012 sous licence CC BY-SA 3.0 / B.Barras, A. Possoz & V. Rezzonico 2012.rmll.info/participer/hebergez-un-geek 2012.rmll.info/radio-tv-rmll
5 6
Nous avons le plaisir de compter parmi nous depuis le 1er avril 2012, comme nouveau technicien dans le groupe de support des services centraux du DIT-SUP, Ludovic Houmard. Ludovic a fait un CFC de médiamaticien et une maturité professionnelle. Il a travaillé au niveau de la gestion du parc IT du groupe Elsa-Mifroma, comme stagiaire chez Philip Morris et comme stagiaire dans notre groupe il y a quelques années. Il est revenu avec de très bonnes connaissances techniques du support aux utilisateurs et de nos procédures et clients. En plus du support aux utilisateurs, Ludovic viendra renforcer le support au niveau des serveurs et des desktops virtuels qui était assuré jusqu’à présent par Olivier Michaud et moi-même. Nous lui souhaitons la bienvenue parmi nous. Daniel.Perret@epfl.ch, Domaine IT ISSN 1420-7192