Commit 2fc93674118f6b614d3a3b341a69391bbef1cbd7
1 parent
508916cb27
Add previous reflexions on data-analysis workflow and virtual environments
Showing 2 changed files with 102 additions and 0 deletions Inline Diff
data-workflow.md
View file @
2fc9367
File was created | 1 | Workflow pour l'analyse de données | ||
2 | ================================== | |||
3 | ||||
4 | Créer un dossier qui contiendra les scripts, les notes et les données (ou un | |||
5 | lien vers les données). | |||
6 | ||||
7 | - versionner le dossier avec git | |||
8 | - RStudio pour le traitement des données | |||
9 | - knitr + Markdown pour les notes | |||
10 | ||||
11 | Pas besoin de dater ou signer le document (Rpubs et git contiennent déjà ces | |||
12 | informations). | |||
13 | ||||
14 | Externaliser le code du Rmd dans un fichier source qui pourra être | |||
15 | implicitement (`echo=FALSE`) inclus dans un futur rapport. | |||
16 | ||||
17 | Toujours fixer la graine. | |||
18 |
environment.md
View file @
2fc9367
File was created | 1 | Gestion des environnements de travail | ||
2 | ===================================== | |||
3 | ||||
4 | Plusieurs enjeux : | |||
5 | ||||
6 | - fournir des environnements reproductibles pour les expériences de recherche | |||
7 | - fournir des environnements adaptés aux besoins pédagogiques | |||
8 | - fournir des environnements facilitant le prototypage de solutions pour les | |||
9 | besoins administratifs | |||
10 | ||||
11 | Plusieurs solutions populaires : | |||
12 | ||||
13 | - `veewee` : production automatisée d'images virtuelles | |||
14 | - développement actif par un développeur principal (25%) depuis 2011 | |||
15 | - prend en entrée une iso d'install et un fichier de conf | |||
16 | - produit des images VirtualBox, KVM et VMWare | |||
17 | - fournit de nombreux exemples de configuration | |||
18 | - `vagrant` : automatise et facilite la configuration et l'exécution d'une VM | |||
19 | - développement actif par un développeur principal (75%) depuis 2010 | |||
20 | - nécessite une image (boîte) | |||
21 | - prend un fichier de configuration pour finaliser la configuration de l'image | |||
22 | - nécessite une machine virtuelle (VirtualBox, VMWare, AWS pour Amazon, KVM | |||
23 | avec `vagrant-kvm`) | |||
24 | - s'interface entre l'image et la machine virtuelle pour automatiser | |||
25 | l'étape de configuration (commune à toutes les VM) | |||
26 | - facilite la configuration réseau et la synchronisation des données | |||
27 | (peut-être VirtualBox le fait-il déjà) | |||
28 | - `chef`, `puppet` : configuration et administration automatisée | |||
29 | - développement actif par plusieurs développeurs depuis 2008 | |||
30 | - au coude à coude, tous les deux en ruby | |||
31 | ||||
32 | Veewee | |||
33 | ------ | |||
34 | ||||
35 | +-------------+ +--------+ | |||
36 | |Configuration|->| Veewee | | |||
37 | +-------------+ | | | |||
38 | | | | |||
39 | +---+ | | +-----------+ | |||
40 | |Iso|----------->| |->|Box (image)| | |||
41 | +---+ | | +-----------+ | |||
42 | | | | |||
43 | +-------------+ | | | |||
44 | |Provider (VM)|->| | | |||
45 | +-------------+ +--------+ | |||
46 | ||||
47 | Intérêts : | |||
48 | ||||
49 | - ABD | |||
50 | - environnement root plus proche d'une situation classique (outils plus | |||
51 | faciles à déployer et plus formateur pour les étudiants) | |||
52 | - diffuser des images contenant déjà les serveurs configurés avec les | |||
53 | données nécessaires | |||
54 | - possibilité d'avoir plusieurs serveurs | |||
55 | ||||
56 | Vagrant | |||
57 | ------- | |||
58 | ||||
59 | +-------------+ +-----------------------------------+ | |||
60 | |Configuration|->| Vagrant : exécution/provisioning | | |||
61 | +-------------+ | | | |||
62 | | +----------+ +------+ +---+ +---+ | | |||
63 | +-----------+ | |VirtualBox| |VMWare| |AWS| |...| | | |||
64 | |Box (image)|--->| +----------+ +------+ +---+ +---+ | | |||
65 | +-----------+ +-----------------------------------+ |