Sciences Informatiques Spécialité : Informatique : Ordonnancement-Applications-Paralleles

Sciences Informatiques Spécialité : Informatique


Les workflows scientifiques sont couramment utilisés pour modéliser une application scientifique [1–3]. Ils décrivent un ensemble de traitement qui permettent d’analyser les données de manière structurée et distribuée et ont été utilisés pour réaliser des avancées scientifiques significatives dans divers domaines tels que la biologie [4, 5], la physique [6–8], la médecine [9, 10], l’astronomie [11, 12], etc. Leur importance est mise en évidence à l’ère du Big Data [13, 14]. Le Big Data est un concept permettant de stocker et d’analyser un nombre indicible d’informations sur une base numérique. Les données à traiter deviennent de plus en plus volumineuses et de grande taille, rendant ces applications des “data-intensives” [15–17]. Une application data-intensive est une classe d’applications parallèles qui utilisent une approche parallèle des données pour traiter de gros volumes de données, généralement de taille téraoctet ou pétaoctet [18–20]. L’émergence du cloud computing a apporté de nombreux avantages au déploiement de workflows scientifiques à grande échelle [21]. En particulier, les ressources du cloud computing en tant que service offrent une infrastructure facilement accessible, flexible et évolutive pour le déploiement des workflows scientifiques [22]. L’infrastructure en tant que service (Infrastructure as a Service : IaaS) est une forme de cloud computing offrant des ressources informatiques au sein d’un environnement virtualisé (le cloud computing)
par le biais d’internet ou d’une connexion spécialisée. L’IaaS est l’une des trois principales catégories de services de cloud computing, au même titre que le logiciel en tant que service (Software as a Service : SaaS) et la plateforme en tant que service (Platform as a Service : PaaS) [23].