Thèse Optimisation de l'efficacité énergétique d'un centre de données par une méthode d'Intelligence Artificielle F/H
Thèse Lannion (Côtes-d'Armor) Développement informatique
Description de l'offre
about the role
L'évolution des architectures permettant de fournir les services des technologies de l'information (IT) et des télécommunications est en pleine mutation. D'une part l'évolution du cloud, des NFV, de l'IOT, la découverte et l'évolution des potentiels du big data induisent une croissance importante des architectures, d'autre part la consommation énergétique inhérente à cette révolution IT/télécom doit nécessairement être maîtrisée tant pour les aspects écologiques qu'économiques.
Au niveau de l'infrastructure et de l'environnement technique, d'importantes initiatives ont ainsi été lancées pour améliorer l'efficacité énergétique (énergie et climatisation).
Des économies importantes pourraient également être obtenues, sans investissement, si l'on disposait de système d'adaptation dynamique du cooling en fonction de la réalité de la salle, de l'enveloppe du bâtiment et des données météorologiques.
Au niveau matériel, les fabricants, conscients des enjeux, fournissent des équipements dotés de nouvelles fonctionnalités permettant de gérer au mieux leurs consommations énergétiques.
Enfin, au niveau logiciel, l'essor de la virtualisation (et du cloud) permet également d'exploiter plus intelligemment les serveurs physiques au consolidant les applications (virtualisation) sur un même serveur.
Toutes ces actions décorrélées visent à l'amélioration du monde ITN mais manquent pourtant d'une orchestration avancée qui permettrait d'effectuer une optimisation dynamique globale.
L'évolution des réseaux va impliquer la construction de nouveaux sites, comme des datacenters de proximité.
Le nombre de leviers à optimiser conjointement est colossal :
· Optimisation dynamique des systèmes de refroidissements, de façon plus granulaire en tenant compte de la charge réelle, de la position des machines, des conditions climatiques.
· Choix des machines à consolider via les VM,
· Position de ces machines dans la salle,
· Charge CPU atteinte, charge CPU optimale pour une machine donnée
· température optimale de la salle compte tenu de la charge à un instant, de la température extérieure.
Cette complexité rend illusoire toute tentative de développement d'un algorithme global de régulation.
Si l'on se concentre tout d'abord sur les systèmes de refroidissement. On a pour l'instant au mieux, une régulation ajustée à l'échelle de la salle, sans anticipation des conditions climatiques, ainsi une singularité localisée peut entraîner un gaspillage énergétique important.
Il est nécessaire de modifier la méthodologie de refroidissement en usage en permettant, via des systèmes à définir, de concentrer la distribution de froid uniquement où le besoin se trouve.
Si d'un point de vue matériel, cette amélioration relève de l'ingénierie, le pilotage optimisé du refroidissement localisé ne peut être effectué par les systèmes actuels, en raison d'un trop grand nombre d'actuateurs à commander et de données à recueillir et analyser. Par ailleurs, construire des lois de commande à partir des équations de la physique n'est pas envisageable.
Cette thèse ambitieuse vise principalement à développer des solutions d'optimisation du refroidissement afin d'adresser les sites existants et les nouveaux sites. Il s'agit ici de réduire la consommation du poste refroidissement en fournissant aux machines des débits de fluides dépendant de leur besoins dynamiques.
Si l'avancée des travaux le permet, cette étude pourra aussi fournir aux orchestrateurs, des informations sur les machines pouvant être consolidées, à partir de considérations énergétiques (distance par rapport à la capacité de cooling maximale de la salle, consommation des machines fournies par les mesures embarquées).
about you
Vous êtes en Master 2 ou école d'ingénieur (Data Science). Une expérience de l'application de l'IA dans le domaine ICT serait un plus.
additional information
L'objectif de cette thèse consistera à développer des algorithmes d'optimisation dynamique et localisé du cooling basé sur l'intelligence artificielle. Elle permettra d'aboutir à une meilleure efficacité énergétique grâce à un refroidissement adapté à la charge réelle des machines, aux conditions climatiques.Grâce aux informations fournies par cette solutions, l'allumage/extinction des machines pourrait s'effectuer sur des considérations énergétiques, et venir fournir à l'orchestrateur des informations clés pour la consolidation des serveurs.
Les défis et verrous à relever sont :
Quantifier le niveau de complexité du problème afin d'établir la/les solutions d'intelligence artificielle les plus adaptées (système déterministe, machine learning, deep learning à l'aide de réseaux neuronaux)
Sur la base des modèles déjà développés (modèles de serveurs, de thermiques du bâtiment, de modélisation des systèmes de refroidissement, etc.), simuler le fonctionnement des solutions d'IA développés.
Les mettre en oeuvre à une échelle réduite mais réaliste (OpenGreenLab)
Etre capable de généraliser la solution à des sites de taille supérieure.
Approche méthodologique proposée par le responsable technique
Dans un premier temps une bibliographie sera effectuée afin de dresser un état de l'art suffisant pour orienter les travaux de recherche. Elle portera notamment sur les composants électroniques, les équipements IT Telecom, l'environnement technique des sites ICT, les solutions de refroidissement et solutions de contrôles du refroidissement classiques basées sur des loi physiques (white box). les méthodes de modélisation (puissance consommée par les serveurs en fonction du service rendu, solutions de refroidissement), etc. Une recherche bibliographique d'envergure sera également menée sur les méthodes d'intelligence artificielle.
La solution d'AI sera développée et simulée afin d'optimiser le refroidissement en fonction des dissipations/consommations énergétiques réelles des machines.
Les grandeurs d'importance (cooling, température, énergie globale consommée, présence de sources renouvelables à valoriser) seront ajoutées étape par étape, afin d'enrichir la solution globale. Les grandeurs à considérer pour l'optimisation seront sélectionnées par le biais d'une étude de de sensibilité.
En fin de thèse, une expérimentation réelle devra avoir été réalisée et validée afin de garantir une industrialisation du procédé.
Planning Global du déroulement de la thèse (grandes lignes)
T0+ 3 mois : Bibliographie
T0+ 6 mois : Livrable sur présentant une description théorique d'une méthode d'intelligence artificielle adaptée à la problématique, ainsi que les grandeurs/actions à considérer après étude de sensibilité.
T0+ 12 mois : Première version de l'outil permettant d'optimiser l'optimisation du cooling par le biais d'une adaptation spatiale et temporelle basée sur des températures locales (mesures physiques ou embarquées), des dissipations locales.
T0+ 18 mois : Evolution de la solution d'intelligence artificielle afin de prendre en compte l'inertie thermique de la structure,et des conditions extérieures.
T0 + 24 mois : Extension des possibilités de l'outil à la prise en compte de la totalité des grandeurs/actions identifiées précédemment
T0 : 30 mois : Finalisation de l'outil et Proof of Concept.
department
L'équipe est composée d'ingénieurs, docteurs, HDR et techniciens avec une forte compétence technique et scientifique dans le domaine de l'énergie et de l'environnement. La recherche est effectuée au sein du laboratoire mais aussi en collaborations avec des universitaires ou des industriels (projets Européens), l'équipe accueille aussi des doctorants, apprentis.
Qu'est ce qui fait la valeur ajoutée de cette offre ?
Cette thèse vise à développer un outil d'optimisation globale de réseau/architecture IT au sens large et à définir un indicateur d'efficacité énergétique globale qui permettre d'orienter les choix d'environnement technique, les choix de matériel IT/télécom, les solutions logicielles.
Les enjeux en termes d'énergie mais aussi d'investissement sont donc majeurs et stratégiques pour Orange. Les résultats et indicateurs qui en résulteront auront par ailleurs vocation à être normalisés.
Références :
[1] Cloud et IoT vont exploser le trafic des datacenters en 2019, http://www.silicon.fr/cloud-trafic-datacenters-cisco-2019-130474.html
[2] Cop21 : comment limiter l'appétit en énergie de l'IT ? , http://www.silicon.fr/cop21-limiter-energie-it-129688.html
[3] S. Le Masson, D. Nörtershäuser “Complex Wall for Indirect Freecooling in Datacentres”
IEEE Intelec 978-1-4673-1000-0/12/$31.00 ©2012 IEEE
[4] F. Douchet, D. Nortershauser, S. Le Masson, P. Glouannec “Experimental and numerical study of water-cooled Datacom equipment” Applied Thermal Engineering 84 (2015)
[5] Power capping yields savings and floor space, http://www.infoworld.com/article/2631095/processors/power-capping-yields-savings-and-floor-space.html
[6] Examining Intel's New Speed Shift Tech on Skylake: More Responsive Processors http://www.anandtech.com/show/9751/examining-intel-skylake-speed-shift-more-responsive-processors
[7] Z.Wang, R. S. Srivinasan, “A review of artificial intelligence based building energy use prediction” Renewable and Sustainable Energy Reviews 75 (2017) 796-808
[8] J. Zhao & X. Liu, A hybrid method of dynamic cooling and heating load forecasting for office buildings based on artificial intelligence and regression analysis
[9] Xiaofei He, Zijun Zhang, Andrew Kusiak, Performance optimization of HVAC systems with computational intelligence algorithms, Energy and Buildings 81 (2014) 371-380
contract
Thesis