Meta économise des millions avec cette astuce de mémoire astucieuse

Meta économise des millions avec cette astuce de mémoire astucieuse

Les ingénieurs de la société mère de Facebook, Meta, ont révélé comment ils pouvaient offrir de la mémoire gratuite à l'aide d'une solution logicielle appelée Transparent Memory Offloading (TMO).

Il fait maintenant partie du noyau Linux et, en termes simples, il décharge automatiquement les données vers d'autres niveaux de stockage (par exemple, l'extenseur de mémoire CX de Samsung) qui sont moins chers et plus efficaces que la mémoire.

Les économies sont importantes; TMO fonctionne sur des millions de serveurs Facebook depuis plus d'un an, économisant jusqu'à près d'un tiers de la mémoire par serveur. Bien que cela soit probablement insignifiant sur des dizaines, voire des centaines de serveurs, l'ampleur même de Facebook présente un défi unique.

Analyse : le gigantesque appétit de Facebook pour la RAM

Le plus grand réseau social au monde compte près de trois milliards d'utilisateurs actifs mensuels et des millions de serveurs répartis sur 21 sites à travers le monde. Si cada servidor tuviera un promedio de 128 GB de RAM, eso representaría 256 millones de GB (o 256 PB) de RAM, lo que, a un costo promedio de €4 por GB (DDR4 ECC RAM), representa aproximadamente €1 mil millones par cœur. Cela suppose que Facebook possède au moins deux millions de serveurs (le blog de Facebook citait « des millions de serveurs » dès juillet 2018), et le nombre réel est probablement beaucoup plus élevé.

Les chiffres présentés par l'équipe qui a travaillé sur TMO ont montré que le coût de la mémoire représente un tiers de la nomenclature du serveur Meta, la RAM compressée et le SSD représentant moins de 11 %. Plus inquiétant, le coût de la RAM (en pourcentage de l'infrastructure totale) a plus que doublé depuis que Facebook a lancé sa première génération de serveurs (il en est actuellement à sa quatrième).

L'adoption de TMO présente certains inconvénients; plus précisément, la dégradation des performances. Mais les gains en termes d'économies d'énergie et de mémoire l'emportent largement sur les inconvénients, et les futures itérations combinées à des améliorations matérielles (par exemple, des SSD ou des CXL plus rapides) fourniront une atténuation supplémentaire.