AWS lance de nouvelles instances EC2 basées sur l'IA



La division cloud computing d'Amazon, Amazon Web Services (AWS), a lancé une nouvelle classe d'instances Elastic Compute Cloud (EC2) conçues exclusivement pour la formation de modèles d'apprentissage automatique (ML). Connues sous le nom de DL1, les nouvelles instances EC2 sont alimentées par les accélérateurs Gaudi de Habana Labs, propriété d'Intel, et, selon AWS, offrent un rapport qualité-prix jusqu'à 40 % supérieur pour la formation de modèles ML par rapport aux instances EC2 existantes alimentées par GPU. « L’ajout d’instances DL1 avec les accélérateurs Gaudi constitue à ce jour l’alternative la plus rentable aux instances basées sur GPU dans le cloud. Sa combinaison optimale de prix et de performances permet aux clients de réduire leurs coûts de formation, de former davantage de modèles et d'innover plus rapidement », a observé David Brown, vice-président d'Amazon EC2 chez AWS.

Démocratiser l'IA

AWS suggère que les nouvelles instances DL1 se prêtent aux cas d'utilisation populaires de ML, notamment le traitement du langage naturel (NLP), la détection et la classification d'objets, la détection de fraude, les moteurs de personnalisation et de recommandation, les documents intelligents, les prévisions commerciales, etc. Les clients peuvent utiliser des instances DL1 avec jusqu'à huit accélérateurs Gaudi, 256 Go de mémoire à large bande passante, 768 Go de mémoire système, des processeurs évolutifs personnalisés Amazon Xeon de 400e génération (Cascade Lake), un débit réseau de 4 Gbit/s et jusqu'à 1 To de NVMe local. stockage. Pour aider les clients à démarrer avec de nouvelles instances, AWS propose le SDK Havana SynapseAI, qui est intégré aux frameworks ML populaires, notamment TensorFlow et PyTorch. AWS explique que cela aidera les clients à migrer leurs modèles ML existants d'instances basées sur GPU ou CPU vers des instances DL1, avec un minimum de modifications de code. De plus, les développeurs et les data scientists peuvent commencer à utiliser les différents modèles de référence optimisés pour les accélérateurs Gaudí dans le référentiel Habana GitHub. Les instances DLXNUMX sont disponibles à la demande via un modèle d'utilisation à faible coût, payant à l'utilisation, sans engagement initial.