GPU cloud

Louez des NVIDIA RTX 5090 en quelques secondes à partir de 0,40€/heure

Alimenté par la nouvelle architecture Blackwell. Facturation à la seconde. Clusters locaux aux Émirats arabes unis.

Le 5090 - jusqu'à 9x plus rapide qu'une 4090

Time-to-first-token (TTFT) : 45,4 ms, quasiment instantané et 84 % plus rapide qu’un A100.

Cluster double-GPU : 7 604 tokens/s, soit deux fois le débit d’un A100.

Voir les résultats complets du benchmark et la méthodologie ici.

Spécification

Valeur

Pourquoi c'est important

Architecture

Blackwell

Conçue sur un procédé 4NP pour rester efficace même sous forte charge.

Mémoire

32 GB GDDR7

Assez de marge pour exécuter des shards Llama-3 400B sans avoir à déplacer les données en permanence.

Bande passante

1,79 To/s

Déplace de très gros volumes de données rapidement, idéal pour la génomique et d’autres workloads intensifs.

Débit FP16

0,42 PFLOPS

Environ quatre fois plus rapide qu’une 3090 pour les modèles de diffusion.

Interface PCIe

Gen 5 × 16

Alimente le GPU aussi vite qu’il peut traiter les données.

TDP

475 W

Offre plus de tokens par watt que le H100 80 Go.

Balayez vers la gauche pour en voir plus

Servez des chatbots à 8 000 tokens par seconde sur une seule carte.

La mémoire GDDR7 assure un traitement 4K fluide, sans blocages I/O.

Accélérez vos étapes RL-HF grâce au PCIe 5.

Gérez des assemblages à longues lectures sans devoir fractionner vos workloads.

Joignez-nous à [email protected] ou via le chat intégré à l'application.