Reservierung nutzen
Wenn Sie eine TPU-Reservierung haben, können Sie die reservierten Ressourcen verwenden, um TPUs zu erstellen, die den Attributen der Reservierung entsprechen. Diese Aktion wird als Reservierung nutzen bezeichnet. Informationen zum Verwenden einer TPU-Reservierung bei zeitgleicher Verwendung von GKE finden Sie in der GKE-Dokumentation unter TPU-Reservierung.
Eine bestimmte Reservierung nutzen
Wenn Sie Ressourcen mit dem Befehl gcloud alpha compute tpus queued-resources
create
erstellen, verwenden Sie das Flag --reservation
, um den Namen der zu verwendenden Reservierung anzugeben. Für vorausschauende Reservierungen, die im Kalendermodus erstellt wurden, müssen Sie außerdem das --provisioning-model
-Flag auf reservation-bound
setzen:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_URL \ --provisioning-model=reservation-bound # Only required for calendar mode
Ersetzen Sie folgende Platzhaltervariablen:
- QUEUED_RESOURCE_ID: Eine vom Nutzer zugewiesene ID für die Ressourcenanfrage in der Warteschlange.
- TPU_NAME: Eine vom Nutzer zugewiesene ID (Name) für die TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
- ZONE: Die Zone, in der die TPU-VM erstellt werden soll. Weitere Informationen zu unterstützten Zonen finden Sie unter Regionen und Zonen.
- ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
- SOFTWARE_VERSION: Die Cloud TPU-Softwareversion.
- RESERVATION_URL: Die URL der Reservierung. Geben Sie einen der folgenden Werte an:
- Wenn sich die Reservierung in Ihrem Projekt befindet:
RESERVATION_NAME
- Wenn sich die Reservierung in einem anderen Projekt befindet und Ihr Projekt sie nutzen kann:
projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME
- Wenn sich die Reservierung in Ihrem Projekt befindet:
Jede übereinstimmende Reservierung nutzen
Mit dem Flag --reserved
können Sie die zu verwendende Reservierung automatisch anhand des Beschleunigertyps, der Projekt-ID und der Zone ermitteln lassen.
CreateNode
Wenn Sie eine passende Reservierung mit der CreateNode API nutzen möchten, verwenden Sie den gcloud
alpha compute tpus tpu-vm create
-Befehl mit dem --reserved
-Flag:
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
Ersetzen Sie folgende Platzhaltervariablen:
- TPU_NAME: Ein Name für die TPU.
- ZONE: Die Zone, in der die TPU-VM erstellt werden soll. Sie muss mit der Reservierungszone übereinstimmen.
- ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
- SOFTWARE_VERSION: Die Cloud TPU-Softwareversion.
Ressourcen in Warteschlange
Wenn Sie eine übereinstimmende Reservierung mit in die Warteschlange gestellten Ressourcen nutzen möchten, verwenden Sie den gcloud alpha compute tpus
queued-resources create
-Befehl mit dem --reserved
-Flag:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
Ersetzen Sie folgende Platzhaltervariablen:
- QUEUED_RESOURCE_ID: Eine vom Nutzer zugewiesene ID für die Ressourcenanfrage in der Warteschlange.
- TPU_NAME: Eine vom Nutzer zugewiesene ID (Name) für die TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
- ZONE: Die Zone, in der die TPU-VM erstellt werden soll und in der die Reservierung vorhanden ist.
- ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
- SOFTWARE_VERSION: Die Cloud TPU-Softwareversion.
Reservierungsnutzung prüfen
Die Verwendung einer gemeinsam genutzten Reservierung kann nur über das Inhaberprojekt geprüft werden. Wenn Sie sich in einem Nutzerprojekt befinden, müssen Sie zum Inhaberprojekt wechseln, um die Reservierungsnutzung zu prüfen.
Mit dem Befehl gcloud compute
reservations describe
können Sie sehen, wie viel von der Reservierung verwendet wird:
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
Ersetzen Sie folgende Platzhaltervariablen:
- RESERVATION_NAME: Der Name der Reservierung.
- PROJECT_ID: Die ID des Projekts, das die Reservierung enthält.
- ZONE: Die Zone, in der die Reservierung vorhanden ist.
Verwenden Sie den Befehl gcloud compute reservations
list
, um alle Reservierungen in einem Projekt aufzulisten:
gcloud compute reservations list --project=PROJECT_ID
Ersetzen Sie die folgende Platzhaltervariable:
- PROJECT_ID: Die ID des Projekts.
Weitere Informationen
- Informationen zu Cloud TPU-Reservierungen
- Reservierung für mehrere Projekten gemeinsam nutzen
- TPUs verwalten