Reservierung nutzen

Wenn Sie eine TPU-Reservierung haben, können Sie die reservierten Ressourcen verwenden, um TPUs zu erstellen, die den Attributen der Reservierung entsprechen. Diese Aktion wird als Reservierung nutzen bezeichnet. Informationen zum Verwenden einer TPU-Reservierung bei zeitgleicher Verwendung von GKE finden Sie in der GKE-Dokumentation unter TPU-Reservierung.

Eine bestimmte Reservierung nutzen

Wenn Sie Ressourcen mit dem Befehl gcloud alpha compute tpus queued-resources create erstellen, verwenden Sie das Flag --reservation, um den Namen der zu verwendenden Reservierung anzugeben. Für vorausschauende Reservierungen, die im Kalendermodus erstellt wurden, müssen Sie außerdem das --provisioning-model-Flag auf reservation-bound setzen:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

Ersetzen Sie folgende Platzhaltervariablen:

  • QUEUED_RESOURCE_ID: Eine vom Nutzer zugewiesene ID für die Ressourcenanfrage in der Warteschlange.
  • TPU_NAME: Eine vom Nutzer zugewiesene ID (Name) für die TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
  • ZONE: Die Zone, in der die TPU-VM erstellt werden soll. Weitere Informationen zu unterstützten Zonen finden Sie unter Regionen und Zonen.
  • ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
  • SOFTWARE_VERSION: Die Cloud TPU-Softwareversion.
  • RESERVATION_URL: Die URL der Reservierung. Geben Sie einen der folgenden Werte an:
    • Wenn sich die Reservierung in Ihrem Projekt befindet: RESERVATION_NAME
    • Wenn sich die Reservierung in einem anderen Projekt befindet und Ihr Projekt sie nutzen kann: projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

Jede übereinstimmende Reservierung nutzen

Mit dem Flag --reserved können Sie die zu verwendende Reservierung automatisch anhand des Beschleunigertyps, der Projekt-ID und der Zone ermitteln lassen.

CreateNode

Wenn Sie eine passende Reservierung mit der CreateNode API nutzen möchten, verwenden Sie den gcloud alpha compute tpus tpu-vm create-Befehl mit dem --reserved-Flag:

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

Ersetzen Sie folgende Platzhaltervariablen:

  • TPU_NAME: Ein Name für die TPU.
  • ZONE: Die Zone, in der die TPU-VM erstellt werden soll. Sie muss mit der Reservierungszone übereinstimmen.
  • ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
  • SOFTWARE_VERSION: Die Cloud TPU-Softwareversion.

Ressourcen in Warteschlange

Wenn Sie eine übereinstimmende Reservierung mit in die Warteschlange gestellten Ressourcen nutzen möchten, verwenden Sie den gcloud alpha compute tpus queued-resources create-Befehl mit dem --reserved-Flag:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

Ersetzen Sie folgende Platzhaltervariablen:

  • QUEUED_RESOURCE_ID: Eine vom Nutzer zugewiesene ID für die Ressourcenanfrage in der Warteschlange.
  • TPU_NAME: Eine vom Nutzer zugewiesene ID (Name) für die TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
  • ZONE: Die Zone, in der die TPU-VM erstellt werden soll und in der die Reservierung vorhanden ist.
  • ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
  • SOFTWARE_VERSION: Die Cloud TPU-Softwareversion.

Reservierungsnutzung prüfen

Die Verwendung einer gemeinsam genutzten Reservierung kann nur über das Inhaberprojekt geprüft werden. Wenn Sie sich in einem Nutzerprojekt befinden, müssen Sie zum Inhaberprojekt wechseln, um die Reservierungsnutzung zu prüfen.

Mit dem Befehl gcloud compute reservations describe können Sie sehen, wie viel von der Reservierung verwendet wird:

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Ersetzen Sie folgende Platzhaltervariablen:

  • RESERVATION_NAME: Der Name der Reservierung.
  • PROJECT_ID: Die ID des Projekts, das die Reservierung enthält.
  • ZONE: Die Zone, in der die Reservierung vorhanden ist.

Verwenden Sie den Befehl gcloud compute reservations list, um alle Reservierungen in einem Projekt aufzulisten:

gcloud compute reservations list --project=PROJECT_ID

Ersetzen Sie die folgende Platzhaltervariable:

  • PROJECT_ID: Die ID des Projekts.

Weitere Informationen