Vertex AI Workbench 簡介
Vertex AI Workbench 執行個體是以 Jupyter 筆記本為基礎的開發環境,支援完整的資料科學工作流程。您可以透過 Vertex AI Workbench 執行個體的 Jupyter 筆記本,與 Vertex AI 和其他 Google Cloud 服務互動。
Vertex AI Workbench 整合功能和功能可讓您更輕鬆地存取資料、加快資料處理速度、排定筆記本執行時間等。
Vertex AI Workbench 執行個體已預先安裝 JupyterLab 和一套深度學習套件,包括支援 TensorFlow 和 PyTorch 架構。您可以設定只使用 CPU 或已啟用 GPU 的執行個體。
Vertex AI Workbench 執行個體支援與 GitHub 存放區同步。
Vertex AI Workbench 執行個體受到 Google Cloud 驗證和授權機制保護。
存取資料
不必離開 JupyterLab 使用者介面,也能存取資料。
在 Vertex AI Workbench 執行個體的 JupyterLab 導覽選單中,您可以使用 Cloud Storage 整合功能,瀏覽可存取的資料和其他檔案。請參閱「從 JupyterLab 存取 Cloud Storage bucket 和檔案」。
您也可以使用 BigQuery 整合功能,瀏覽可存取的資料表、編寫查詢、預覽結果,以及將資料載入筆記本。請參閱「在 JupyterLab 內查詢 BigQuery 資料表中的資料」。
執行筆記本執行作業
使用執行器執行筆記本檔案 (一次性執行或排定時間執行)。選擇要執行作業的特定環境和硬體。筆記本的程式碼會在 Vertex AI 自訂訓練中執行,方便您進行分散式訓練、最佳化超參數,或排定持續訓練工作。
您可以在執行作業中使用參數,針對每次執行進行特定變更。 舉例來說,您可以指定要使用的其他資料集、變更模型的學習率,或是變更模型版本。
您也可以設定筆記本,讓筆記本按照週期性時間表執行。即使執行個體已關閉,Vertex AI Workbench 仍會執行筆記本檔案並儲存結果,方便您查看及與他人分享。請參閱「排定筆記本執行時間」。
分享洞察資料
執行過的筆記本會儲存在 Cloud Storage 值區,因此您可以授予結果存取權,與他人分享洞察資料。請參閱上節的筆記本執行作業。
保護執行個體
以下各節說明支援的功能,可協助您保護 Vertex AI Workbench 執行個體。
虛擬私有雲
您可以透過預設的 Google 代管網路部署 Vertex AI Workbench 執行個體,該網路會使用預設的虛擬私有雲網路和子網路。您可以指定要與執行個體搭配使用的虛擬私有雲網路,而非預設網路。
如要在服務安全防護範圍內使用 Vertex AI Workbench,請參閱「在服務安全防護範圍內使用 Vertex AI Workbench 執行個體」。
由客戶管理的加密金鑰 (CMEK)
根據預設, Google Cloud 系統會使用 Google 代管的加密金鑰,在資料處於靜態狀態時自動加密。如果您在保護資料的金鑰方面有特定的法規遵循或監管要求,可以在 Vertex AI Workbench 執行個體中使用客戶自行管理的加密金鑰 (CMEK)。詳情請參閱「客戶管理的加密金鑰」。
機密運算
您可以使用機密運算技術,加密使用中的資料。如要使用機密運算,請在建立 Vertex AI Workbench 執行個體時啟用機密 VM 服務。如要開始使用,請參閱建立機密運算執行個體。
自動關閉閒置執行個體
為協助控管費用,Vertex AI Workbench 執行個體預設會在閒置一段時間後關閉。你可以變更時間長度或關閉這項功能。詳情請參閱「閒置關機」。
新增 conda 環境
Vertex AI Workbench 執行個體會使用以 conda 環境為基礎的核心。您可以將 conda 環境新增至 Vertex AI Workbench 執行個體,該環境會以核心的形式顯示在執行個體的 JupyterLab 介面中。
新增 conda 環境後,您就能使用預設 Vertex AI Workbench 執行個體中沒有的 Kernel。舉例來說,您可以為 R 和 Apache Beam 新增 conda 環境。您也可以為特定舊版架構 (例如 TensorFlow、PyTorch 或 Python) 新增 conda 環境。
詳情請參閱「新增 conda 環境」。
自訂容器
您可以根據自訂容器建立 Vertex AI Workbench 執行個體。從 Google 提供的基本容器映像檔開始,並根據需求進行修改。然後根據自訂容器建立執行個體。
詳情請參閱「使用自訂容器建立執行個體」。
整合 Dataproc
您可以在 Dataproc 叢集上執行筆記本,快速處理資料。設定叢集後,您可以在 JupyterLab 使用者介面中執行筆記本檔案。詳情請參閱「建立啟用 Dataproc 的執行個體」一文。
使用第三方憑證建立執行個體
您可以透過 Workforce Identity Federation 提供的第三方憑證,建立及管理 Vertex AI Workbench 執行個體。員工身分聯盟會使用外部識別資訊提供者 (IdP),透過 Proxy 授予一組使用者存取 Vertex AI Workbench 執行個體的權限。
如要授予 Vertex AI Workbench 執行個體的存取權,請將工作人員集區主體指派給 Vertex AI Workbench 執行個體的服務帳戶。
詳情請參閱「使用第三方憑證建立執行個體」。
Vertex AI Workbench 執行個體的標記
Vertex AI Workbench 執行個體的基礎 VM 是 Compute Engine VM。您可以透過 Vertex AI Workbench 執行個體的 Compute Engine VM,為該執行個體新增及管理資源標記。
建立 Vertex AI Workbench 執行個體時,Vertex AI Workbench 會附加 Compute Engine 資源標記 vertex-workbench-instances:prod=READ_ONLY
。這個資源標記僅供內部使用。
如要進一步瞭解如何管理 Compute Engine 執行個體的標記,請參閱「管理資源的標記」。
限制
規劃專案時,請注意 Vertex AI Workbench 執行個體的下列限制:
系統不支援第三方 JupyterLab 擴充功能。
使用 Access Context Manager 和 Chrome Enterprise 進階版,透過情境感知存取控制項保護 Vertex AI Workbench 執行個體時,系統會在使用者每次向執行個體驗證身分時評估存取權。舉例來說,使用者首次存取 JupyterLab 時,系統會評估存取權,之後只要網頁瀏覽器的 Cookie 過期,系統也會評估存取權。
使用並非衍生自 Google 提供的基礎容器 (
gcr.io/deeplearning-platform-release/workbench-container:latest
) 的自訂容器,會增加與我們服務發生相容性問題的風險,且不支援這類容器。請改為修改基本容器,建立符合需求的自訂容器,然後使用自訂容器建立執行個體。Vertex AI Workbench 執行個體會預期使用
cloud-notebooks-managed
專案中的映像檔。您可以在 Google Cloud 控制台的建立頁面查看映像檔名稱清單。雖然可以搭配 Vertex AI Workbench 執行個體使用自訂虛擬機器 (VM) 映像檔或深度學習 VM 映像檔,但如果使用這些映像檔時發生非預期行為或故障,Vertex AI Workbench 不提供任何支援。系統不支援使用使用者自行管理的筆記本映像檔或代管筆記本映像檔,建立 Vertex AI Workbench 執行個體。
您無法使用 Google Cloud 控制台或 Compute Engine API 編輯 Vertex AI Workbench 執行個體的基礎 VM。如要編輯 Vertex AI Workbench 執行個體底層的 VM,請使用 Notebooks API 中的
projects.locations.instances.patch
方法,或 Google Cloud SDK 中的gcloud workbench instances update
指令。如果執行個體使用 VPC Service Controls,則不支援使用執行器。
如要在 Vertex AI Workbench 執行個體中使用加速器,您要使用的加速器類型必須在執行個體所在區域提供。如要瞭解各區域的加速器供應情形,請參閱 GPU 區域和區域供應情形。