Skip to main content

GCPでのMachine Learning

このガイドに従って、Google Cloud Platform (GCP)プライベートデータ処理用にMachine Learningモジュールをデプロイします。

必要条件

Machine Learningモジュールを展開する前に、プライベートデータ用のGCPプロジェクトとVPCのセットアップページで次の手順を完了する必要があります。

  1. 仮想プライベートネットワークの設定」セクションで説明されているように、Alteryx One専用のVPCが設定されている。

  2. IAMの設定」セクションで説明されているように、サービスアカウントとサービスアカウントに紐付いたベースIAMロールが用意されている。

  3. プライベートデータ処理のプロビジョニングをトリガーする」セクションで説明されているように、プライベートデータ処理のプロビジョニングが正常にトリガーされている。

プロジェクトの設定

ステップ1: IAMの設定

ステップ1a: IAMをサービスアカウントに紐付ける

次の追加ロールを、プライベートデータ用のGCPプロジェクトとVPCのセットアップで作成したaac-automation-saサービスアカウントに割り当てます。

  • Computeロードバランサ管理者: roles/compute.loadBalancerAdmin

  • Computeインスタンス管理者(v1): roles/compute.instanceAdmin.v1

  • Computeストレージ管理者: roles/compute.storageAdmin

  • Kubernetes Engineクラスタ管理者: roles/container.clusterAdmin

  • ストレージ管理者: roles/storage.admin

  • Cloud Memorystore Redis管理者: roles/redis.admin

ステップ2: サブネットの設定

注記

Designer Cloud は、Machine LearningAuto Insights、およびApp Builderとサブネットの設定を共有します。これらのアプリケーションを複数展開している場合、サブネットの設定は一度のみ必要になります。

プライベートデータ処理環境のMachine Learningには、3つのサブネットが必要です。以前VPCの作成時に、aac-privateサブネットを作成しています。再度作成する必要はありませんが、ここではすべてを説明するため記載しています。

  • aac-gke-node (必須): GKEクラスターは、このサブネットを使用してAlteryxソフトウェアのジョブ(接続、変換、処理、公開)を実行します。

  • aac-public (必須): このグループでサービスは実行されませんが、gke_node groupがクラスターからの出力にこのサブネットを使用します。

  • aac-private (必須): このグループは、PDP専用にサービスを実行します。

ステップ2a: VPCでサブネットを作成する

aac-vpc VPCでサブネットを設定します。

以下の例に従ってサブネットを作成します。サブネットサイズとセカンダリサブネットサイズは、利用中のネットワークアーキテクチャに合わせて調整できます。

アドレス空間は、完全にスケールアウトされたデータ処理環境に対応するように設計されています。必要に応じてアドレス空間を小さくすることもできますが、処理負荷が高くなったときにスケーリングに問題が発生する可能性があります。

重要

サブネット名は固定されているため、次のテーブルと一致している必要があります。

サポートされているリージョンの一覧から任意のリージョンを選択できます。ただし、同じリージョンをサブネットリージョンにも使用する必要があり、この後の「プロビジョニングのトリガー」ステップでも同じリージョンを使用する必要があります。

サブネット名

サブネット

セカンダリサブネット名

セカンダリサブネットサイズ

メモ

aac-gke-node

10.0.0.0/22

aac-gke-pod

10.4.0.0/14

GKEクラスター、GKE Pod、GKEサービスサブネット。

 

aac-gke-service

10.64.0.0/20

 

aac-public

10.10.1.0/25

N/A

N/A

パブリックエグレス。

ステップ2b: サブネットのルートテーブル

サブネット用のルートテーブルを作成します。

重要

登録しているインターネットへのネットワーク接続を使用してVnetを設定する必要があります。

注記

このルートテーブルは一例です。

アドレス接頭辞

ネクストホップタイプ

/22 CIDRブロック(aac-gke-node)

aac-vpc

/24 CIDRブロック(aac-private)

aac-vpc

/25 CIDRブロック(aac-public)

aac-vpc

0.0.0.0/0

<gateway_ID>

注記

<gateway id>は、お使いのネットワークアーキテクチャに応じて、NATゲートウェイまたはインターネットゲートウェイのいずれかになります。

プライベートデータ処理

注意

プライベートデータ処理を設定した後に、Alteryx Oneをプロビジョニングされたパブリッククラウドリソースを変更または削除すると、不整合が生じる可能性があります。これらの不整合により、ジョブの実行中またはプライベートデータ処理設定のプロビジョニング解除時にエラーが発生する可能性があります。

ステップ1: Machine Learningのデプロイをトリガーする

データ処理のプロビジョニングは、Alteryx One内の管理者コンソールからトリガーされます。このページを表示するには、ワークスペース内のワークスペース管理者権限が必要です。

  1. Alteryx Oneのランディングページで[プロファイル]メニューを選択し、[ワークスペース管理者]を選択します。

  2. 管理者コンソールから[プライベートデータ処理]を選択し、[Processing]を選択します。

  3. [Machine Learning]チェックボックスを選択し、[更新]を選択します。

[更新]を選択すると、GCPプロジェクト内のクラスターとリソースのデプロイがトリガーされます。これにより、一連の検証チェックが実行され、GCPプロジェクトの設定が正しいことが確認されます。

注記

プロビジョニングプロセスの完了には、約35-40分かかります。

プロビジョニングが完了すると、作成したリソース(VMインスタンスやノードグループなど)をGCPコンソールから表示できます。これらは絶対に自分で変更しないでください。手動で変更すると、プライベートデータ処理環境の機能に問題が発生する可能性があります。

ステップ2: KubernetesサービスアカウントのIAMロールの更新

プライベートデータ処理が正常に設定されると、credential-pod-saという名前のKubernetesサービスアカウントが作成されます。このアカウントにより、Kubernetes資格情報サービスが、キー保管庫に保存されているプライベートデータ資格情報にアクセスできるようになります。

注記

<project number><project id>を、プロジェクトのプロジェクト番号とプロジェクトIDに置き換えます。

  1. [鍵管理]に移動し、ステップ5: キーリングとキーの作成で作成したキーを持つキーリングを選択します。

  2. [PERMISSIONS]を選択し、[GRANT ACCESS]を選択します。

  3. [新しいプリンシパル]フィールドに、次のように入力します。

    principal://iam.googleapis.com/projects/<project-number>/locations/global/workloadIdentityPools/<project-id>.svc.id.goog/subject/ns/credential/sa/credential-pod-sa
    
  4. Cloud KMS暗号鍵の暗号化/複合ロールおよびSecret Manager管理者ロールを付与します。

  5. [保存]を選択します。