Skip to main content

私有数据处理

私有数据处理是 Alteryx One Platform 中的一项功能,允许您在自己的云基础架构中存储数据和运行数据处理作业。私有数据处理为拥有敏感数据的用户提供了更强的安全保障和控制力。通过将 Alteryx One 中的处理移动至数据所在的位置,它还可以提高性能并降低出站流量成本。

警告

切勿删除为私有数据处理预配的资源。

概览

在最高级别,Alteryx One 会对客户数据应用程序元数据加以区分。

  • 客户数据属于您。这是来自您的一个数据源的任何数据以及从中衍生的任何数据。这包括您要连接和合并、准备和混合、分析和进行模型训练所使用的数据库、电子表格、共享驱动器及数据仓库中的记录。它还包括根据这些记录创建的输出、报告和数据集。

  • 应用程序元数据是指其余的所有内容。这是 Alteryx One 完成您指派的任务时所需的数据。这包括工作区布局和配置、用户登录、角色和权限、共享资产、工作流名称以及工具配置。一些具体示例包括:

    • Designer Cloud 工具配置和布局。

    • Auto Insights 报告文本输入和分析参数(筛选条件值、列名)。

    • App Builder 下拉框内容。

    • 用户生成的内容,如关于 Magic Reports 的注释。

Alteryx One 采用分离平面架构,并将针对这两种类数据的处理职责划分至不同的平面,从而为客户提供更高的灵活性。这两个平面是控制平面和数据平面。

平面

描述

控制平面

控制平面可驱动用户的设计时体验,充当指挥与控制中心,并存储应用程序元数据。

数据平面

数据平面负责客户数据的持久性存储和处理。

持久性存储

Alteryx One Platform 利用文件和关系型数据存储来长期存储客户数据。文件存储用于:

  • 已上传的输入文件。

  • Designer Cloud 数据样本。

  • 作业输出。

  • 处理作业执行期间的临时文件和缓存。

关系型存储

  • Auto Insights 分析输出。

  • Copilot 对话历史记录。

正在处理

Alteryx One Platform 负责执行许多属于处理类别的作业,例如:

  • 连接到客户数据源。

  • 生成数据样本。

  • 摄取数据集

  • 数据的运行时处理。

  • 将运行时输出写入指定的目标。

  • 结构化数据在关系型数据库中的持久性存储

私有数据处理允许您在自己的基础架构上运行部分或全部数据平面,为您提供数据存储位置和处理位置选项。这包括两项功能:

  • 私有文件存储:使用 Alteryx One 将 Alteryx 文件存储替换为您自己的云存储桶。配置完成后,客户数据的所有持久性文件存储都将在您自己的磁盘上进行。私有文件存储支持 AWS S3、Azure ADLS 和 Google Cloud Storage。

  • 私有数据处理:此功能在概念上类似于私有文件存储,但适用于关系型存储和处理。您可以先配置自己的 VPC,然后告诉 Alteryx One Platform 在那里部署一个完整的数据处理环境。配置完成后,上述所有其他数据平面活动将在您的 VPC 内执行。

功能可用性:

特征

发布

私有数据存储

  • 适用于所有 Alteryx One 客户。

私有数据处理

  • 仅限企业客户。

  • 需要私有数据存储。

架构

当您为工作区配置私有文件存储和私有数据处理时,客户数据(来自数据源的数据记录)将仅存储在基础架构上。即,在您的云存储桶和数据源中。Alteryx One 控制平面会启动与您的 VPC 内部的私有数据存储及数据处理环境的交互。数据处理环境也会直接连接到您的数据源以检索和推送数据。

AAC_PDP_architecture.png

当用户会话处于活动状态时,客户数据在传输至浏览器的过程中将经过控制平面。此外还有一些数据流,其中客户数据在控制平面中进行处理;但数据绝不会在会话持续时间之外存储或缓存在该处,且最长保留时间为 1 小时。示例:

  • Designer Cloud 的设计时,系统会在控制平面中检查和格式化样本数据(用于分隔符和标头检测、列名和类型推断,以及按示例进行转换的功能)。

  • Auto Insights 数据集摄入会在控制平面中执行数据推断和元数据提取。

  • Auto Insights 会对查询结果进行后处理,以实现对数据的分类、转换、渲染和呈现。

  • 电子邮件和 PDF 报告在控制平面中生成,并且在配置了电子邮件服务器时,任务摘要和报告 PDF 将通过所配置的服务器进行发送。

  • 生成式 AI 提示可以包含客户数据,并在控制平面中生成。

  • 生成式 AI 响应可以包含客户数据,并在控制平面中进行解析和转换。

注意

LLM 免责声明

发送给 LLM 的数据不在本文档的讨论范围内。Alteryx 无法控制数据在发送到 LLM 后的存储或处理方式。您可以参阅提供商的文档,了解有关他们如何处理提示数据的详细信息。Alteryx 同时使用 Azure OpenAI 和 Google Gemini 来提供 AI 驱动的功能,例如 Alteryx Copilot 和 Auto Insights Playbooks。

注意

关于文本输入的说明

始终使用 Alteryx 提供的连接器连接到敏感数据。请勿直接在您的工作流中嵌入敏感数据。例如,不要将客户数据的记录复制并粘贴到 Designer Cloud 中的文本输入工具内。工具配置(包括文本输入工具的内容)被视为元数据,并且不受上述控制措施的约束。

数据安全

Alteryx 提供了可下载的白皮书,其中深入介绍了私有数据处理、隐私和安全问题等内容。您可以在 alteryx.com/trust 的私有数据处理部分中找到此文档的链接。

为了方便起见,此处列出了传输中的数据和静态数据加密的几个要点:

  • 浏览器与控制平面之间以及控制平面与数据平面之间的数据传输均采用 TLS 1.3 加密技术进行加密。

  • Alteryx 利用 mTLS 加密进行群集内通信。

  • 文件存储和数据库凭证存储在控制平面的数据库中,并使用 256 位 AES 分组密码进行加密。

  • 信封加密应用于这些凭证,然后这些凭证才能从控制平面传输到数据平面,并以 Kubernetes Secret 的形式提供给作业 Pod。

    • 用于对加密凭证进行解密的私钥存储在数据平面中的云提供商 Secret Manager 内,并使用 External Secrets Operator 挂载到 AYX 群集中。

    • 工作负载通过 Kubernetes ServiceAccount 访问 Secret Manager 中的私密密钥。

电子邮件安全

默认情况下,任务摘要和报告 PDF 等电子邮件是从 no-reply@mail.alteryxcloud.com 发送的。

工作区管理员可以配置自定义 SMTP 电子邮件服务器。完成配置后,任务摘要和报告 PDF 将通过该服务器进行发送。

出于安全原因,Alteryx One 应用程序中通常不支持附件。但是,Auto Insights 是个例外。Auto Insights 报告 PDF 可以包括附件,前提是它们符合支持的大小限制。

email-server-auto-insights.png

升级

软件即服务的一大优势在于,您无需担心升级问题。Alteryx One 负责为您管理升级。

长期运行的服务及临时作业的软件升级均由该产品为您进行管理。当软件的新版本可用时,系统会将新的容器映像推送给我们的映像存储库。Alteryx One Platform 将获取这些新的映像版本,并在群集内无缝启用它们,而不会中断任何正在运行的作业。

Alteryx 还会代表您管理基础架构升级。

指标收集

Alteryx One 使用 Datadog 收集应用程序监控使用情况数据,以监控和保持运行稳定性。Datadog 代理会收集以下指标:

  • 来自 Kubernetes 群集、存储桶、Spark 处理器(启用时)和计算节点的遥测指标。

  • 来自处理群集中的服务的自定义日志。

  • 所使用的公有云托管服务的云提供商日志(例如 AWS CloudWatch 和 Azure Monitor)。

配置私有数据处理

配置私有数据处理有三个步骤:配置私有文件存储、配置私有数据处理和配置私有电子邮件服务器。

私有文件存储

Alteryx Data Store (ADS) 是 Alteryx 文件存储。这是所有新创建的工作区的默认存储位置。

利用私有文件存储功能,您可以将 ADS 替换为自己的文件存储。执行此操作后,ADS 中保存的所有内容都将无法访问。如果您在最终用户开始使用工作区之前完成了此配置,则他们将获得最流畅的体验。

私有文件存储支持 AWS S3、Azure ADLS 和 Google Cloud Storage (GCS) 作为存储提供商。

当您在所选的云提供商中完成私有文件存储的配置后,您可以继续在同一云提供商中配置私有文件处理。

如需了解设置说明,请访问以下链接之一:

私有数据处理

利用私有数据处理功能,您可以在自己的 VPC 中运行 Alteryx 数据处理。要配置此功能,您必须完成相关的设置步骤,让 VPC 做好运行 Alteryx 数据处理的准备。每个 Alteryx One Platform 产品都有单独的设置说明。完成每个产品的设置后,您可以在同一数据平面中运行多个产品。

完成 VPC 设置后,您将登录 Alteryx One Platform 并为要在工作区中使用的任何解决方案启用私有数据处理。

Alteryx 建议使用专用账户和 VPC 以获得最佳安全性和稳定性,不过也支持其他配置。

如需详细了解私有数据处理(包括共担责任模型、不同应用程序所需的云资源、区域可用性等内容),请参阅 Private Data Processing

在您启用私有数据处理后,可能需要根据您的解决方案执行其他设置步骤。例如,在为 Designer Cloud 启用私有数据处理后,您将需要更新私有数据存储权限,以允许数据处理群集访问您的数据存储。

Alteryx 建议使用专用账户和 VPC 以获得最佳安全性和稳定性,不过也支持其他配置。

按照以下指南,根据您的云提供商设置私有数据处理...

私有电子邮件服务器

利用私有电子邮件服务器功能,工作区管理员可以使用自定义 SMTP 服务器。完成配置后,任务摘要和报告 PDF 将从组织的基础结构而不是默认的 Alteryx 服务器进行发送。如需了解配置说明,请转至电子邮件服务器设置

已知局限

以下是私有数据处理的一些已知限制:

  • 每个工作区只能连接到一个数据平面。

  • 某些 Alteryx One Platform 应用程序尚未不兼容私有数据处理,因此将在启用了私有数据处理的工作区中被禁用。

  • 在具有私有数据处理功能的工作区中,尚不支持将 SSH 隧道与连接器一起使用。

  • 出于安全原因,Alteryx One 应用程序中通常不支持附件。但是,Auto Insights 是个例外。Auto Insights 报告 PDF 可以包括附件,前提是它们符合支持的大小限制。

  • 电子邮件支持目前仅适用于 Plans。启用后,任务摘要和报告 PDF 将通过所配置的电子邮件服务器进行发送。即将提供对其他应用程序的支持。