下载微软 DP-203 模拟考试学习材料 [Q40-Q59]

下载微软 DP-203 模拟考试学习材料 [Q40-Q59]

4.5/5 - (2 选票)

下载 Microsoft DP-203 模拟测试学习材料

DP-203 问题准备与学习信息

Microsoft DP-203(Microsoft Azure 上的数据工程)认证考试对于在 Azure 上处理数据解决方案的 IT 专业人员来说是一项重要的认证。它测试考生与 Azure 上的数据工程相关的知识和技能,可以帮助他们提升职业发展,并向潜在雇主展示自己的专业知识。

 

问题 40
注意:本问题是一系列问题中的一部分,这些问题提出了相同的情景。该系列中的每道题都包含一个可能达到既定目标的独特解决方案。某些题组可能有不止一个正确的解决方案,而其他题组可能没有正确的解决方案。
在此情景中回答问题后,您将无法返回该问题。因此,这些问题将不会出现在复习屏幕中。
您有一个 Azure 存储账户,其中包含 100 GB 的文件。这些文件包含文本和数值。
其中 75% 行包含平均长度为 1.1 MB 的说明数据。
您计划将数据从存储账户复制到 Azure SQL 数据仓库。
您需要准备文件,以确保快速复制数据。
解决方案:修改文件以确保每行超过 1 MB。
这是否达到了目标?

 
 

问题 41
您有一个名为 WS1 的 Azure Synapse Analytics 工作区。
您有一个 Azure Data Lake Storage Gen2 容器,其中包含以下格式的 JSON 格式文件。
您需要使用 WS1 中的无服务器 SQL 池来读取文件。
应如何完成 Transact-SQL 语句?要回答这个问题,请将适当的值拖到正确的目标上。每个值可以使用一次、多次或完全不使用。您可能需要在窗格之间拖动分割栏或滚动来查看内容。
注意:每个正确选项得一分。

问题 42
建议同时使用哪些 Azure Data Factory 组件将每日库存数据从 SQL 服务器导入到 Azure Data Lake 存储?要回答问题,请在答案区域选择相应的选项。
注意:每个正确选项得一分。

问题 43
您有一个名为 temperatures 的 Apache Spark DataFrame。数据示例如下表所示。

您需要使用 Spark SQL 查询生成下表。

如何完成查询?要回答问题,请将适当的值拖到正确的目标上。每个值可以使用一次、多次或完全不使用。您可能需要在窗格之间拖动分割栏或滚动来查看内容。
注意:每个正确选项得一分。

问题 44
您有两个名为 Storage1 和 Storage2 的 Azure Storage 账户。每个账户都有一个容器,并启用了分层命名空间。系统中的文件包含以 Apache Parquet 格式存储的数据。
您需要使用 Data Factory 复制活动将文件夹和文件从 Storage1 复制到 Storage2。解决方案必须满足以下要求:
无需进行转换。
必须保留原始文件夹结构。
尽量减少执行复制活动所需的时间。
应该如何配置复制活动?要回答问题,请在答案区域选择适当的选项。
注意:每个正确选项得一分。

问题 45
您正在 Azure Synapse Analytics 中设计一个企业数据仓库,该数据仓库将以星形模式存储网站流量分析。
您计划为网站访问建立一个事实表。该表的容量约为 5 GB。
您需要建议该表使用哪种分布类型和索引类型。解决方案必须提供最快的查询性能。
你有什么建议?要回答问题,请在答案区域选择适当的选项。
注意:每个正确选项得一分。

问题 46
您有一个 Azure 订阅,其中包含一个 Azure 数据湖存储帐户。该存储帐户包含一个名为 DataLake1 的数据湖。
您计划使用 Azure 数据工厂从 DataLake1 中的文件夹获取数据,转换数据并将数据导入另一个文件夹。
您需要确保数据工厂可以从 DataLake1 文件系统中的任何文件夹读写数据。解决方案必须满足以下要求:
将用户未经授权访问的风险降至最低。
使用最小特权原则。
最大限度地减少维护工作量。
应如何配置数据工厂存储账户的访问权限?请在答案区域选择相应的选项。
注意:每个正确选项得一分。

问题 47
您在 Azure Data Factory 中拥有一个自托管集成运行时。
集成运行时的当前状态有以下配置:
状态运行中
类型自助托管
运行/注册节点:1/1
已启用高可用性:已启用: 假
链接计数:0
队列长度: 0
平均队列持续时间。0.00s
集成运行时的节点详细信息如下:
名称: X-MX-M
状态运行中
可用内存:7697MB
CPU 使用率:6%
网络(输入/输出):1.21KBps/0.83KBps
并发工作(运行/限制):2/14
角色调度员/工人
证书状态:同步中
请使用下拉菜单,根据所提供的信息,选择完成每项陈述的答案选项。
注意:每个正确选项得一分。

问题 48
您正在为分布在七个主要地理区域的 2500 万台设备的遥测数据设计 Azure Data Lake Storage Gen2 结构。每分钟,这些设备将向 Azure 事件集线器发送一个 JSON 指标有效载荷。
您需要为数据推荐一个文件夹结构。解决方案必须满足以下要求:
* 每个地区的数据工程师必须能够只为各自地区的数据建立自己的管道。
* 数据必须至少每 15 分钟处理一次,才能纳入 Azure Synapse Analytics 无服务器 SQL 池。
您建议如何完成该结构?要回答问题,请将适当的值拖到正确的目标上。每个值可以使用一次、多次或完全不使用。您可能需要在窗格之间拖动分割栏或滚动来查看内容。
注意:每个正确选项得一分。

问题 49
您有一个名为 Pool1 的 Azure Synapse Analytics 专用 SQL 池。Pool1 包含一个名为 table1 的表。
您向表 1 中加载了 5 TB 的数据。
您需要确保表 1 的列存储压缩最大化。
您应该执行哪条语句?

 
 
 
 

问题 50
您正在设计一个 Azure 流分析作业,以处理零售环境中传感器传入的事件。
您需要对事件进行处理,以得出前 15 分钟内购物者人数的平均值,每隔 5 分钟计算一次。
您应该使用哪种类型的窗户?

 
 
 
 

问题 51
您有一个 Azure Data Factory 管道,该管道具有以下显示的活动。

使用下拉菜单,根据图表中提供的信息,选择完成每个陈述的答案选项。
注意:每个正确选项得一分。

问题 52
您有一个 Azure Synapse Analytics 专用 SQL 池,其中包含一个名为 Table1 的表。
您的文件被摄取并加载到名为 container1 的 Azure Data Lake Storage Gen2 容器中。
您计划将文件中的数据插入到名为 container1 的 Table1 和 azure Data Lake Storage Gen2 容器中。
您计划将文件中的数据插入表 1 并转换数据。文件中的每一行数据将在表 1 的服务层中产生一行。
您需要确保源数据文件加载到容器 1 时,DateTime 将作为附加列存储在 Table1 中。
解决方案:在 Azure Synapse Analytics 管道中,您使用获取元数据活动来检索文件的日期时间。
这是否达到了目标?

 
 

问题 53
您在 Azure Data Factory 中拥有一个自托管集成运行时。
集成运行时的当前状态有以下配置:
状态运行中
类型自助托管
版本:4.4.7292.1
运行/注册节点:1/1
已启用高可用性:已启用: 假
链接计数:0
队列长度: 0
平均队列持续时间。0.00s
集成运行时的节点详细信息如下:
名称: X-MX-M
状态运行中
版本:4.4.7292.1
可用内存:7697MB
CPU 使用率:6%
网络(输入/输出):1.21KBps/0.83KBps
并发工作(运行/限制):2/14
角色调度员/工人
证书状态:同步中
请使用下拉菜单,根据所提供的信息,选择完成每项陈述的答案选项。
注意:每个正确选项得一分。

问题 54
您有一个名为 account1 的 Azure Data Lake Storage Gen2 帐户,该帐户存储的日志如下表所示。

您不希望在保留期内访问日志。
你需要为 account1 推荐一个符合以下要求的解决方案:
* 在每个保留期结束时自动删除日志
* 最小化存储成本
建议中应包括哪些内容?请在答案区域选择相应的选项。
注意:每个正确选项得一分。

问题 55
您有一个 Azure Synapse Analytics 专用 SQL 池。
您需要创建一个名为 Table1 的事实表,用于存储过去三年的销售数据。解决方案必须针对以下查询操作进行优化:
按周显示订单数。
* 按地区计算销售总额。
* 按产品计算销售总额。
* 查找指定月份的所有订单。
应该使用哪些数据对表 1 进行分区?

 
 
 
 

问题 56
您正在设计一个实时仪表盘解决方案,它将可视化来自连接到互联网的远程传感器的流数据。必须对流数据进行汇总,以显示每个 10 秒间隔的平均值。数据在仪表盘中显示后将被丢弃。
该解决方案将使用 Azure Stream Analytics,必须满足以下要求:
最大限度地减少从 Azure 事件集线器到仪表板的延迟。
尽量减少所需的存储空间。
最大限度地减少开发工作。
解决方案中应包括哪些内容?请在答案区域选择相应的选项。
注意:每个正确选项得一分

问题 57
您可以使用 Azure 数据工厂准备数据,供 Azure Synapse Analytics 无服务器 SQL 池查询。
文件最初以 10 个 JSON 小文件的形式摄入 Azure Data Lake Storage Gen2 账户。每个文件都包含相同的数据属性和贵公司子公司的数据。
您需要将文件移动到另一个文件夹,并转换数据以满足以下要求:
* 提供尽可能快的查询时间。
* 从底层文件自动推断模式。
应如何配置数据工厂复制活动?要回答问题,请在答案区域选择适当的选项。
注意:每个正确选项得一分。

问题 58
您正在批量加载 Azure Synapse Analytics 专用 SQL 池中的一个表。
您需要将数据从暂存表加载到目标表。解决方案必须确保,如果在将数据加载到目标表时发生错误,则撤销该批次中的所有插入操作。
应如何完成 Transact-SQL 代码?要回答这个问题,请将适当的值拖到正确的目标上。每个值可以使用一次、多次或完全不使用。您可能需要在窗格之间拖动分割栏或滚动来查看内容。
注意 每选对一项得一分。

问题 59
您需要在 Azure Synapse Analytics 专用 SQL 池中创建一个分区表。
应如何完成 Transact-SQL 语句?要回答这个问题,请将适当的值拖到正确的目标上。每个值可以使用一次、多次或完全不使用。您可能需要在窗格之间拖动分割栏或滚动来查看内容。
注意:每个正确选项得一分。


DP-203 认证考试是专业人士展示其数据工程领域专业知识的绝佳途径。它证明他们具备在 Microsoft Azure 上设计和实施数据解决方案的必要技能和知识。Microsoft Azure 数据工程认证受到雇主的高度重视,被视为衡量 Microsoft Azure 数据工程师能力的基准。

 

最可靠的微软 DP-203 培训材料: https://www.trainingdump.com/Microsoft/DP-203-practice-exam-dumps.html

Related Links: iifeducation.in arabic2world.com ccinst.in theeverydaylearning.com academy.widas.de academy2.hostminegocio.com

发表回复

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

输入下图中的文字