Azure 数据工厂 - 一直运行?
Azure Data Factory - runs all the time?
我已经实现了一个执行 SQL 存储过程的 Azure DF 作业:
{
"name": "spLoggingProc",
"properties": {
"activities": [
{
"type": "SqlServerStoredProcedure",
"typeProperties": {
"storedProcedureName": "logging"
},
"outputs": [
{
"name": "spEmptyOutput15-4"
}
],
"scheduler": {
"frequency": "Hour",
"interval": 1
},
"name": "spLogging"
}
],
"start": "2017-01-01T00:00:00Z",
"end": "2099-01-01T00:10:00Z",
"isPaused": false,
"hubName": "dwh_hub",
"pipelineMode": "Scheduled"
}
}
数据集:
{
"name": "spEmptyOutput15-4",
"properties": {
"published": false,
"type": "AzureSqlTable",
"linkedServiceName": "DWH",
"typeProperties": {
"tableName": "spEmptyOutput15-4"
},
"availability": {
"frequency": "Hour",
"interval": 1
}
}
}
现在的问题是,Proc 运行 每 2-3 秒一次。但是频率设置为每小时一次。我的目标是,运行 每一小时和每一天的过程。
谁能帮帮我?
非常感谢!
请将开始时间更改为今天的日期,您将不会看到该问题。因为您已将开始时间设置为年初,所以它会 运行 每天和每个小时,因此在进入正常程序之前它会持续 运行ning 24x166 次。它仍然是每小时运行ning,但它必须每小时完成过去的运行s,你会看到它每隔几秒就会运行ning。我确定您的过程只需要 1-2 秒即可完成。
还有另一种方法运行 10个切片(10个是最大值)并行来提高速率。如果你也想要过去的数据。那么这将有所帮助。
将 Policy 下的 Concurrency 值 3 更改为 运行 切片并行。
"policy": {
"concurrency": 3,
"executionPriorityOrder": "OldestFirst",
"retry": 3,
"timeout": "00:10:00"
}
我已经实现了一个执行 SQL 存储过程的 Azure DF 作业:
{
"name": "spLoggingProc",
"properties": {
"activities": [
{
"type": "SqlServerStoredProcedure",
"typeProperties": {
"storedProcedureName": "logging"
},
"outputs": [
{
"name": "spEmptyOutput15-4"
}
],
"scheduler": {
"frequency": "Hour",
"interval": 1
},
"name": "spLogging"
}
],
"start": "2017-01-01T00:00:00Z",
"end": "2099-01-01T00:10:00Z",
"isPaused": false,
"hubName": "dwh_hub",
"pipelineMode": "Scheduled"
}
}
数据集:
{
"name": "spEmptyOutput15-4",
"properties": {
"published": false,
"type": "AzureSqlTable",
"linkedServiceName": "DWH",
"typeProperties": {
"tableName": "spEmptyOutput15-4"
},
"availability": {
"frequency": "Hour",
"interval": 1
}
}
}
现在的问题是,Proc 运行 每 2-3 秒一次。但是频率设置为每小时一次。我的目标是,运行 每一小时和每一天的过程。
谁能帮帮我?
非常感谢!
请将开始时间更改为今天的日期,您将不会看到该问题。因为您已将开始时间设置为年初,所以它会 运行 每天和每个小时,因此在进入正常程序之前它会持续 运行ning 24x166 次。它仍然是每小时运行ning,但它必须每小时完成过去的运行s,你会看到它每隔几秒就会运行ning。我确定您的过程只需要 1-2 秒即可完成。
还有另一种方法运行 10个切片(10个是最大值)并行来提高速率。如果你也想要过去的数据。那么这将有所帮助。
将 Policy 下的 Concurrency 值 3 更改为 运行 切片并行。
"policy": {
"concurrency": 3,
"executionPriorityOrder": "OldestFirst",
"retry": 3,
"timeout": "00:10:00"
}