按天均匀分布行

Distribute rows evenly by days

我有 table,我把它叫做 手动值 ,稍后在我的代码中使用。这个 table 看起来像这样:

subId | MonthNo | PackagesNumber | Country | EntryMethod | PaidAmount | Version
1     | 201701  | 223            | NO      | BCD         | 44803      | 2
2     | 201701  | 61             | NO      | GHI         | 11934      | 2
3     | 201701  | 929            | NO      | ABC         | 88714      | 2
4     | 201701  | 470            | NO      | DEF         | 98404      | 2
5     | 201702  | 223            | NO      | BCD         | 28225      | 2

我所要做的就是在单个包的级别将这些值分成单行。例如,2017 年 1 月在 Country NO 有 223 个包,使用 EntryMethod BCD,所以我想要 223 个单独的行。 PaidAmount 还应除以 PackagesNumber 的数量。

问题是我必须将日期关联到每条记录。记录应在整个月内平均分配。我有日期维度,我可以通过从 MontNo 中分别拉出月份和年份来与我的 table 相交。 例如,2017 年 1 月,EntryMethod BCD 我有包裹,所以每天大约 7 个包裹。

这就是我想要的:

subId | Date       | Country | Packages | EntryMethod | PaidAmount       | Version
1     | 01.01.2017 | NO      | 1        | BCD         | 200.910313901345 | 2
2     | 01.01.2017 | NO      | 1        | BCD         | 200.910313901345 | 2
3     | 01.01.2017 | NO      | 1        | BCD         | 200.910313901345 | 2
4     | 01.01.2017 | NO      | 1        | BCD         | 200.910313901345 | 2
5     | 01.01.2017 | NO      | 1        | BCD         | 200.910313901345 | 2
6     | 01.01.2017 | NO      | 1        | BCD         | 200.910313901345 | 2
7     | 01.01.2017 | NO      | 1        | BCD         | 200.910313901345 | 2
8     | 02.01.2017 | NO      | 1        | BCD         | 200.910313901345 | 2

奖励:我编写了代码,将包分成单个记录,并将每个月的第一天作为日期。

SELECT
       Date =
(
    SELECT TOP 1
           date
    FROM dim_Date dim
    WHERE dim.Month = a.Month
          AND dim.Year = a.Year
)
     , Country
     , EntryMethod
     , Deliveries = 1
     , PaidAmount = NULLIF(PaidAmount, 0) / PackagesNumber
     , SubscriptionId = 90000000 + ROW_NUMBER() OVER(ORDER BY n.number)
     , Version
FROM
(
    SELECT
           [Year] = LEFT(MonthNo, 4)
         , [Month] = RIGHT(MonthNo, 2)
         , Country
         , EntryMethod
         , PackagesNumber
         , PaidAmount
         , Version
    FROM tgm.rep_PredictionsReport_ManualValues tgm

    /*WHERE MonthNo = 201701*/
) a
JOIN master..spt_values n
ON n.type = 'P'
   AND n.number < CAST(PackagesNumber AS INT);

编辑:我取得了一些进展。我使用 NTILE 函数将行分组。 唯一改变的是来自顶层 select 的 Date。现在看起来是这样的:

Date = concat([Year], '-', [Month], '-', case when ntile(31) over(order by n.number) < 10  then '0' + cast(ntile(31) over(order by n.number) as varchar(2)) else cast(ntile(31) over(order by n.number) as varchar(2)) end)

说明:我正在使用 YearMonth 字段创建日期归档,并且 NTILE 超过一个月的天数(现在它是静态的编号,但稍后会更改)。结果并不像我预期的那样好,它创建的组是应有的两倍大(每个日期 14 行而不是 7 行)。

您可以使用取模运算符来完成此操作,它允许您将项目划分为一定数量的类别。

这是一个完整的测试:http://rextester.com/TOROA96856

相关查询如下:

--recursive query to expand each row.
with expand_rows (subid,monthno,month,packagesnumber,paidamount) as (
    select subid,monthno,month,packagesnumber,(paidamount+0.0000)/packagesnumber 
       from initial_table
    union all
    select subid,monthno,month,packagesnumber-1,paidamount 
       from expand_rows where packagesnumber >1
)
select expand_rows.*,(packagesnumber % numdays)+1 day, paidamount from expand_rows
    join dayspermonth d on
        d.month = expand_rows.month
    order by subid, day
    option (maxrecursion 0)

(packagesnumber % numdays)+1 是将项目分配给一天的模运算。

请注意,我预先计算了每个月的天数 table,以便在查询中使用。为了回答的目的,我还稍微简化了这个问题(添加了一个纯月份列,因为我不想在复制您的日期维度时乱七八糟)。

如果您关心当事情没有平均分配时额外的项目在哪里结束(例如,如果您在 1 月份有 32 个项目,哪一天有额外的项目?),您可能需要调整模查询。在此示例中,该月的第二天往往获得最多(因为加 1 以说明该月的最后一天以 0 结尾的事实)。如果您希望额外的天数落在月初,您可以使用将 0 转换为该月天数的 case 语句。

为了在 1 月的几天内平均分配 223 个号码,我们这样做: 一月有31天 223/3 的余数是 6 223/31是7(整数除法)

那是公关日的 7 条记录,加上 1 月 1 日至 6 日的额外 1 条记录。

我已经使用记数器 table 来制作日期等等,但是 pr 日的行分布可以这样确定:

with 
tally as
(
select row_number() over (order by n)-1 n from
(values (0),(1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) n(n)
cross join (values (0),(1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) m(m)
cross join (values (0),(1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) l(m)
cross join (values (0),(1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) k(m)
)
,t1 as
(
select
*
from
(values

 (1     , 201701  , 223            , 'NO'      , 'BCD'         , 44803      , 2)
,(2     , 201701  , 61             , 'NO'      , 'GHI'         , 11934      , 2)
,(3     , 201701  , 929            , 'NO'      , 'ABC'         , 88714      , 2)
,(4     , 201701  , 470            , 'NO'      , 'DEF'         , 98404      , 2)
,(5     , 201702  , 223            , 'NO'      , 'BCD'         , 28225      , 2)
) t(subId , MonthNo , PackagesNumber , Country , EntryMethod , PaidAmount , Version)
)
,dates as
(
select dateadd(day,n,'20170101') as dt
    ,convert(varchar(10),dateadd(day,n,'20170101'),112)/100 mnthkey
    ,day(dateadd(day,-1,dateadd(month,1,cast(((convert(varchar(10),dateadd(day,n,'20170101'),112)/100)*100 +1) as varchar(10))))) DaysInMonth
from  
tally
)
select 
    subId
    ,MonthNo
    ,dt
    ,PackagesNumber
    ,case when day(dt)<=PackagesNumber%DaysInMonth then 1 else 0 end remainder
    ,PackagesNumber/DaysInMonth evenlyspread
    ,Country
    ,EntryMethod
    ,PaidAmount
    ,Version
 from t1 a
inner join dates b
on a.MonthNo=b.mnthkey

我在月份加入数据 table,并为月份中的每一天分配均匀分布的天数,在我们的示例中为 7 天,对于第一天,在我们的示例中为 6 天,我添加 1作为余数

现在我们从你的基地 table 得到信息,乘以相关月份的每一天,现在我们只需要在 pr 日制作多行,这里我们再次使用计数表:

with 
tally as
(
select row_number() over (order by n)-1 n from
(values (0),(1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) n(n)
cross join (values (0),(1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) m(m)
cross join (values (0),(1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) l(m)
cross join (values (0),(1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) k(m)
)
,t1 as
(
select
*
from
(values

 (1     , 201701  , 223            , 'NO'      , 'BCD'         , 44803      , 2)
,(2     , 201701  , 61             , 'NO'      , 'GHI'         , 11934      , 2)
,(3     , 201701  , 929            , 'NO'      , 'ABC'         , 88714      , 2)
,(4     , 201701  , 470            , 'NO'      , 'DEF'         , 98404      , 2)
,(5     , 201702  , 223            , 'NO'      , 'BCD'         , 28225      , 2)
) t(subId , MonthNo , PackagesNumber , Country , EntryMethod , PaidAmount , Version)
)
,dates as
(
select dateadd(day,n,'20170101') as dt
    ,convert(varchar(10),dateadd(day,n,'20170101'),112)/100 mnthkey
    ,day(dateadd(day,-1,dateadd(month,1,cast(((convert(varchar(10),dateadd(day,n,'20170101'),112)/100)*100 +1) as varchar(10))))) DaysInMonth
from  
tally
)
,forshow as
(
select 
    subId
    ,MonthNo
    ,dt
    ,PackagesNumber
    ,case when day(dt)<=PackagesNumber%DaysInMonth then 1 else 0 end remainder
    ,PackagesNumber/DaysInMonth evenlyspread
    ,Country
    ,EntryMethod
    ,(PaidAmount+0.0000)/(PackagesNumber*1.0000) PaidAmount
    ,Version
    ,PaidAmount TotalPaidAmount
 from t1 a
inner join dates b
on a.MonthNo=b.mnthkey
)
select 
    subId
    ,dt [Date]
    ,Country
    ,1 Packages
    ,EntryMethod
    ,PaidAmount
    ,Version
    -- the following rows are just for control
    ,remainder+evenlyspread toalday
    ,count(*) over (partition by subId,MonthNo,dt) calctotalday
    ,PackagesNumber
    ,count(*) over (partition by subId) calcPackagesNumber
    ,sum(PaidAmount)over (partition by subId) calcPaidAmount
    ,TotalPaidAmount
from forshow
inner join tally on n<(remainder+evenlyspread )

order by subId,MonthNo,dt

我加入天数(均匀分布+剩余),获得一排pr package

我添加了一些检查列以确保我在前 6 天获得 8 行,而我们的示例总共获得 223 行