Python Fantasy Football 的 PuLP 优化问题,如何添加某些条件约束?

Python PuLP Optimization problem for Fantasy Football, how to add Certain Conditional Constraints?

目前是我第一次在 python 中使用 PuLP 库。深入研究这个库的目的是在 python 中制作一个梦幻足球解算器。我已经成功制作了求解器,但无法弄清楚如何添加我需要的一些约束。

我有 400 名球员的 excel sheet 以及我如何安排他们比赛,我想在给定特定约束的情况下找到 9 名球员的最佳组合。 excel sheet 保留,球员姓名,球员投影,球队球员上场,对手球员面对,以及位置。下面是熊猫数据框的头部。

              Name  Projection Position Team  Salary Opponent
0             Jets    3.528576      DST  NYJ    2000      IND
1           Texans    7.936528      DST  HOU    2100      PIT
2         Panthers    4.219883      DST  CAR    2200      LAC
3          Raiders    0.904948      DST  LVR    2300       NE

我成功完成的约束:限制最多选择9名球员,只有QB位置1人,WR位置3-4人,TE位置1-2人,DST位置1人,2-3人位置 RB.

raw_data = pd.read_csv(file_name,engine="python",index_col=False, header=0, delimiter=",", quoting = 3)

#create new columns that has binary numbers if player == a specific position
raw_data["RB"] = (raw_data["Position"] == 'RB').astype(float)
raw_data["WR"] = (raw_data["Position"] == 'WR').astype(float)
raw_data["QB"] = (raw_data["Position"] == 'QB').astype(float)
raw_data["TE"] = (raw_data["Position"] == 'TE').astype(float)
raw_data["DST"] = (raw_data["Position"] == 'DST').astype(float)
raw_data["Salary"] = raw_data["Salary"].astype(float)

total_points = {}
cost = {}
QBs = {}
RBs = {}
WRs = {}
TEs = {}
DST = {}
number_of_players = {}

# i = row index, player = player attributes
for i, player in raw_data.iterrows():
    var_name = 'x' + str(i) # Create variable name
    decision_var = pulp.LpVariable(var_name, cat='Binary') # Initialize Variables

    total_points[decision_var] = player["Projection"] # Create Projection Dictionary
    cost[decision_var] = player["Salary"] # Create Cost Dictionary
    
    # Create Dictionary for Player Types
    QBs[decision_var] = player["QB"]
    RBs[decision_var] = player["RB"]
    WRs[decision_var] = player["WR"]
    TEs[decision_var] = player["TE"]
    DST[decision_var] = player["DST"]
    number_of_players[decision_var] = 1.0

QB_constraint = pulp.LpAffineExpression(QBs)
RB_constraint = pulp.LpAffineExpression(RBs)
WR_constraint = pulp.LpAffineExpression(WRs)
TE_constraint = pulp.LpAffineExpression(TEs)
DST_constraint = pulp.LpAffineExpression(DST)
total_players = pulp.LpAffineExpression(number_of_players)

model += (QB_constraint == 1)
model += (RB_constraint <= 3)
model += (RB_constraint >= 2)
model += (WR_constraint <= 4)
model += (WR_constraint >= 3)
model += (TE_constraint <= 2)
model += (TE_constraint >= 1)
model += (DST_constraint == 1)
model += (total_players == 9)

我正在尝试添加但无法弄清楚如何添加的约束条件:选中的 9 名球员中有 2 名球员与 QB 在同一支球队,DST 的对手不能是 9 名球队中的任何人,有 1 名球员对手是 QB 的球队。知道我该怎么做吗?此数据在我的 excel 文件中,但我不确定如何将这些约束添加到模型中?

我一直在查看文档中的案例,但我找不到任何根据模型选择的内容更改最佳输出的示例。示例:如果选择四分卫,则会影响其余 8 名被选中的球员。

感谢任何人能为我提供的帮助

这正是我的专长!一般来说,如果您希望约束取决于特定变量的选择(e.x。选择了哪个 QB 变量),您需要以一种有点聪明的方式为每个可能的选择设置一个新的约束以确保该约束仅在选择该变量时执行任何操作。

  1. 至少 n 名球员与你的四分卫:你将对球员池中的每个四分卫都有一个新的限制。约束将如下所示:
[sum of other players on the same team as QB] + -n*[QB] >= 0

这样,如果优化器 select 是 QB,它还必须 select n 该 QB 团队中的其他球员,以满足当您减去时的要求n 根据该队的其他玩家人数,结果是 non-negative。当 QB 不是 selected 时,这个方程式什么都不做,因为 QB 变量只有负系数。请注意,此方法还允许您通过操纵等式左侧出现的球员来堆叠特定位置(例如 QB-WR 堆叠)。您还可以调整它以强制使用 DST-RB 堆栈。

  1. 不要根据你的 DST 堆叠任何球员:这与上面的类似,因为我们对每支球队都有一个等式,但是说“none 个球员列表”而不是“至少n of these players”稍微改变了数学。
[sum of players facing DST] + 8*[DST] <= 8

在这个等式中,如果优化器 select 的 DST 左侧已经是 8,那么在对方球队中添加任何球员都会使等式超出限制。如果夏令时未 selected,则此等式无效,因为无论如何我们不会选择超过 8 non-DST 名玩家。

  1. 将你的四分卫与对方球队中的至少一名球员叠加:这与 1. 基本相同,但我们选择 n=1,并用四分卫的对手填充等式的其余部分,而不是队友:
[sum of players on the team facing QB] + -1*[QB] >= 0

同样,如果 QB selected,我们还必须 select 这个等式中的其他玩家之一来平衡它并保持总数 non-negative。如果 QB 未被 select 编辑,则此等式无效,因为所有其他参与者的系数均为正数。

就用 pulp 实现这些而言,我发现使用 LpVariables.dicts 创建变量非常有帮助,这样您就可以多次遍历播放器列表,并且每次都访问相同的变量时间:

player_ids = raw_data.index
player_vars = pulp.LpVariable.dicts('player', player_ids, cat = 'Binary')

然后创建名册约束和 objective 使用列表理解就真的很容易了,例如:

prob = pulp.LpProblem("DFS Optimizer", pulp.LpMaximize)
#Objective
prob += pulp.lpSum([raw_data['Projection'][i]*player_vars[i] for i in player_ids]),
##Total Salary:
prib += pulp.lpSum([raw_data['Salary'][i]*player_vars[i] for i in player_ids]) <= 50000,
##Exactly 9 players:
prob += pulp.lpSum([player_vars[i] for i in player_ids]) == 9,
##2-3 RBs:
prob += pulp.lpSum([player_vars[i] for i in player_ids if raw_data['Position'][i] == 'RB']) >= 2,
prob += pulp.lpSum([player_vars[i] for i in player_ids if raw_data['Position'][i] == 'RB']) <= 3,

你可能可以从那里推断出如何做你已经用那种风格做过的所有事情。现在进行 QB 堆叠:

###Stack QB with 2 teammates
for qbid in player_ids:
    if raw_data['Position'][qbid] == 'QB':
        prob += pulp.lpSum([player_vars[i] for i in player_ids if 
                           (raw_data['Team'][i] == raw_data['Team'][qbid] and 
                            raw_data['Position'][i] in ('WR', 'RB', 'TE'))] + 
                           [-2*player_vars[qbid]]) >= 0,
###Don't stack with opposing DST:
for dstid in player_ids:
    if raw_data['Position'][dstid] == 'DST':
        prob += pulp.lpSum([player_vars[i] for i in player_ids if
                            raw_data['Team'][i] == raw_data['Opponent'][dstid]] +
                           [8*player_vars[dstid]]) <= 8,
###Stack QB with 1 opposing player:
for qbid in player_ids:
    if raw_data['Position'][qbid] == 'QB':
        prob += pulp.lpSum([player_vars[i] for i in player_ids if
                            raw_data['Team'][i] == raw_data['Opponent'][qbid]] +
                           [-1*player_vars[qbid]]) >= 0,

一旦你明白了这一点,并且能够生成一个你想要的任何堆叠规则的阵容,当你开始尝试生成多个阵容以进入 GPP 时,它会变得非常有趣。你如何确定它们都是不同的?如果您希望您的任何 2 个阵容至少有 3 个不同的球员怎么办?您如何为您的玩家设置 minimum/maximum 曝光率?我希望这一切对您有所帮助,我知道这是一篇很长的文章。