FastAi fit_one_cycle() 中的 slice(lr) 做了什么
FastAi What does the slice(lr) do in fit_one_cycle()
在Lesson 3 - planet中,我看到了这两行代码:
lr = 0.01
learn.fit_one_cycle(5, slice(lr))
如果 slice(min_lr, max_lr) 那么我理解 fit_one_cycle() 将使用 slice(min_lr, max_lr). (希望我对此的理解是正确的)
但在这种情况下 slice(lr) 只有一个参数,
fit_one_cycle(5, lr)和fit_one_cycle(5, slice(lr))有什么区别 ?
以及直接使用 slice(lr) 而不是 lr 有什么好处?
Jeremy 在第 5 课中花了一些时间解释 slice 的作用。
我的理解是 fastai.vision 模块将架构分为 3 组,并根据您输入的内容以可变学习率对它们进行训练。 (起始层通常不需要参数的大变化)
此外,如果您使用 'fit_one_cycle',所有组都将使用各自的变量学习进行学习率退火。
检查第 5 课 https://course.fast.ai/videos/?lesson=5(使用成绩单查找器快速转到 'slice' 部分)
在Lesson 3 - planet中,我看到了这两行代码:
lr = 0.01
learn.fit_one_cycle(5, slice(lr))
如果 slice(min_lr, max_lr) 那么我理解 fit_one_cycle() 将使用 slice(min_lr, max_lr). (希望我对此的理解是正确的)
但在这种情况下 slice(lr) 只有一个参数,
fit_one_cycle(5, lr)和fit_one_cycle(5, slice(lr))有什么区别 ? 以及直接使用 slice(lr) 而不是 lr 有什么好处?
Jeremy 在第 5 课中花了一些时间解释 slice 的作用。
我的理解是 fastai.vision 模块将架构分为 3 组,并根据您输入的内容以可变学习率对它们进行训练。 (起始层通常不需要参数的大变化)
此外,如果您使用 'fit_one_cycle',所有组都将使用各自的变量学习进行学习率退火。
检查第 5 课 https://course.fast.ai/videos/?lesson=5(使用成绩单查找器快速转到 'slice' 部分)