检测数据集中的某个特征
Detect a certain characteristic in a data set
所以基本上我有一个包含 2 列的数据集:
| Time (millis) | Speed (m/s) |
--------------------------------
| 0 | 0.5 |
| 20 | 1.5 |
| 40 | 4.5 |
| 60 | 8.5 |
| 80 | 8.9 |
| 100 | 7.5 |
| 120 | 4.3 |
| 140 | 1.5 |
| 160 | 0.5 |
| 180 | 0.5 |
| 200 | 0.5 |
| 220 | 0.5 |
这是一个人的简短样本运行它的速度以 20 毫秒为单位。
所以我正在尝试检测冲刺(当此人在短距离内全速 运行 时)。
由于我的要求的性质,我正在编写一个程序来计算 c
。我可以很容易地以肮脏的方式做到这一点,定义一些最小值、最大值,寻找峰值,然后是冲刺。但我认为必须有更好的方法来做到这一点,也许是一些我不知道的机器学习算法。
如果我可以通过向程序展示一些示例来告诉程序什么是冲刺,然后在我这边不再进行干预的情况下检测它们,那就太好了。我只是不确定如何开始。
有没有人遇到过类似的事情并能指出正确的方向?
冲刺是一种加速。所以你只需要计算它(速度的导数)。之后取决于您所说的冲刺。使用平均值和最大值应该就足够了。
这感觉就像用火箭筒打苍蝇一样;我认为您的 "dirty" 方法是唯一的方法。术语 "sprint" 没有任何实际意义...如果您向任何机器提供冲刺示例,则意味着您已经使用了自己的任意分类方法来确定您是否认为它是,冲刺。
您如何定义问题?有些人可能 运行 10 m/s 全力以赴,其他人可能 运行 3 m/s 并认为这是冲刺。你怎么能从你有限的数据集中知道这个人当时是否将自己逼到了一个值得冲刺的极限?也许他们可以走得更快。一个人的结果如何影响另一个人的数据集以确定他们的 "sprint" 阈值?很多问题,但我认为有效的问题。实际上,您只能根据您的数据进行推断;例如,相对于平均值的最大速度是多少。我不会把它复杂化。
但是,如果您以受控格式收集结果,要求许多人进行短跑,然后记录影响他们能力的因素:BMI、体重、年龄、医疗条件、逆风速度等等。那么你可能会有一些可以从机器学习中受益的东西。
所以基本上我有一个包含 2 列的数据集:
| Time (millis) | Speed (m/s) |
--------------------------------
| 0 | 0.5 |
| 20 | 1.5 |
| 40 | 4.5 |
| 60 | 8.5 |
| 80 | 8.9 |
| 100 | 7.5 |
| 120 | 4.3 |
| 140 | 1.5 |
| 160 | 0.5 |
| 180 | 0.5 |
| 200 | 0.5 |
| 220 | 0.5 |
这是一个人的简短样本运行它的速度以 20 毫秒为单位。
所以我正在尝试检测冲刺(当此人在短距离内全速 运行 时)。
由于我的要求的性质,我正在编写一个程序来计算 c
。我可以很容易地以肮脏的方式做到这一点,定义一些最小值、最大值,寻找峰值,然后是冲刺。但我认为必须有更好的方法来做到这一点,也许是一些我不知道的机器学习算法。
如果我可以通过向程序展示一些示例来告诉程序什么是冲刺,然后在我这边不再进行干预的情况下检测它们,那就太好了。我只是不确定如何开始。
有没有人遇到过类似的事情并能指出正确的方向?
冲刺是一种加速。所以你只需要计算它(速度的导数)。之后取决于您所说的冲刺。使用平均值和最大值应该就足够了。
这感觉就像用火箭筒打苍蝇一样;我认为您的 "dirty" 方法是唯一的方法。术语 "sprint" 没有任何实际意义...如果您向任何机器提供冲刺示例,则意味着您已经使用了自己的任意分类方法来确定您是否认为它是,冲刺。
您如何定义问题?有些人可能 运行 10 m/s 全力以赴,其他人可能 运行 3 m/s 并认为这是冲刺。你怎么能从你有限的数据集中知道这个人当时是否将自己逼到了一个值得冲刺的极限?也许他们可以走得更快。一个人的结果如何影响另一个人的数据集以确定他们的 "sprint" 阈值?很多问题,但我认为有效的问题。实际上,您只能根据您的数据进行推断;例如,相对于平均值的最大速度是多少。我不会把它复杂化。
但是,如果您以受控格式收集结果,要求许多人进行短跑,然后记录影响他们能力的因素:BMI、体重、年龄、医疗条件、逆风速度等等。那么你可能会有一些可以从机器学习中受益的东西。