如何按日期过滤极地数据框?
How to filter a polars dataframe by date?
df.filter(pl.col("MyDate") >= "2020-01-01")
不像 pandas 那样工作。
我找到了解决方法
df.filter(pl.col("MyDate") >= pl.datetime(2020,1,1))
但这并不能解决我需要使用字符串变量的问题。
您可以使用 python datetime
个对象。它们将被转换为极坐标 literal
表达式。
import polars as pl
from datetime import datetime
pl.DataFrame({
"dates": [datetime(2021, 1, 1), datetime(2021, 1, 2), datetime(2021, 1, 3)],
"vals": range(3)
}).filter(pl.col("dates") > datetime(2021, 1, 2))
或者在显式语法中:pl.col("dates") > pl.lit(datetime(2021, 1, 2))
使用pl.lit(my_date_str).str.strptime(pl.Date, fmt=my_date_fmt))
基于以上示例:
import polars as pl
from datetime import datetime
df=pl.DataFrame({
"dates": [datetime(2021, 1, 1), datetime(2021, 1, 2), datetime(2021, 1, 3)],
"vals": range(3)
})
my_date_str="2021-01-02"
my_date_fmt="%F"
df.filter(pl.col('dates') >= pl.lit(my_date_str).str.strptime(pl.Date, fmt=my_date_fmt))
shape: (2, 2)
┌─────────────────────┬──────┐
│ dates ┆ vals │
│ --- ┆ --- │
│ datetime[μs] ┆ i64 │
╞═════════════════════╪══════╡
│ 2021-01-02 00:00:00 ┆ 1 │
├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌┤
│ 2021-01-03 00:00:00 ┆ 2 │
└─────────────────────┴──────┘
请确保格式与您的日期字符串相匹配。例如,
my_date_str="01/02/21"
my_date_fmt="%D"
我无法评价这种方法的性能,但它提供了一种将字符串变量合并到代码中的简单方法。
df.filter(pl.col("MyDate") >= "2020-01-01")
不像 pandas 那样工作。
我找到了解决方法
df.filter(pl.col("MyDate") >= pl.datetime(2020,1,1))
但这并不能解决我需要使用字符串变量的问题。
您可以使用 python datetime
个对象。它们将被转换为极坐标 literal
表达式。
import polars as pl
from datetime import datetime
pl.DataFrame({
"dates": [datetime(2021, 1, 1), datetime(2021, 1, 2), datetime(2021, 1, 3)],
"vals": range(3)
}).filter(pl.col("dates") > datetime(2021, 1, 2))
或者在显式语法中:pl.col("dates") > pl.lit(datetime(2021, 1, 2))
使用pl.lit(my_date_str).str.strptime(pl.Date, fmt=my_date_fmt))
基于以上示例:
import polars as pl
from datetime import datetime
df=pl.DataFrame({
"dates": [datetime(2021, 1, 1), datetime(2021, 1, 2), datetime(2021, 1, 3)],
"vals": range(3)
})
my_date_str="2021-01-02"
my_date_fmt="%F"
df.filter(pl.col('dates') >= pl.lit(my_date_str).str.strptime(pl.Date, fmt=my_date_fmt))
shape: (2, 2)
┌─────────────────────┬──────┐
│ dates ┆ vals │
│ --- ┆ --- │
│ datetime[μs] ┆ i64 │
╞═════════════════════╪══════╡
│ 2021-01-02 00:00:00 ┆ 1 │
├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌┤
│ 2021-01-03 00:00:00 ┆ 2 │
└─────────────────────┴──────┘
请确保格式与您的日期字符串相匹配。例如,
my_date_str="01/02/21"
my_date_fmt="%D"
我无法评价这种方法的性能,但它提供了一种将字符串变量合并到代码中的简单方法。