根据另一列的日期戳条件打印行
Printing row based on datestamp condition of another column
背景:
我有一个 DataFrame ('weather_tweets
') 包含两个感兴趣的列,weather
(天气火星)和 date
(天气相关的日期)。结构如下:
Objective:
我正在尝试编写代码来确定最新的日期戳(date
列)并打印该行的相应的 weather
列值。
示例行:
这是一个示例行:
weather_tweets = [
('tweet', 'weather', 'date'),
('Mars Weather@MarsWxReport·Jul 15InSight sol 58', 'InSight sol 580 (2020-07-14) low -88.8ºC (-127.8ºF) high -8.4ºC (16.8ºF) winds from the WNW at 5.9 m/s (13.3 mph) gusting to 15.4 m/s (34.4 mph) pressure at 7.80 hPa, '2020-07-14')]
我的代码:
到目前为止,我只能制定一些混乱的代码来 return 最新的日期,但是它对我的预期结果毫无用处:
latest_weather = weather_tweets.groupby(['tweet', 'weather'])['date'].transform(max) == weather_tweets['date']
print(weather_tweets[latest_weather])
任何有关如何达到预期结果的建议都将不胜感激。
尝试:
weather_tweets[weather_tweets.date == weather_tweets.date.max()].weather
您可以在末尾添加to_frame()
以获得更优雅的数据帧结果:
weather_tweets[weather_tweets.date == weather_tweets.date.max()].weather.to_frame()
或者创建新的数据框:
df_latest = weather_tweets.loc[weather_tweets.date == weather_tweets.date.max(),['weather','date']]
df_max.columns = ['latest_weather','latest_date']
背景:
我有一个 DataFrame ('weather_tweets
') 包含两个感兴趣的列,weather
(天气火星)和 date
(天气相关的日期)。结构如下:
Objective:
我正在尝试编写代码来确定最新的日期戳(date
列)并打印该行的相应的 weather
列值。
示例行:
这是一个示例行:
weather_tweets = [
('tweet', 'weather', 'date'),
('Mars Weather@MarsWxReport·Jul 15InSight sol 58', 'InSight sol 580 (2020-07-14) low -88.8ºC (-127.8ºF) high -8.4ºC (16.8ºF) winds from the WNW at 5.9 m/s (13.3 mph) gusting to 15.4 m/s (34.4 mph) pressure at 7.80 hPa, '2020-07-14')]
我的代码:
到目前为止,我只能制定一些混乱的代码来 return 最新的日期,但是它对我的预期结果毫无用处:latest_weather = weather_tweets.groupby(['tweet', 'weather'])['date'].transform(max) == weather_tweets['date']
print(weather_tweets[latest_weather])
任何有关如何达到预期结果的建议都将不胜感激。
尝试:
weather_tweets[weather_tweets.date == weather_tweets.date.max()].weather
您可以在末尾添加to_frame()
以获得更优雅的数据帧结果:
weather_tweets[weather_tweets.date == weather_tweets.date.max()].weather.to_frame()
或者创建新的数据框:
df_latest = weather_tweets.loc[weather_tweets.date == weather_tweets.date.max(),['weather','date']]
df_max.columns = ['latest_weather','latest_date']