使用 Pig 提取每年不同电影的列表

extract the list of different movies for each year using Pig

我在 pig 中有一个简单的代码,我想提取每年的电影数量,我在 movies 中加载了文件的内容,然后输入了这段代码:

groupingyear = group movies by year;
vrar = foreach groupingyear generate movies.year, COUNT(movies.year); 

结果很好!但是我想得到的是(year,number of films)结构而不是这个结构:(为什么年份写了很多次?)

您正在计算 years.Assuming 您的电影数据集中有一个字段 movie_name。

groupingyear = group movies by year;
vrar = foreach groupingyear generate group, COUNT(movies.movie_name);