"No data available" 在 Zeppelin 排行榜中
"No data available" in Zeppelin charts
我在使用 Zeppelin 创建可视化时遇到问题。我有一个包含大约 6 亿条记录的数据集。它存储在 HDFS 集群中,我可以作为 Spark 数据帧加载:
%spark.pyspark
input_hdfs_path = u'hdfs://cluster-master:9000/data/CDR_*.parquet'
df = spark.read.format('parquet').load(input_hdfs_path)
df.registerTempTable("df")
我有兴趣在 CDR(字段 CDR_LENGTH
)的长度上创建直方图:
%sql
select ROUND(CDR_LENGTH, -2) as duration, count(*) as count
from df
group by 1
order by 1
我确实在 Table 选项卡(有两列,duration
和 count
)中得到了适当的结果,但是当转到条形图选项卡(或任何其他图形)时选项卡),它只是说 "No data available"。你能弄清楚我做错了什么吗?谢谢
您可以在图表按钮的右侧找到 settings
,
然后你定义 Keys
, Groups
, Values
随心所欲。
我在使用 Zeppelin 创建可视化时遇到问题。我有一个包含大约 6 亿条记录的数据集。它存储在 HDFS 集群中,我可以作为 Spark 数据帧加载:
%spark.pyspark
input_hdfs_path = u'hdfs://cluster-master:9000/data/CDR_*.parquet'
df = spark.read.format('parquet').load(input_hdfs_path)
df.registerTempTable("df")
我有兴趣在 CDR(字段 CDR_LENGTH
)的长度上创建直方图:
%sql
select ROUND(CDR_LENGTH, -2) as duration, count(*) as count
from df
group by 1
order by 1
我确实在 Table 选项卡(有两列,duration
和 count
)中得到了适当的结果,但是当转到条形图选项卡(或任何其他图形)时选项卡),它只是说 "No data available"。你能弄清楚我做错了什么吗?谢谢
您可以在图表按钮的右侧找到 settings
,
然后你定义 Keys
, Groups
, Values
随心所欲。