如何在第一行显示我现有的列名而不是 '_c0'、'_c1'、'_c2'、'_c3'、'_c4'?
How to show my existing column name instead '_c0', '_c1', '_c2', '_c3', '_c4' in first row?
第一行显示 _c0、_c1 而不是我原来的列名称的数据框。
我想显示我的 CSV 文件第一行的列名。
dff =
spark.read.csv("abfss://dir@acname.dfs.core.windows.net/
diabetes.csv")
dff:pyspark.sql.dataframe.DataFrame
_c0:string
_c1:string
_c2:string
_c3:string
_c4:string
_c5:string
_c6:string
_c7:string
_c8:string
我刚刚按以下代码排序
.select(col("_c0").alias("A"),
col("_c1").alias("B"),
col("_c2").alias("C"),
col("_c3").alias("D"),
col("_c4").alias("E")
)
非常简单的解决方案是在读取文件时设置 header=True:
dff = spark.read.csv("abfss://dir@acname.dfs.core.windows.net/diabetes.csv", header=True)
加载 CSV 文件时将 header 设置为真。
spark.read.format("csv")
.option("delimiter", ",")
.option("header", "true")
.option("inferSchema", "true")
.load("file.csv")
第一行显示 _c0、_c1 而不是我原来的列名称的数据框。
我想显示我的 CSV 文件第一行的列名。
dff =
spark.read.csv("abfss://dir@acname.dfs.core.windows.net/
diabetes.csv")
dff:pyspark.sql.dataframe.DataFrame
_c0:string
_c1:string
_c2:string
_c3:string
_c4:string
_c5:string
_c6:string
_c7:string
_c8:string
我刚刚按以下代码排序
.select(col("_c0").alias("A"),
col("_c1").alias("B"),
col("_c2").alias("C"),
col("_c3").alias("D"),
col("_c4").alias("E")
)
非常简单的解决方案是在读取文件时设置 header=True:
dff = spark.read.csv("abfss://dir@acname.dfs.core.windows.net/diabetes.csv", header=True)
加载 CSV 文件时将 header 设置为真。
spark.read.format("csv")
.option("delimiter", ",")
.option("header", "true")
.option("inferSchema", "true")
.load("file.csv")