spark dataframe 是否像 pandas 这样的每一行都有一个 "row name"？

Does spark dataframe have a "row name" for each row like pandas?

我正在尝试使用 Spark DataFrames 对按行名称索引的两个 DataFrame 进行操作。在 pandas 中，我们可以做到

df.loc(['aIndex', 'anotherIndex'])

到 select df 中的两行按索引（或行名）。如何在 Spark DataFrame 中实现这一点？谢谢。

不，Spark 中没有行索引。 Spark Data Frames 更像是关系数据库中的表，所以如果你想访问特定的行，你必须过滤：

df = sqlContext.createDataFrame(
    [("Bob", 5), ("Alice", 6), ("Chuck", 4)], ("name", "age"))

df.where("name in ('Bob', 'Alice')")
df.where((df.name == "Bob") | (df.name == "Alice"))