将 python 代码转换为 python 火花代码
converting python code to python spark code
下面的代码在 Python 中,我想基本上将这段代码转换为 pyspark
我不确定语句的代码是什么 - pd.read_sql(query,connect_to_hive) 转换成 pyspark
需要从 EDL 中提取数据,因此使用 PYODBC 连接到 EDL,然后他们使用 sql 查询提取数据。
pyodbc 与企业数据湖的连接:
connect_to_hive = pyodbc.connect("DSN=Hive", autocommit=True)
transaction=pd.read_sql(query, connect_to_hive)
connect_to_hive.close()
#Query 函数:下面只是一个基本的 sql 查询来复制这个问题。
query=f'''
with trans as (
SELECT
a.employee_name,
a.employee_id
FROM EMP
'''
以上代码转换为SparkSQL代码如下:
spark = SparkSession.builder.enableHiveSupport().getOrCreate()
query=f'''
with trans as (
SELECT
a.employee_name,
a.employee_id
FROM EMP
'''
employeeDF = spark.sql(query)
employeeDF.show(truncate=False)
查询将是 运行,就像在 Hive 上一样,结果将作为 Spark DataFrame 提供给您
下面的代码在 Python 中,我想基本上将这段代码转换为 pyspark 我不确定语句的代码是什么 - pd.read_sql(query,connect_to_hive) 转换成 pyspark
需要从 EDL 中提取数据,因此使用 PYODBC 连接到 EDL,然后他们使用 sql 查询提取数据。
pyodbc 与企业数据湖的连接:
connect_to_hive = pyodbc.connect("DSN=Hive", autocommit=True)
transaction=pd.read_sql(query, connect_to_hive)
connect_to_hive.close()
#Query 函数:下面只是一个基本的 sql 查询来复制这个问题。
query=f'''
with trans as (
SELECT
a.employee_name,
a.employee_id
FROM EMP
'''
以上代码转换为SparkSQL代码如下:
spark = SparkSession.builder.enableHiveSupport().getOrCreate()
query=f'''
with trans as (
SELECT
a.employee_name,
a.employee_id
FROM EMP
'''
employeeDF = spark.sql(query)
employeeDF.show(truncate=False)
查询将是 运行,就像在 Hive 上一样,结果将作为 Spark DataFrame 提供给您