如何获得相邻 Zeppelin 单元之间上下文的连续性
How to obtain continuity of context between adjacent Zeppelin cells
如以下 zeppelin
笔记本中所示,我们有两个单元格:
- 第一个单元格执行运算并将结果保存在
out
变量中
- 第二个单元格尝试对
out
变量执行操作。相反,有一个错误表明单元格 甚至没有意识到它应该是 运行ning pyspark
所以 - 不像 jupyter/ipython notebook
- Zeppelin 似乎在单元之间没有连续性:每个单元都是完全独立的?这是严重的限制:我们想将工作分成块,然后 运行 一次一个块 .. 就像 Jupyter
..
那么我是不是遗漏了一些关于如何 "link" 细胞在一起的东西?
每个段落(与jupyter中的cell相同)可以使用不同的技术。这些在 Zeppelin 中被称为 intepreter 支持。也正是因为如此,Zeppelin 才变得方便。
假设像这样的用例。
用 Markdown 描述笔记本
用Shell准备数据,比如curl,cp
用 Spark 分析
一些分析 SQL 使用 Spark 和临时 table
发布结果文件 Shell
范围
环境由同一个笔记本中的同一个解释器直接共享。也就是说。
In the SAME type of Interpreter, Variables/Method/Classes defined in one paragraph CAN be used by paragraphs executed later. It does not have to be physically later, just need be executed later.
In the DIFFERENT type of Interpreter, Variables/Method/Classes defined in one paragraph CAN NOT be used by paragraphs executed later.
Between different interpreters, Variables/Method/Classes are not directly visible. Backend Angular API can be used to pass between different interpreters.
Between Spark and Pyspark, temp tables are visiable to each other.
默认解释器。
- 一个笔记本可以有一个默认解释器。
- 要使用的其他解释器应明确使用 % 符号。
例子
这是一个例子。
如以下 zeppelin
笔记本中所示,我们有两个单元格:
- 第一个单元格执行运算并将结果保存在
out
变量中 - 第二个单元格尝试对
out
变量执行操作。相反,有一个错误表明单元格 甚至没有意识到它应该是 运行ning pyspark
所以 - 不像 jupyter/ipython notebook
- Zeppelin 似乎在单元之间没有连续性:每个单元都是完全独立的?这是严重的限制:我们想将工作分成块,然后 运行 一次一个块 .. 就像 Jupyter
..
那么我是不是遗漏了一些关于如何 "link" 细胞在一起的东西?
每个段落(与jupyter中的cell相同)可以使用不同的技术。这些在 Zeppelin 中被称为 intepreter 支持。也正是因为如此,Zeppelin 才变得方便。
假设像这样的用例。
用 Markdown 描述笔记本
用Shell准备数据,比如curl,cp
用 Spark 分析
一些分析 SQL 使用 Spark 和临时 table
发布结果文件 Shell
范围
环境由同一个笔记本中的同一个解释器直接共享。也就是说。
In the SAME type of Interpreter, Variables/Method/Classes defined in one paragraph CAN be used by paragraphs executed later. It does not have to be physically later, just need be executed later.
In the DIFFERENT type of Interpreter, Variables/Method/Classes defined in one paragraph CAN NOT be used by paragraphs executed later.
Between different interpreters, Variables/Method/Classes are not directly visible. Backend Angular API can be used to pass between different interpreters.
Between Spark and Pyspark, temp tables are visiable to each other.
默认解释器。
- 一个笔记本可以有一个默认解释器。
- 要使用的其他解释器应明确使用 % 符号。
例子
这是一个例子。