read_csv 的长文件路径的故障排除行连续错误
Trouble shooting line continuation error for a long file path for read_csv
我正在尝试拆分一个长文件路径,以便无需移动屏幕即可阅读它。
edgelist = pd.read_csv(r'https://gist.githubusercontent.com/brooksandrew' /
r'/e570c38bcc72a8d102422f2af836513b/raw' /
r'/89c76b2563dbc0e88384719a35cba0dfc04cd522' /
r'/edgelist_sleeping_giant.csv')
但是,我得到这个错误:
TypeError Traceback (most recent call last)
<ipython-input-4-a0ff45f0f7db> in <module>
2 edgelist = pd.read_csv(r'https://gist.githubusercontent.com/brooksandrew' /
3 r'/e570c38bcc72a8d102422f2af836513b/raw' /
----> 4 r'/89c76b2563dbc0e88384719a35cba0dfc04cd522' /
5 r'/edgelist_sleeping_giant.csv')
6 edgelist.head(10)
我看过其他一些堆栈帖子,但我不明白它们。我尝试了多种删除正斜杠和重新定位引号的组合,但我认为我只是在抓住救命稻草。我希望得到有关出现此错误的原因的技术解释。
顺便说一句,将加载语句写在一行上并且没有结束 [孤立的] 正斜杠(在第 2、3 和 4 行)是可行的,但是如果不滑动屏幕视图我就看不到整个语句。我正在寻找在一个视图中可读的内容。
Python 中的续行用反斜杠表示,您一直在使用正斜杠。
这应该可以正常工作:
edgelist = pd.read_csv(r'https://gist.githubusercontent.com/brooksandrew' \
r'/e570c38bcc72a8d102422f2af836513b/raw' \
r'/89c76b2563dbc0e88384719a35cba0dfc04cd522' \
r'/edgelist_sleeping_giant.csv')
由于 URL 本身没有反斜杠,您不需要使用原始字符串文字,只需使用标准字符串文字即可:
edgelist = pd.read_csv('https://gist.githubusercontent.com/brooksandrew' \
'/e570c38bcc72a8d102422f2af836513b/raw' \
'/89c76b2563dbc0e88384719a35cba0dfc04cd522' \
'/edgelist_sleeping_giant.csv')
您甚至可以删除引号,但所有空格也需要删除,因为它们将成为结果字符串的一部分(并且不再是正确的 URL):
edgelist = pd.read_csv('https://gist.githubusercontent.com/brooksandrew\
/e570c38bcc72a8d102422f2af836513b/raw\
/89c76b2563dbc0e88384719a35cba0dfc04cd522\
/edgelist_sleeping_giant.csv')
我正在尝试拆分一个长文件路径,以便无需移动屏幕即可阅读它。
edgelist = pd.read_csv(r'https://gist.githubusercontent.com/brooksandrew' /
r'/e570c38bcc72a8d102422f2af836513b/raw' /
r'/89c76b2563dbc0e88384719a35cba0dfc04cd522' /
r'/edgelist_sleeping_giant.csv')
但是,我得到这个错误:
TypeError Traceback (most recent call last)
<ipython-input-4-a0ff45f0f7db> in <module>
2 edgelist = pd.read_csv(r'https://gist.githubusercontent.com/brooksandrew' /
3 r'/e570c38bcc72a8d102422f2af836513b/raw' /
----> 4 r'/89c76b2563dbc0e88384719a35cba0dfc04cd522' /
5 r'/edgelist_sleeping_giant.csv')
6 edgelist.head(10)
我看过其他一些堆栈帖子,但我不明白它们。我尝试了多种删除正斜杠和重新定位引号的组合,但我认为我只是在抓住救命稻草。我希望得到有关出现此错误的原因的技术解释。
顺便说一句,将加载语句写在一行上并且没有结束 [孤立的] 正斜杠(在第 2、3 和 4 行)是可行的,但是如果不滑动屏幕视图我就看不到整个语句。我正在寻找在一个视图中可读的内容。
Python 中的续行用反斜杠表示,您一直在使用正斜杠。
这应该可以正常工作:
edgelist = pd.read_csv(r'https://gist.githubusercontent.com/brooksandrew' \
r'/e570c38bcc72a8d102422f2af836513b/raw' \
r'/89c76b2563dbc0e88384719a35cba0dfc04cd522' \
r'/edgelist_sleeping_giant.csv')
由于 URL 本身没有反斜杠,您不需要使用原始字符串文字,只需使用标准字符串文字即可:
edgelist = pd.read_csv('https://gist.githubusercontent.com/brooksandrew' \
'/e570c38bcc72a8d102422f2af836513b/raw' \
'/89c76b2563dbc0e88384719a35cba0dfc04cd522' \
'/edgelist_sleeping_giant.csv')
您甚至可以删除引号,但所有空格也需要删除,因为它们将成为结果字符串的一部分(并且不再是正确的 URL):
edgelist = pd.read_csv('https://gist.githubusercontent.com/brooksandrew\
/e570c38bcc72a8d102422f2af836513b/raw\
/89c76b2563dbc0e88384719a35cba0dfc04cd522\
/edgelist_sleeping_giant.csv')