Dask Bag read_text() 线序

Dask Bag read_text() line order

dask.bag.read_text() 是否保留行序?从多个文件读取时是否仍然保留?

bag = db.read_text('program.log')
bag = db.read_text(['program.log', 'program.log.1'])

非正式地,是的,大多数 Dask.bag 操作确实保持顺序。

这种行为并不能得到严格保证,但是我看不出有任何理由预计在不久的将来会发生变化。