使用 SQLalchemy ORM 和 SQLite 通过跨数据库连接构建查询

Building queries with a cross database join using SQLalchemy ORM and SQLite

我有两个包含 table 的 SQLite 数据库,我需要使用 SQLalchemy 加入。由于某些原因,我无法将所有 table 合并到一个 SQLite 数据库中。我正在使用 SQLalchemy ORM。我无法在网上找到任何符合我具体情况的解决方案。

我的问题原则上与 SQLAlchemy error query join across database 相同,但是使用与我的用例不匹配的不同解决方案解决了原始发布者的问题。

我想问 Whosebug 的智者:

我想模拟以下 SQL 查询:

SELECT DISTINCT g.gene_symbol, o.orthofinder_id FROM eukarya.genes AS g JOIN annotations.orthofinder AS o ON g.gene_id=o.gene_id;

使用附加了两个数据库文件的 SQliteStudio,此查询工作正常。

我目前用来描述元数据的代码:

eukarya_engine = create_engine('sqlite:///eukarya_db.sqlite3')
annotations_engine = create_engine('sqlite:///eukarya_annotations_db.sqlite3')

meta = MetaData()  # This allows me to define cross database foreign keys

Eukarya = declarative_base(bind=eukarya_engine, metadata=meta)
Annotations = declarative_base(bind=annotations_engine, metadata=meta)
# I did the above in the hopes that by binding the engines this way,
# would percolate through the schema, and sqlalchemy would be able
# figure out which engine to use for each table.

class Genes(Eukarya):
  """SQLalchemy object representing the Genes table in the Eukarya database."""
  __tablename__ = 'genes'
  gene_id = Column(Integer, primary_key=True, unique=True)
  gene_symbol = Column(String(16), index=True)
  taxonomy_id = Column(Integer, ForeignKey(Species.taxonomy_id), index=True)
  original_gene_id = Column(String)

class Orthofinder(Annotations):
  """SQLalchemy object representing the Orthofinder table in the Annotations database."""
  __tablename__ = 'orthofinder'
  id = Column(Integer,primary_key=True, autoincrement=True)
  gene_id = Column(Integer, ForeignKey(Genes.gene_id), index=True)
  orthofinder_id = Column(String(10), index=True)

Session = sessionmaker()
session = Session(bind=eukarya_engine)

print(session.query(Genes.gene_symbol,Orthofinder.orthofinder_id).
      join(Orthofinder).all().statement)

最后打印语句returns:

sqlalchemy.exc.OperationalError: (sqlite3.OperationalError) no such table: orthofinder [SQL: 'SELECT genes.gene_symbol AS genes_gene_symbol, orthofinder.orthofinder_id AS orthofinder_orthofinder_id \nFROM genes JOIN orthofinder ON genes.gene_id = orthofinder.gene_id']

如果我能以某种方式将两个数据库引擎绑定到一个会话,我相信我的麻烦就结束了。但是怎么办? 对于连接到同一引擎的两个数据库(例如 MySQL 数据库中的两个数据库),我可以添加 __table_args__ = {'schema': 'annotations'}(根据 Cross database join in sqlalchemy),但我无法在SQLite.

案例

我更喜欢一种解决方案,它允许我的代码的用户构造查询而不必知道每个 table 驻留在哪个数据库中。

请帮忙!非常感谢!

回答我自己的问题(感谢 Ilja 找到解决方案):

我可以这样定义引擎:

engine  = create_engine('sqlite://',echo=True)  # generate in mem database to attach mutitple sqlite databases to.
engine.execute("attach database 'eukarya_db.sqlite3' as eukarya;")
engine.execute("attach database 'eukarya_annotations_db.sqlite3' as annotations;")

然后添加

__table_args__ = {'schema': 'eukarya'}

__table_args__ = {'schema': 'annotations'}

给我的 table 类.

很有魅力!