如何强制 EF 使用连接而不是拆分复杂的查询?

How can I force EF to use joins instead of splitting up a complicated query?

我有一个复杂的 IQueryable,我希望 EF 用单个数据库查询填充它,以便我可以将它用于延迟执行。请考虑以下示例。

对于这些模型:

public enum AlphaState { Unknown = '[=10=]', Good = 'G', Bad = 'B' }

[Table("MY_ALPHA")]
public class Alpha
{
    [Key]
    [Column("alpha_index")]
    public long Index { get; set; }

    [Column("alpha_id")] // user-editable field that users call ID
    public string AlphaId { get; set; }

    [Column("deleted")]
    public char? Deleted { get; set; }

    [Column("state")]
    public AlphaState State { get; set; }

    [InverseProperty("Alpha")]
    public ICollection<Bravo> Bravos { get; set; }
}

[Table("MY_BRAVO")]
public class Bravo
{
    [Key]
    [Column("bravo_index")]
    public long BravoIndex { get; set; }

    [ForeignKey("Alpha")]
    [Column("alpha_index")] // actually a 1:0..1 relationship
    public long? AlphaIndex { get; set; }
    public virtual Alpha Alpha { get; set; }

    [InverseProperty("Bravo")]
    public ICollection<Charlie> Charlies { get; set; }
}

[Table("MY_CHARLIE_VIEW")]
public class Charlie
{
    [Key]
    [Column("charlie_index")]
    public int CharlieIndex { get; set; }

    [Column("deleted")]
    public char? Deleted { get; set; }

    [Column("created_at")]
    public DateTime CreatedAt { get; set; }

    [ForeignKey("Bravo")]
    [Column("bravo_index")]
    public long BravoIndex { get; set; }
    public virtual Bravo Bravo { get; set; }

    [ForeignKey("Delta")]
    [Column("delta_index")]
    public long DeltaIndex { get; set; }
    public virtual Delta Delta { get; set; }

    [InverseProperty("Charlie")]
    public virtual ICollection<Delta> AllDeltas { get; set; }
}

[Table("MY_DELTA")]
public class Delta
{
    [Key]
    [Column("delta_index")]
    public long DeltaIndex { get; set; }

    [ForeignKey("Charlie")]
    [Column("charlie_index")]
    public long CharlieIndex { get; set; }
    public virtual Charlie Charlie { get; set; }

    [InverseProperty("Delta")] // actually a 1:0..1 relationship
    public ICollection<Echo> Echoes { get; set; }
}

public enum EchoType { Unknown = 0, One = 1, Two = 2, Three = 3 }

[Table("MY_ECHOES")]
public class Echo
{
    [Key]
    [Column("echo_index")]
    public int EchoIndex { get; set; }

    [Column("echo_type")]
    public EchoType Type { get; set; }

    [ForeignKey("Delta")]
    [Column("delta_index")]
    public long DeltaIndex { get; set; }
    public virtual Delta Delta { get; set; }
}

...考虑这个查询:

IQueryable<Alpha> result = context.Alphas.Where(a => a.State == AlphaState.Good)
                                         .Where(a => !a.Deleted.HasValue)
                                         .Where(a => a.Bravos.SelectMany(b => b.Charlies)
                                                             .Where(c => !c.Deleted.HasValue)
                                                             .Where(c => c.Delta.Echoes.Any())
                                                             .OrderByDescending(c => c.CreatedAt).Take(1)
                                                             .Any(c => c.Delta.Echoes.Any(e => e.Type == EchoType.Two)))
var query = result as System.Data.Objects.ObjectQuery;
string queryString = query.ToTraceString();

注意:查理实际上是一个观点table; Delta 有一个到 Charlie 的 FK table,但是视图为链接到那个 Charlie 的最新 Delta 提供了一个假的 FK,所以模型使用它,因为计划是将 EF 仅用于查询,从不用于更新。

我希望此查询由单个数据库查询填充,但正如所写的那样,实际情况并非如此。我如何修改此查询以获得相同的结果,但让 EF 简单地将条件构建到 results IQueryable 而不是为其预取数据?

我怎么知道它使用了两个查询

我确定它会分成多个查询,因为出于超出此问题范围的原因,我故意为上下文提供了错误的连接字符串。 result 是一个 IQueryable,因此它应该使用延迟执行,而不是在使用它之前实际尝试检索任何数据,但是我一声明它就收到连接失败异常。

背景

我们有一个现有的数据库结构、数据库访问层,以及使用上述结构和 DAL 的数十万行代码。我们想添加一个 UI 以允许用户构建他们自己的复杂查询,而 EF 似乎是为此构建基础模型的好方法。不过,我们以前从未使用过 EF,因此当权者已声明它永远无法连接到数据库;我们应该使用 EF 生成 IQueryable,从中提取查询字符串,并使用我们现有的 DAL 运行 查询。

context.Foos.Where(f => f.Bars.Any(b => b.SomeOtherData == "baz"));

我在我拥有的数据库上尝试了与您类似的查询(使用 LINQPad),结果是

SELECT 
  [Extent1].[Property1] AS [Property1]
  -- other properties of Foo
  FROM [dbo].[Foos] AS [Extent1]
  WHERE EXISTS (SELECT 
    1 AS [C1]
    FROM [dbo].[Bars] AS [Extent2]
    WHERE ([Extent1].[FooId] = [Extent2].[FooId]) AND (N'baz' = [Extent2].[SomeOtherData])
  )

...这对我来说绝对像是一个查询。

IQueryable 函数中的表达式不会直接执行 -- 它们用于生成 SQL,然后在需要具体化结果时用于执行查询。

尝试使用 LINQ 查询语法。

var result = (
    from f in foo
    join b in bar
        on f.fooid equals b.fooid
    where b.someotherdata = "baz"
    select new { f.fooid, f.somedata }
).Distinct().ToEnumerable();

这将推迟到枚举。

How I Know It's Using Two Queries

您观察到的不是 EF 开始 运行 您的查询。将查询分配给 result 变量后,您仍然拥有查询定义,而不是结果集。如果将探查器附加到数据库,您会看到没有针对您的查询执行 SELECT 语句。

那么,为什么 作为与数据库的连接?原因是第一次为给定的派生 DbContext 类型构建查询时,EF 会为该类型构建并缓存其内存中模型。它通过对您定义的类型、特性和属性应用各种约定来实现这一点。理论上这个过程不需要连接到数据库,但 SQL 服务器的提供者无论如何都会这样做。它这样做是为了确定您正在使用的 SQL 服务器的版本,以便确定它是否可以在其构建的模型中使用更新的 SQL 服务器功能。

有趣的是,这个模型是为 类型 缓存的,而不是上下文的实例。您可以通过处理 context 然后创建一个新的并重复构建查询的代码行来看到这一点。在第二种情况下,您根本不会看到与数据库的连接,因为 EF 会将其缓存模型用于您的上下文类型。

the Powers That Be have declared that it cannot ever connect to the database; we should use EF to generate an IQueryable, extract the query string from it, and use our existing DAL to run the query.

由于您需要完全避免让 EF 连接到数据库,您可以查看我的 post here,其中包含有关如何连接的详细信息而是在代码中预先提供此信息。

此外,请注意,EF 可能会在第一次遇到您的 DbContext 类型时连接到您的服务器还有另一个原因:初始化。除非您禁用了初始化(使用 Database.SetInitializer<MyContext>(null) 之类的东西),否则它将检查数据库是否存在,如果不存在则尝试创建它。

请注意,您可以直接在 EF 代码优先查询上调用 ToString() 以获得 T-SQL 查询。您不需要通过中间 ObjectQuery.ToTraceString() 方法,它实际上是遗留 EF API 的一部分。但是,这两种方法都用于调试和记录目的。使用 EF 构建查询而不执行查询是很不寻常的。您可能会遇到这种方法的问题——最明显的是当 EF 确定它应该生成参数化查询时。此外,不能保证不同版本的 EF 会为相同的输入生成类似的 T-SQL,因此当您更新到较新的 EF 版本时,您的代码最终可能会变得相当脆弱。确保你有足够的测试!

如果您担心让用户直接连接到数据库——这是一个完全合理的安全问题——您可以考虑另一种方法。我对此没有太多经验,但似乎 OData 可能很合适。这允许您在客户端上构建查询,通过远程连接序列化它们,然后在您的服务器上重新创建它们。然后,在服务器上,您可以针对您的数据库执行它们。您的客户需要对数据库一无所知。

如果您决定(或被指示)坚持您在问题中详述的方法,请花时间学习 how to profile a SQL Server connection。这将是您了解 EF 如何翻译您的查询的绝对必要工具。