如何在 C# 中动态构建 Func lambda 表达式
How to build a Func lambda expression dynamically in C#
我有一个 ElasticSearch 数据库,我想在其中执行聚合。
我正在使用 NEST 和 lambda 表达式来创建查询。
但是,我需要同时对同一个文档(channel1和channel2)的多个字段进行聚合。
目前我有 2 个频道,所以我的查询在它们上面工作正常。
var res = elasticClient.Search<DataRecord>(s => s
.Index(ElasticIndexName)
.Aggregations(a => a
.DateHistogram("mydoc", h => h
.Aggregations(ag => ag.Average("avg1", b => b.Field("channel1")).Average("avg2", b => b.Field("channel2")))
)
)
);
问题是没有。频道的数量可能不同,可能是三个或四个或其他,所以我希望我的 Func 低于
ag => ag.Average("avg1", b => b.Field("channel1")).Average("avg2", b => b.Field("channel2"))
将被动态创建(例如,就像您在 SQL 查询中所做的那样),因为没有。通道数仅在运行时已知。
例如
如果我有四个频道,查询应该是这样的:
var res = elasticClient.Search<DataRecord>(s => s
.Index(ElasticIndexName)
.Aggregations(a => a
.DateHistogram("mydoc", h => h
.Aggregations(ag => ag.Average("avg1", b => b.Field("channel1")).Average("avg2", b => b.Field("channel2")).Average("avg3", b => b.Field("channel3")).Average("avg4", b => b.Field("channel4")))
)
)
);
所以基本上我需要某种 for 循环,我可以在其中动态构建 lambda 表达式
尝试使用 System.Linq.Expressions 命名空间。它包含各种表达式类型,您可以使用它们来构建表达式树,然后您可以对其进行编译和动态 运行。
https://msdn.microsoft.com/en-us/library/system.linq.expressions%28v=vs.110%29.aspx
如果需要,可以使用 LoopExpression。或者,如果您知道创建表达式树时所需的数量,则可以使用普通 C# 代码进行循环以添加重复功能以基本上展开循环。如果您愿意(或在 Lambda 方法的通用参数中指定),您可以将编译后的表达式转换为所需的 Func 类型,以使用强类型方法。您可以在我发布的 link 中的示例中看到这一点。
编辑:根据您的要求,如果您不想,您可能不需要使用表达式命名空间,尽管您仍然可以。也许您可能想编写这样的扩展方法:
// Replace the return type "object" with the type you expect returned from the Average call
// Replace the "object" in 'this object @this' with the type of 'ag' in the lambda 'h.Aggregations(ag => ag'
public static object AverageChannels(this object @this, int channelCount) // alternatively, obtain the channel count from the input variable if this can be done
{
if (channelCount < 1)
{
// do something
}
var result = @this.Average("avg1", b => b.Field("channel1");
for (int i = 2; i < channelCount + 1; i++)
{
var avgText = "avg" + i.ToString();
var channelText = "channel" + i.ToString();
result = result .Average(avgText, b => b.Field(channelText))
}
return result;
}
如果计数大于 0,这将调用 .Average 至少一次,然后为每个额外的通道调用。
你会像这样使用它:
.DateHistogram("mydoc", h => h.Aggregations(ag => ag.AverageChannels(4))
如果可以从 'ag' 对象中检索通道数,则可以根据需要完全排除 channelCount 参数。
这是在 Visual Studio 之外写的,所以我不能保证它 100% 正确,但是像下面这样的东西演示了如何构造表达式,以及如何编译它们以供直接调用:
// Test whether a string is a certain length
public Func<string,bool> IsOfCorrectLength(int lengthToTest)
{
var param = Expression.Parameter(typeof(string));
var test = Expression.Equal(Expression.Property(param, "Length"), Expression.Constant(lengthToTest));
return Expression.Lambda<string,bool>(test,param).Compile();
}
public void DoSomething()
{
var is5CharsLong = IsOfCorrectLength(5);
var result = is5CharsLong("Here's a string that would fail");
}
对于只需要表达式的情况,可以直接传递表达式;请注意,某些表达式的使用者可能不支持所有表达式类型 - 特别是如果必须将表达式转换为 SQL.
之类的东西时
MSDN 有一些非常有趣的文章介绍如何在运行时使用表达式来做一些非常漂亮的事情。
您可以编写一个方法,该方法采用直方图和字段名称集合的名称以及 returns Func<AggregationDescriptor<DataRecord>, AggregationDescriptor<DataRecord>>
public static Func<AggregationDescriptor<DataRecord>, AggregationDescriptor<DataRecord>> DateHistogramOfAveragesForFields(
string histogramName,
IEnumerable<string> fields)
{
return aggs => aggs
.DateHistogram(histogramName, h => h
.Aggregations(d =>
fields.Select((field, index) => new { Field = field, Name = "avg" + (index + 1) })
.Aggregate(d, (descriptor, field) => descriptor.Average(field.Name, b => b.Field(field.Field)))));
}
它看起来有点长,但本质上,我们构建了一个方法,它期望接收一个 AggregationDescriptor<DataRecord>
并在其上调用 .DateHistogram()
,将直方图名称传递给它并生成一个从字段集合中收集字段名称和 描述 标签以传递给 DateHistogramAggregationDescriptor<DataRecord>
.
使用起来很简单
void Main()
{
var settings = new ConnectionSettings(new Uri("http://localhost:9200"));
var client = new ElasticClient(settings);
var results = client.Search<DataRecord>(s => s
.Index("index")
.Aggregations(DateHistogramOfAveragesForFields("mydoc", new[] { "channel1", "channel2", "channel3", "channel4" })
)
);
Console.WriteLine(string.Format("{0} {1}", results.RequestInformation.RequestMethod, results.RequestInformation.RequestUrl));
Console.WriteLine(Encoding.UTF8.GetString(results.RequestInformation.Request));
}
public class DataRecord { }
输出以下搜索查询
POST http://localhost:9200/index/datarecord/_search
{
"aggs": {
"mydoc": {
"date_histogram": {
"format": "date_optional_time"
},
"aggs": {
"avg1": {
"avg": {
"field": "channel1"
}
},
"avg2": {
"avg": {
"field": "channel2"
}
},
"avg3": {
"avg": {
"field": "channel3"
}
},
"avg4": {
"avg": {
"field": "channel4"
}
}
}
}
}
}
无需使用表达式 API 构建表达式树 :)
我有一个 ElasticSearch 数据库,我想在其中执行聚合。 我正在使用 NEST 和 lambda 表达式来创建查询。
但是,我需要同时对同一个文档(channel1和channel2)的多个字段进行聚合。 目前我有 2 个频道,所以我的查询在它们上面工作正常。
var res = elasticClient.Search<DataRecord>(s => s
.Index(ElasticIndexName)
.Aggregations(a => a
.DateHistogram("mydoc", h => h
.Aggregations(ag => ag.Average("avg1", b => b.Field("channel1")).Average("avg2", b => b.Field("channel2")))
)
)
);
问题是没有。频道的数量可能不同,可能是三个或四个或其他,所以我希望我的 Func 低于
ag => ag.Average("avg1", b => b.Field("channel1")).Average("avg2", b => b.Field("channel2"))
将被动态创建(例如,就像您在 SQL 查询中所做的那样),因为没有。通道数仅在运行时已知。
例如 如果我有四个频道,查询应该是这样的:
var res = elasticClient.Search<DataRecord>(s => s
.Index(ElasticIndexName)
.Aggregations(a => a
.DateHistogram("mydoc", h => h
.Aggregations(ag => ag.Average("avg1", b => b.Field("channel1")).Average("avg2", b => b.Field("channel2")).Average("avg3", b => b.Field("channel3")).Average("avg4", b => b.Field("channel4")))
)
)
);
所以基本上我需要某种 for 循环,我可以在其中动态构建 lambda 表达式
尝试使用 System.Linq.Expressions 命名空间。它包含各种表达式类型,您可以使用它们来构建表达式树,然后您可以对其进行编译和动态 运行。
https://msdn.microsoft.com/en-us/library/system.linq.expressions%28v=vs.110%29.aspx
如果需要,可以使用 LoopExpression。或者,如果您知道创建表达式树时所需的数量,则可以使用普通 C# 代码进行循环以添加重复功能以基本上展开循环。如果您愿意(或在 Lambda 方法的通用参数中指定),您可以将编译后的表达式转换为所需的 Func 类型,以使用强类型方法。您可以在我发布的 link 中的示例中看到这一点。
编辑:根据您的要求,如果您不想,您可能不需要使用表达式命名空间,尽管您仍然可以。也许您可能想编写这样的扩展方法:
// Replace the return type "object" with the type you expect returned from the Average call
// Replace the "object" in 'this object @this' with the type of 'ag' in the lambda 'h.Aggregations(ag => ag'
public static object AverageChannels(this object @this, int channelCount) // alternatively, obtain the channel count from the input variable if this can be done
{
if (channelCount < 1)
{
// do something
}
var result = @this.Average("avg1", b => b.Field("channel1");
for (int i = 2; i < channelCount + 1; i++)
{
var avgText = "avg" + i.ToString();
var channelText = "channel" + i.ToString();
result = result .Average(avgText, b => b.Field(channelText))
}
return result;
}
如果计数大于 0,这将调用 .Average 至少一次,然后为每个额外的通道调用。 你会像这样使用它:
.DateHistogram("mydoc", h => h.Aggregations(ag => ag.AverageChannels(4))
如果可以从 'ag' 对象中检索通道数,则可以根据需要完全排除 channelCount 参数。
这是在 Visual Studio 之外写的,所以我不能保证它 100% 正确,但是像下面这样的东西演示了如何构造表达式,以及如何编译它们以供直接调用:
// Test whether a string is a certain length
public Func<string,bool> IsOfCorrectLength(int lengthToTest)
{
var param = Expression.Parameter(typeof(string));
var test = Expression.Equal(Expression.Property(param, "Length"), Expression.Constant(lengthToTest));
return Expression.Lambda<string,bool>(test,param).Compile();
}
public void DoSomething()
{
var is5CharsLong = IsOfCorrectLength(5);
var result = is5CharsLong("Here's a string that would fail");
}
对于只需要表达式的情况,可以直接传递表达式;请注意,某些表达式的使用者可能不支持所有表达式类型 - 特别是如果必须将表达式转换为 SQL.
之类的东西时MSDN 有一些非常有趣的文章介绍如何在运行时使用表达式来做一些非常漂亮的事情。
您可以编写一个方法,该方法采用直方图和字段名称集合的名称以及 returns Func<AggregationDescriptor<DataRecord>, AggregationDescriptor<DataRecord>>
public static Func<AggregationDescriptor<DataRecord>, AggregationDescriptor<DataRecord>> DateHistogramOfAveragesForFields(
string histogramName,
IEnumerable<string> fields)
{
return aggs => aggs
.DateHistogram(histogramName, h => h
.Aggregations(d =>
fields.Select((field, index) => new { Field = field, Name = "avg" + (index + 1) })
.Aggregate(d, (descriptor, field) => descriptor.Average(field.Name, b => b.Field(field.Field)))));
}
它看起来有点长,但本质上,我们构建了一个方法,它期望接收一个 AggregationDescriptor<DataRecord>
并在其上调用 .DateHistogram()
,将直方图名称传递给它并生成一个从字段集合中收集字段名称和 描述 标签以传递给 DateHistogramAggregationDescriptor<DataRecord>
.
使用起来很简单
void Main()
{
var settings = new ConnectionSettings(new Uri("http://localhost:9200"));
var client = new ElasticClient(settings);
var results = client.Search<DataRecord>(s => s
.Index("index")
.Aggregations(DateHistogramOfAveragesForFields("mydoc", new[] { "channel1", "channel2", "channel3", "channel4" })
)
);
Console.WriteLine(string.Format("{0} {1}", results.RequestInformation.RequestMethod, results.RequestInformation.RequestUrl));
Console.WriteLine(Encoding.UTF8.GetString(results.RequestInformation.Request));
}
public class DataRecord { }
输出以下搜索查询
POST http://localhost:9200/index/datarecord/_search
{
"aggs": {
"mydoc": {
"date_histogram": {
"format": "date_optional_time"
},
"aggs": {
"avg1": {
"avg": {
"field": "channel1"
}
},
"avg2": {
"avg": {
"field": "channel2"
}
},
"avg3": {
"avg": {
"field": "channel3"
}
},
"avg4": {
"avg": {
"field": "channel4"
}
}
}
}
}
}
无需使用表达式 API 构建表达式树 :)