[深入学习C#]LINQ查询表达式详解(1)——基本语法、使用扩展方法和Lambda表达式简化LINQ查询

来源:互联网 发布:大数据分析需要多少人 编辑:程序博客网 时间:2024/04/27 17:34

简介

  在Git上下载源码
  在工程中我们少不了要定义类或者结构去储存数据,这些数据将被临时地储存在内存中,现在我们想要对其完成一些类似于查找、过滤等等常见的任务的时候,我们该如何去做呢?
  我们可以自己写代码去对集合中的每个对象进行遍历,检查变量的每个字段看其是否满足条件。这样的故事已经发生太多次了,微软怎么可能容忍在C#里发生如此弱智的事情呢?于是,C#的设计者决定在C#中集成查询的语法,以最大限度地减少程序员书写类似代码的情况。
  这也就是我们说的LINQ(Language Intergated Query)也就是语言集成查询,我们可以使用同样的语法访问不同的数据源。

为什么要使用LINQ?

  几乎所有的应用程序都需要对数据进行处理,大部分的程序都通过自定义的逻辑来完成这些操作。这样做的弊端之意就是,代码逻辑将会跟它处理的数据的结构紧密耦合在一起,如果数据结构发生了改变,也许将会带来海量的代码改动。
  为了解决这个问题,C#将这些处理数据的代码都抽象出来,提供给了广大开发者。这就是LINQ。
  LINQ的语法类似于关系和分层查询语言(SQL和XQuery),我们可以在不更改查询代码的情况下对数据结构进行更改。LINQ比之SQL要更加灵活,可以处理更广泛的逻辑数据结构。当然,这些数据结构都需要实现了IEnumerable或者IEnumerable< T >接口,才可以进行LINQ查询。

LINQ查询表达式语法详解

表达式基础语法

  LINQ查询表达式以from子句开始,以select或者group子句结束。在这两个子句之间可以跟零个或者多个from、let、where、join或者orderby子句。
  每个from子句都是一个生成器,该生成器将引入一个包括序列(Sequence)的元素的范围变量(range variable)。每个let子句都会引入一个范围变量,以表示通过前一个范围变量计算的值。每个where子句都是一个筛选器,用于从结果中排除项。每个join子句都将指定的源序列键与其他序列的键进行比较,以产生匹配对。每个orderby子句都会根据指定的条件对各项进行重新排序。而最后的select或者group子句根据范围变量来指定结果的表现形式。最后可以使用into子句来连接查询,将某一查询结果的视为后续查询的生成器。

标准查询操作符

  在了解LINQ查询表达式之前,怎么能不了解下它的查询操作符呢?下面列表列出了LINQ定义的标准查询操作符。

表1:LINQ标准查询操作符

标准查询操作符 说明 where OfType<TResult> 筛选操作符定义了返回元素的条件。在Where查询操作符中,可以使用谓词,例如Lambda表达式定义的谓词,来返回布尔值。OfType<TResult>根据类型筛选元素,只返回TResult的类型元素 Select 和SelectMany 投射操作符用于把对象转换为另一个类型的新对象。Select和SelectMany定义了根据选择器函数选择结果值的投射。 OrderBy、ThenBy 、OrderByDescending 、ThenByDescending 、Reverse 排序操作符改变所返回的元素的顺序。OrderBy按升序排列,OrderByDescending按降序排列。如果第一次排序结果很类似,就可以使用ThenBy和ThenByDescending操作符进行第二次排序。Reverse反转集合中的元素顺序。 GroupBy、ToLookUp 组合运算符把数据放在组里面。GroupBy操作符组合有公共键的元素。ToLookUp通过创建一个一对多的字典,来组合元素。 Join、GroupJoin 链接运算符用于合并不直接相关的集合。使用Join操作符,可以根绝键选择器函数连接两个集合,这类似于SQL中的Join。GroupJoin操作符连接两个集合,组合其结果。 Any、All、Contains 如果元素序列满足指定的条件,两次操作符就返回布尔值。Any、ALll和Contains都是限定符操作符。Any确定集合中是否有确定满足谓词函数的元素。ALll确定集合中的所有元素是否都满足谓词函数。Contains检查某个元素是否在集合中。这些操作符都返回一个布尔值。 Take、Skip、TakeWhile、SkipWhile 分区操作符返回集合的一个子集,Take、Skip、TakeWhile、SkipWhile都是分区操作符。使用它们可以得到部分结果,使用Take必须指定要从集合中提取的元素个数;Skip跳过指定个数的元素,提取其它元素;TakeWhile提取条件为真的元素。 Distinct、Union、Intersect、Except、Zip Set操作符返回一个集合。Distinct从集合中删除重复的元素,除了Distinct之外,其它的Set操作符都需要两个集合。Union返回出现在其中一个集合中的唯一元素。Intersect返回两个集合中都有的元素。Except返回值出现在一个集合中的元素。Zip是.NET 4新增的,它把两个集合合并为一个。 First、FirstOrDefault、Last、LastOrDefault、ElementAt、ElementAtOrDefault、Single、SingleOrDefault 这些元素操作符仅返回一个元素。First返回第一个满足条件的元素。FirstOrDefault类似于First,单如果没有找到满足条件的元素,就返回类型的默认值。Last返回最后一个满足条件的元素。ElementAt指定了要返回的元素的位置。Single只返回一个满足条件的元素。如果有多个元素都满足条件,就抛出一个异常。 Count、Sum、Min、Max、Average、Aggregate 聚合操作符计算集合的一个值。利用这些聚合操作符,可以计算所有值的总和、所有元素的个数、值最大和最小的元素,以及平均值等等。 ToArray、ToEnumerable、ToList、ToDictionary、Cast<TRsult> 这些转换操作符将集合转换为数组:IEnumerable、IList、IDictionary等。 Empty、Range、Repeat 这些生成操作符返回一个心机和。使用Empty时集合是空的;Range返回一系列数字;Repeat返回一个始终重复一个值的集合。

设置案例背景

  假设我们有4个类,Customer,Order,Detail,Product,它们的定义如下:

Customer类字段 字段类型 CustomerID int Country string Name string City string Orders List<Order> Order类字段 字段类型 OrderID int CustomerID int Total int OrderDate DateTime Details List<Detail> Detail类字段 字段类型 DetailID int OrderID int UnitPrice double Quantity double ProductID int Product类字段 字段类型 ProductID int ProductName string

  假设现在它们各自有一个List集合,分别为Customers,Orders,Details,Products。我们在这基础之上来一步步阐述LINQ查询表达式。
  customers数据:

CustomerID City Country Name Orders 0 北京 中国 小米 orders.FindAll(c => c.CustomerID == 0) 1 首尔 韩国 三星 orders.FindAll(c => c.CustomerID == 1) 2 加州 美国 苹果 orders.FindAll(c => c.CustomerID == 2) 3 台北 中国 HTC orders.FindAll(c => c.CustomerID == 3) 4 珠海 中国 魅族 orders.FindAll(c => c.CustomerID == 4) 5 北京 中国 华为 orders.FindAll(c => c.CustomerID == 5) 6 上海 中国 索尼 orders.FindAll(c => c.CustomerID == 6) 7 北京 中国 联想 orders.FindAll(c => c.CustomerID == 7) 8 上海 中国 诺基亚 orders.FindAll(c => c.CustomerID == 8)

  
  orders数据:

OrderID CustomerID OrderDate Details 0 0 DateTime.Now details.FindAll(d => d.OrderID == 0) 1 0 DateTime.Now details.FindAll(d => d.OrderID == 1) 2 1 DateTime.Now details.FindAll(d => d.OrderID == 2) 3 1 DateTime.Now details.FindAll(d => d.OrderID == 3) 4 2 DateTime.Now details.FindAll(d => d.OrderID == 4) 5 2 DateTime.Now details.FindAll(d => d.OrderID == 5) 6 3 DateTime.Now details.FindAll(d => d.OrderID == 6) 7 3 DateTime.Now details.FindAll(d => d.OrderID == 7) 8 4 DateTime.Now details.FindAll(d => d.OrderID == 8) 9 5 DateTime.Now details.FindAll(d => d.OrderID == 9) 10 6 DateTime.Now details.FindAll(d => d.OrderID == 10) 11 6 DateTime.Now details.FindAll(d => d.OrderID == 11) 12 7 DateTime.Now details.FindAll(d => d.OrderID == 12) 13 7 DateTime.Now details.FindAll(d => d.OrderID == 13) 14 8 DateTime.Now details.FindAll(d => d.OrderID == 14) 15 8 DateTime.Now details.FindAll(d => d.OrderID == 15) 16 8 DateTime.Now details.FindAll(d => d.OrderID == 16)

  
  details数据:

DetailID OrderID ProductID Quantity UnitPrice 0 0 0 1000 10 1 1 1 2134 8 2 2 1 1236 9 3 3 0 754 7 4 4 2 2354 12 5 5 0 6985 13 6 6 2 4213 10 7 7 3 1977 10 8 8 2 287 6 9 9 5 9778 12 10 10 4 854 11 11 11 2 756 10 12 12 3 1000 9 13 13 1 786 8 14 14 3 346 7 15 15 2 576 6 16 16 0 782 10

  
  products数据:

ProductID ProductName 0 samsung 1 nokia 2 apple 3 xiaomi 4 huawei 5 lenovo

Demo查询表达式

条件筛选

  使用where子句,可以按照一个或者多个条件筛选集合,where子句的表达式的结果类型应该是布尔类型。
  筛选在北京且名称以‘小’开头的顾客。

var query = from c in customers            where c.City == "北京" && c.Name.StartsWith("小")            select c;foreach (Customer item in query){    Console.WriteLine(item.Name + "\t\t" + item.City);}Console.ReadKey();

  该LINQ查询会返回在北京而且名字以“小”开头的Customer集合。
  输出结果:
  这里写图片描述
  

复合from子句筛选

  当需要根绝对象的一个成员进行筛选,而该成员本身是一个集合或者列表,就可以使用复合的from子句。
  筛选订单数量大于800的信息。

var query = from c in customers            from o in c.Orders            from d in o.Details            where d.Quantity > 800            select new { Name = c.Name, Total = d.UnitPrice * d.Quantity };foreach (var item in query){    Console.WriteLine(item.Name + "\t\t" + item.Total);}Console.ReadKey();

  输出结果:
  这里写图片描述
  

排序

  要对序列排序,需要使用orderby子句。
  按照城市、顾客ID进行排序。 

var query = from c in customers            from o in c.Orders            orderby c.City, o.CustomerID            select new { Name = c.Name, City = c.City, OrderID = o.OrderID };foreach (var item in query){    Console.WriteLine(item.Name + "\t\t" + item.City + "\t\t" + item.OrderID);}Console.ReadKey();

  输出结果:
  这里写图片描述
    

分组

  要根木一个关键值对查询结果分组,可以使用group子句。
  统计各个产品的订单数量。  

var query = from d in details            group d by d.ProductID into g            orderby g.Count(), g.Key            select new { Name = g.Key, Count = g.Count() };Console.WriteLine("ProductID"+ "\t" + "Count");foreach (var item in query){    Console.WriteLine(item.Name + "\t\t" + item.Count);}Console.ReadKey();

  输出结果:
  这里写图片描述
  

对嵌套的对象分组

  如果分组的对象包含嵌套的序列,则各个改变select子句创建的匿名类型。
  统计各个产品的订单数量,并输出各个订单的订货数量。

var query = from d in details            group d by d.ProductID into g            orderby g.Count(), g.Key            select new            {                Name = g.Key,                Count = g.Count(),                Quantity =  from d in g                            orderby d.Quantity                            select d.Quantity            };Console.WriteLine("ProductID"+"\t"+"Count"+"\t"+"Quantity");foreach (var item in query){    Console.Write(item.Name + "\t\t" + item.Count+"\t");    foreach (var quantity in item.Quantity)    {        Console.Write("{0};", quantity);    }    Console.WriteLine();}Console.ReadKey();

  输出结果:
  这里写图片描述
  

连接

  使用join子句可以根据特定的条件合并两个数据源,但之前要获得两个要连接的列表。
  统计各个顾客和其订单的信息。

var query = from r in                from c in customers                from o in c.Orders                from d in o.Details                select new { Name = c.Name, City = c.City, Money = d.Quantity * d.UnitPrice, ProductID = d.ProductID }            join t in                from p in products                select p            on r.ProductID equals t.ProductID            select new { Name = r.Name, City = r.City, Money = r.Money, ProductName = t.ProductName };Console.WriteLine("Name" + "\t" + "City" + "\t" + "Money" + "\t" + "ProductName");foreach (var item in query){    Console.WriteLine(item.Name + "\t" + item.City + "\t" + item.Money + "\t" + item.ProductName);}Console.ReadKey();

  输出结果:
  这里写图片描述
    

聚合操作符

  聚合操作符(包括Count()、Sum()、Min()、Max()、Average()和Aggregate())它们不返回一个序列,而是返回一个值。
  Count()方法返回集合中的项数;Sum()方法汇总序列中所有数字,返回这些数字的和;Min()方法返回集合中的最小值;Max()方法返回集合中的最大值;Average()方法计算集合中的平均值;Aggregate()方法,可以传递一个Lambda表达式,该表达式对所有的值进行聚合。
  这些方法的使用方式类似,都是直接对序列或者集合进行操作。下面用Sum()做一个示例:
  统计各个顾客总共订单的订货数量。

var query = from r in                from c in customers                select new                {                    Name = c.Name,                    OrderCount = (  from o in c.Orders                                    from d in o.Details                                    select d.Quantity).Sum()                }            orderby r.OrderCount            select r;

  输出结果:
  这里写图片描述

使用扩展方法和Lambda表达式简化LINQ查询

什么是扩展方法

  当方法的第一个形参包含this修饰符的时候,该方法称为扩展方法。扩展方法只能在非泛型、非嵌套的静态类中声明,扩展方法的第一个形参不能带有除this之外的其他任何修饰符,而且形参类型不能是指针类型。
  下面的程序是一个扩展方法的示例:

public static class Extensions{    public static void HelloWorld(this string str)    {        Console.WriteLine("{0} 调用了:HellWorld",str);    }}

  现在就可以调用该方法了:

string str="Jay";str.HelloWorld();

  我们可以看到,控制台中输出了“Jay 调用了:HelloWorld”。
  之所以这样,是因为HelloWorld第一个参数类型为string类型,因此该方法就是string类型的扩展方法,所有的string类型变量都可以调用,而变量的内容就是传递给HelloWorld的参数。
  上面的程序和下面的代码结果一样:

string str = "Jay";Extensions.HelloWorld(str);

LINQ扩展方法

  LINQ为IEnumerable<T>接口提供了各种扩展方法,以便用户在实现了该接口的任意集合上使用LINQ查询。表1中列出的LINQ查询操作符,都有相应的扩展方法实现。
  使用扩展方法可以和使用LINQ查询表达式获得十分类似甚至是相同的结果,当扩展方法和Lambda表达式结合的时候,会大大简化LINQ查询。
  

简化LINQ查询

  前面一节的条件筛选LINQ表达式可以简化为:

var query = customers.Where(c => c.City == "北京" && c.Name.StartsWith("小")).Select(c => c);

  
  前面一节的条件复合from子句筛选LINQ表达式可以简化为:

var query = customers.SelectMany(c => c.Orders, (c, o) => new { _customer = c, _order = o, _detail = o.Details }).SelectMany(a => a._detail, (a, b) => new { _var = a, Total = b.Quantity * b.UnitPrice, Quantity = b.Quantity }).Where(_nameless => _nameless.Quantity > 800).Select(_annonymous => new { Name = _annonymous._var._customer.Name, Total = _annonymous.Total });

  
  前面一节的排序LINQ表达式可以简化为:

var query = customers.SelectMany(c => c.Orders, (c, o) => new { _customer = c, _order = o }).OrderBy(_var => _var._customer.City).ThenBy(_var => _var._order.CustomerID).Select(_annonymous => new { Name = _annonymous._customer.Name, City = _annonymous._customer.City, OrderID = _annonymous._order.OrderID });

  
  前面一节的分组LINQ表达式可以简化为:

var query = details.GroupBy(d => d.ProductID).OrderBy(g => g.Count()).ThenBy(g => g.Key).Select(g => new { Name = g.Key, Count = g.Count() });

  
  前面一节的对嵌套的对象分组LINQ表达式可以简化为:

var query = details.GroupBy(d => d.ProductID).OrderBy(g => g.Count()).ThenBy(g => g.Key).Select(_var => new { Name = _var.Key, Count = _var.Count(), Quantity = _var.OrderBy(d => d.Quantity).Select(d => d.Quantity) });

  前面一节的连接LINQ表达式可以简化为:

var query = customers.SelectMany(c => c.Orders, (c, o) => new { Name = c.Name, City = c.City, Details = o.Details }).SelectMany(_var => _var.Details, (_var, _detail) => new { Name = _var.Name, City = _var.City, Money = _detail.Quantity * _detail.UnitPrice, ProductID = _detail.ProductID }).Join(products, a => a.ProductID, b => b.ProductID, (a, b) => new { Name = a.Name, City = a.City, Money = a.Money, ProductName = b.ProductName });

  
  前面一节的聚合操作LINQ表达式可以简化为:

var query = customers.Select(c => new { Name = c.Name, OrderCount = c.Orders.SelectMany(o => o.Details, (o, d) => new { _Quantity = d.Quantity }).Select(_var => _var._Quantity).Sum() }).OrderBy(_var => _var.OrderCount);

  以上利用扩展方法和Lambda表达式的简化后的LINQ查询代码的查询结果,与LINQ查询表达式结果完全一样,证明这样是完全可行的。
  唯一的问题就是代码看起来比较费解了。

LINQ查询表达式简化转换原则

  看到这里我们可能要奇怪,为什么我们能用这样的方式来简化LINQ查询表达式呢?
  关于这个问题,我们将在下一篇文章进行详细讲解。
  欢迎大家点击阅读。
  本人还是菜鸟,写的不对的地方还请各位不吝赐教!

0 0
原创粉丝点击