【转】浅谈 sql 去重复数据
来源:互联网 发布:网络被限制不能玩游戏 编辑:程序博客网 时间:2024/06/07 05:13
关于sql去重,我简单谈一下自己的简介,如果各位有建议或有不明白的欢迎多多指出。
关于sql去重最常见的有两种方式:DISTINCT和ROW_NUMBER(),当然了ROW_NUMBER()除了去重还有很多其他比较重要的功能,一会我给大家简单说说我自己在实际中用到的。
假如有张UserInfo表,如下图:
现在我们要去掉完全重复的数据:SELECT DISTINCT * FROM dbo.UserInfo结果如下图:
但是现在有个新的需求,要把名字为‘张三'的去重,也就是相同名字的只要一条数据,要是还用DISTINCT的话就很麻烦了。想必聪明的你已经想到此时是ROW_NUMBER()登场的时候了吧。我们只需执行这样一句话就万事大吉了SELECT * FROM (SELECT ROW_NUMBER() OVER(PARTITION BY Name ORDER BY ID) AS RowId,* FROM dbo.UserInfo) x WHERE x.RowId=1;虽然看起来有点长,但是很容易理解。现在执行的结果如下图:
现在名字重复的数据只取了一条,而且是根据sql语句中的ORDER BY ID取的第一条,其中PARTITION BY后面跟的就是去重的字段,也许你想问为什么要加WHERE x.RowId=1呢,现在我们不加这个条件看看结果如何:SELECT * FROM (SELECT ROW_NUMBER() OVER(PARTITION BY Name ORDER BY ID) AS RowId,* FROM dbo.UserInfo) x,如下图:
现在我们已经看到,如果不加条件会把所有数据都查出来,所以RowId=1的数据就是去重后的数据;
ROW_NUMBER()除了可以去重还可以得到表的行号,现在我们只需一下语句:SELECT ROW_NUMBER() OVER(ORDER BY ID) AS RowNum,* FROM dbo.UserInfo,结果如下图:
得到了所有的数据,而且还得到了每条数据的行号,其中数据的顺序可以根据ORDER BY ID调节,也就是说不去重的话就不用加PARTITION BY Name了,此功能在分页中用的也比较多,假如每页15条数据,分页时直接加条件RowNum Between 1 AND 15就行了。
转自:http://www.jb51.net/article/53372.htm
个人实验结果:SELECT * FROM (SELECT ROW_NUMBER() OVER(PARTITION BY Name ORDER BY ID) AS RowId,* FROM dbo.UserInfo) x WHERE x.RowId=1 只适用SQL SERVER MySQL不适用因为MYSQL中不存在ROW_NUMBER()方法
- 【转】浅谈 sql 去重复数据
- SQL去重复数据
- sql去出重复数据
- sql server 去重复数据
- sql高效去重重复数据方法
- sql去重复
- sql去重复
- SQL去重复
- SQL去重复查询
- sql 去重复
- sql 去重复语句
- sql去重复
- Sql去重复记录
- sql去重复保留距离时间最近的一条数据
- Sql去重,比较两张表的重复数据
- 数据去重复
- 去重复数据
- 数据去重复
- Android下Json数据解析
- C++二叉树类实现
- spring中@Component @resource注解的说明
- 现代操作系统应用开发 win8初学
- 黑马程序员-javase-io(3)
- 【转】浅谈 sql 去重复数据
- codeforce 501场
- PYTHON内置数据类型( list ,tuple ,dict,set)
- 一个小项目中的Python中的性能优化细节——(下)其他的小细节,减少调用、if判断的顺序
- linux内核源码里的链表
- Java基础第九天--正则表达式
- 【来日复制粘贴】跨sheet的数据录入
- POJ 1979-Red and Black
- 无法解析或打开软件包的列表或是状态文件 解决方案