MySQL 实现行转列SQL

来源:互联网 发布:ps cs6 for mac 英文 编辑:程序博客网 时间:2024/06/05 01:51

概述

好久没写SQL语句,今天看到问答中的一个问题,拿来研究一下。

问题链接:关于Mysql 的分级输出问题

情景简介

学校里面记录成绩,每个人的选课不一样,而且以后会添加课程,所以不需要把所有课程当作列。数据表里面数据如下图,使用姓名+课程作为联合主键(有些需求可能不需要联合主键)。本文以MySQL为基础,其他数据库会有些许语法不同。

数据库表数据:


处理后的结果(行转列):


方法一:

这里可以使用Max,也可以使用Sum;

注意第二张图,当有学生的某科成绩缺失的时候,输出结果为Null; 

SELECTSNAME,MAX(CASE CNAMEWHEN 'JAVA' THENSCOREEND) JAVA,MAX(CASE CNAMEWHEN 'mysql' THENSCOREEND) mysqlFROMstdscoreGROUP BYSNAME;

可以在第一个Case中加入Else语句解决这个问题:

SELECTSNAME,MAX(CASE CNAMEWHEN 'JAVA' THENSCOREELSE0END) JAVA,MAX(CASE CNAMEWHEN 'mysql' THENSCOREELSE0END) mysqlFROMstdscoreGROUP BYSNAME;
方法二:

SELECT DISTINCT  a.sname,(SELECT score FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='JAVA' ) AS 'JAVA',(SELECT score FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='mysql' ) AS 'mysql'FROM stdscore a

方法三:

DROP PROCEDUREIF EXISTS sp_score;DELIMITER &&CREATE PROCEDURE sp_score ()BEGIN#课程名称DECLAREcname_n VARCHAR (20) ; #所有课程数量DECLAREcount INT ; #计数器DECLAREi INT DEFAULT 0 ; #拼接SQL字符串SET @s = 'SELECT sname' ;SET count = (SELECTCOUNT(DISTINCT cname)FROMstdscore) ;WHILE i < count DOSET cname_n = (SELECTcnameFROMstdscoreGROUP BY CNAME LIMIT i,1) ;SET @s = CONCAT(@s,', SUM(CASE cname WHEN ','\'',cname_n,'\'',' THEN score ELSE 0 END)',' AS ','\'',cname_n,'\'') ;SET i = i + 1 ;ENDWHILE ;SET @s = CONCAT(@s,' FROM stdscore GROUP BY sname') ; #用于调试#SELECT @s;PREPARE stmtFROM@s ; EXECUTE stmt ;END&&CALL sp_score () ;

处理后的结果(行转列)分级输出:




方法一:

这里可以使用Max,也可以使用Sum;

注意第二张图,当有学生的某科成绩缺失的时候,输出结果为Null; 

SELECTSNAME,MAX(CASE CNAMEWHEN 'JAVA' THEN(CASEWHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN'优秀'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN'良好'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN'普通'ELSE'较差'END)END) JAVA,MAX(CASE CNAMEWHEN 'mysql' THEN(CASEWHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN'优秀'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN'良好'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN'普通'ELSE'较差'END)END) mysqlFROMstdscoreGROUP BYSNAME;

方法二:

SELECT DISTINCT  a.sname,(SELECT (CASEWHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN'优秀'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN'良好'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN'普通'ELSE'较差'END) FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='JAVA' ) AS 'JAVA',(SELECT (CASEWHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN'优秀'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN'良好'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN'普通'ELSE'较差'END) FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='mysql' ) AS 'mysql'FROM stdscore a

方法三:

DROP PROCEDUREIF EXISTS sp_score;DELIMITER &&CREATE PROCEDURE sp_score ()BEGIN#课程名称DECLAREcname_n VARCHAR (20) ; #所有课程数量DECLAREcount INT ; #计数器DECLAREi INT DEFAULT 0 ; #拼接SQL字符串SET @s = 'SELECT sname' ;SET count = (SELECTCOUNT(DISTINCT cname)FROMstdscore) ;WHILE i < count DOSET cname_n = (SELECTcnameFROMstdscore        GROUP BY CNAME LIMIT i, 1) ;SET @s = CONCAT(@s,', MAX(CASE cname WHEN ','\'',cname_n,'\'',' THEN (CASEWHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') > 20 THEN\'优秀\'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') > 10 THEN\'良好\'WHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') >= 0 THEN\'普通\'ELSE\'较差\'END) END)',' AS ','\'',cname_n,'\'') ;SET i = i + 1 ;ENDWHILE ;SET @s = CONCAT(@s,' FROM stdscore GROUP BY sname') ; #用于调试#SELECT @s;PREPARE stmtFROM@s ; EXECUTE stmt ;END&&CALL sp_score ();

几种方法比较分析

第一种使用了分组,对每个课程分别处理。
第二种方法使用了表连接。
第三种使用了存储过程,实际上可以是第一种或第二种方法的动态化,先计算出所有课程的数量,然后对每个分组进行课程查询。这种方法的一个最大的好处是当新增了一门课程时,SQL语句不需要重写。

小结

关于行转列和列转行

这个概念似乎容易弄混,有人把行转列理解为列转行,有人把列转行理解为行转列;

这里做个定义:

行转列:把表中特定列(如本文中的:CNAME)的数据去重后做为列名(如查询结果行中的“Java,mysql”,处理后是做为列名输出);

列转行:可以说是行转列的反转,把表中特定列(如本文处理结果中的列名“JAVA,mysql”)做为每一行数据对应列“CNAME”的值;


关于效率

不知道有什么好的生成模拟数据的方法或工具,麻烦小伙伴推荐一下,抽空我做一下对比;


还有其它更好的方法吗?

本文使用的几种方法应该都有优化的空间,特别是使用存储过程的话会更加灵活,功能更强大;

本文的分级只是给出一种思路,分级的方法如果学生的成绩相差较小的话将失去意义;

如果小伙伴有更好的方法,还请不吝赐教,感激不尽!


有些需求可能不需要联合主键

有些需求可能不需要联合主键,因为一门课程可能允许学生考多次,取最好的一次成绩,或者取多次的平均成绩。


原文地址:http://blog.csdn.net/testcs_dn/article/details/49847299

0 0
原创粉丝点击