求教, Mysql group by 后对分组数据的处理问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
MySQL 5.5 Community Server
MySQL 5.6 Community Server
Percona Configuration Wizard
XtraBackup 搭建主从复制
Great Sites on MySQL
Percona
MySQL Performance Blog
Severalnines
推荐管理工具
Sequel Pro
phpMyAdmin
推荐书目
MySQL Cookbook
MySQL 相关项目
MariaDB
Drizzle
参考文档
http://mysql-python.sourceforge.net/MySQLdb.html
sorcerer
V2EX    MySQL

求教, Mysql group by 后对分组数据的处理问题

  •  
  •   sorcerer 2017-02-13 22:09:04 +08:00 6010 次点击
    这是一个创建于 3237 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有这样一个表

    |id |col1|col2|col3|col4| |---|----|----|--- |----| | 1 | 1 | 1 | 1 | 1 | | 2 | 1 | 1 | 1 | 2 | | 3 | 1 | 1 | 1 | 1 | | 4 | 1 | 1 | 2 | 1 | | 5 | 1 | 1 | 2 | 2 | | 6 | 1 | 2 | 1 | 1 | | 7 | 1 | 2 | 1 | 1 | | 8 | 1 | 3 | 2 | 2 | | 9 | 1 | 3 | 2 | 2 | 

    现在我需要按 col1 和 col2 对表进行分组,然后对每个分组进行统计,统计 col3=1,col4 不重复值的数量 ps:count(distinct(col4)), 统计 col3=2 , col4 值的数量 ps:count(col4)

    即结果为

    |id |col1|col2|distinct(col4)|count(col4)| |---|----|----|--------------|-----------| | 1 | 1 | 1 | 2 | 2 | | 2 | 1 | 2 | 1 | 0 | | 3 | 1 | 3 | 0 | 2 | 

    想了很久都没搞出来=。=只能厚着脸皮来这里请教了。

    18 条回复    2017-02-14 17:27:37 +08:00
    yangqi
        1
    yangqi  
       2017-02-13 22:19:57 +08:00   1
    你这什么意思,逻辑有问题吧?第一行 count(col4)难道不是 5 么, distinct(col4)实际上是 count(distinct(col4))?
    sorcerer
        2
    sorcerer  
    OP
       2017-02-13 22:25:32 +08:00
    @yangqi 是 count(distinct(col4)),我写错了,而且还要和 col3 的值要有联系....
    yangqi
        3
    yangqi  
       2017-02-13 22:41:23 +08:00   1
    @sorcerer 那你第三列 distinct(col4)又是什么?
    sorcerer
        4
    sorcerer  
    OP
       2017-02-13 22:44:48 +08:00 via iPhone
    @yangqi 第三列是统计 col3=1,col4 不重复值的数量 ps:count(distinct(col4)) 第四列是统计 col3=2 , col4 值的数量 ps:count(col4)
    yangqi
        5
    yangqi  
       2017-02-13 22:49:03 +08:00   1
    @sorcerer 这个统计不可能用一个简单查询做的,肯定要子查询然后用到 IF()判断了。
    sorcerer
        6
    sorcerer  
    OP
       2017-02-14 08:37:12 +08:00 via iPhone
    @yangqi 不好意思,昨晚睡了没看到,用子查询应该怎么写呢,我需要对 col1 和 col2 进行分组统计,所以 group by 肯定要的
    ebony0319
        7
    ebony0319  
       2017-02-14 09:02:53 +08:00   1
    分组后就不存在什么 ID 了把,就是一个集合的概念了。还有就是 where 过滤不是应该在之前么。
    sorcerer
        8
    sorcerer  
    OP
       2017-02-14 09:08:07 +08:00 via iPhone
    @ebony0319 只要按那种格式显示出来就可以了, id 那一列去掉吧......
    /td>
    sorcerer
        9
    sorcerer  
    OP
       2017-02-14 09:10:14 +08:00 via iPhone
    @ebony0319 我想对分组后的数据再进行条件筛选 有可能实现吗
    staticor
        10
    staticor  
       2017-02-14 10:03:32 +08:00   1
    试试这样的逻辑 count(distinct if(col3=2, col4, null))
    sorcerer
        11
    sorcerer  
    OP
       2017-02-14 10:39:42 +08:00 via iPhone
    谢谢 这正是我想要的,不过怎样才能 if 中 distinct 两列呢,我尝试了一下 count(distinct if(col3=2,(col4,col5),null)) 好像不行
    staticor
        12
    staticor  
       2017-02-14 12:25:17 +08:00   1
    @sorcerer concat 两列 得到一个辅助列?
    ebony0319
        13
    ebony0319  
       2017-02-14 13:19:17 +08:00
    你的 col1 , col2 聚合的时候 col3 , col4 怎么办?我想看一下原需求是什么.
    sorcerer
        14
    sorcerer  
    OP
       2017-02-14 13:49:43 +08:00 via iPhone
    @ebony0319 比如说 col3 代表一个账号的状态, col4 姓名, col5 是电话号码,现在我聚合后,想要统计 col3 等于 1 ,即激活状态下 col4 和 col5 两列不重复的账号数量,以及 col3 等于 2 ,即非激活状态下,账号的数量(这个不需要去重)
    CRVV
        15
    CRVV  
       2017-02-14 15:06:41 +08:00   2
    按照 staticor 的提示

    SELECT
    col1,
    col2,
    count(DISTINCT if(col3 = 1, col4, NULL)), count(if(col3 = 2, col4, NULL))
    FROM table
    GROUP BY col1, col2
    ORDER BY col2;

    就得到了原文里的结果
    sorcerer
        16
    sorcerer  
    OP
       2017-02-14 15:21:47 +08:00 via iPhone
    @CRVV 嗯 这样是可以,但是 distinct 两列就不行了,试过 concat 函数 貌似不行 count(distinct (if(col3=1,concat(col4,col5),null)))......
    ebony0319
        17
    ebony0319  
       2017-02-14 17:21:13 +08:00   1
    我看懂了。给你结果你可能要吐血了。其实很简单。
    首先选出不重复且激活状态的数据,然后聚合就好了。
    SELECT
    col1, col2, col4, COUNT(col4)
    FROM
    (SELECT DISTINCT
    col1, col2, col3, col4
    FROM
    temp
    WHERE
    col3 = 1) T
    GROUP BY col1 , col2

    http://ww1.sinaimg.cn/large/af912ab4gy1fcq4du1bwgj20ak0ab0sr
    ebony0319
        18
    ebony0319  
       2017-02-14 17:27:37 +08:00
    微博图床挂了?图片是那个结果,你按照我的思路来应该没错的。 ww1.sinaimg.cn/large/af912ab4gy1fcq4du1bwgj20ak0ab0sr
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5433 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 33ms UTC 02:36 PVG 10:36 LAX 18:36 JFK 21:36
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86