请教一个带“-”的文字编号排序问题 - V2EX
请不要在回答技术问题时复制粘贴 AI 生成的内容
glaucus

请教一个带“-”的文字编号排序问题

  •  1
     
  •   glaucus Apr 16, 2019 3076 views
    This topic created in 2595 days ago, the information mentioned may be changed or developed.

    有 N 条数据,每条数据有一个形如 1-1-2,10-3-1 ... 的编号,同时也可能有 3-2,5-8 这种的,请问对这些编号进行排序?有什么效率比较高的算法?

    26 replies    2019-04-17 21:12:20 +08:00
    0ZXYDDu796nVCFxq
        1
    0ZXYDDu796nVCFxq  
       Apr 16, 2019 via Android
    需求描述不准确,驳回重写需求
    RRRoger
        2
    RRRoger  
       Apr 16, 2019   2
    加字段辅助排序
    momocraft
        3
    momocraft  
       Apr 16, 2019
    别管效率,先想清楚你想要的排序结果
    msaionyc
        4
    msaionyc  
       Apr 16, 2019
    x-y-z 应该是 x-y 的子分支吧?如果是的话
    1.筛选出 x-y 结构的编号,建立基本结构( map,tree)
    2.筛选出 x-y-z 的编号,挂到步骤 1 下,并手写一个排序 y-z 的函数
    以上需要自己建立数据结构 or 类,保证可以构建合适的函数来对 x-y-z 这样的编号进行排序,比较大小。
    run2
        5
    run2  
       Apr 16, 2019   1
    我觉得你可以参考下 Semantic Versioning 的排序算法
    当然前面的是主要的排序只是我猜的
    glaucus
        6
    glaucus  
    OP
       Apr 16, 2019
    @gstqc #1
    @momocraft #3
    @msaionyc #4 是的,就是类似 Word 文档里的章节编号一样,是有分支关系的
    glaucus
        7
    glaucus  
    OP
       Apr 16, 2019
    @sobigfish #5
    @momocraft #3
    @RRRoger #2 当前的想法是先按最大位数把位数补齐,比如最长的是 3-2-1-1 就把其它的比如 3-2 补到 3-2-0-0,再把每一个数据的位数不起,比如 3-5-2 补成 03-05-02 (已确定每一个数字最多两位),然后把中间的“-”去掉解析成数字直接比较数字大小,但是感觉有点繁杂,不知道有没有更优雅的做法
    msaionyc
        8
    msaionyc  
       Apr 16, 2019
    比较数字的话,10,20 这类不好解决啊,对了,如果最大不超过 26,可以使用 a-z 进行映射然后字符串排序就可以解决了,如果再大的话就要采取其他手段了
    msaionyc
        9
    msaionyc  
       Apr 16, 2019   1
    编号很大的话,比如到几十,上百这种,建立树形结构也还算是比较好解决的
    Ukonwnothing
        10
    Ukonwnothing  
       Apr 16, 2019
    @msaionyc 好奇在 V2EX 中回复层主是层主增加铜币还是楼主增加铜币??
    qcts33
        11
    qcts33  
       Apr 16, 2019   1
    不知道题主用什么语言,我只是提一句 python 可以直接对比 list,不同长度都行……
    原理是逐位对比,直到出现不同,如果出现不同之前有一个序列结束了,短的小
    shench
        12
    shench  
       Apr 16, 2019   1
    php natsort 这个函数试一下
    VictorJing94
        13
    VictorJing94  
       Apr 16, 2019   1
    格式化,然后排序?
    thesharjah
        14
    thesharjah  
       Apr 16, 2019   1
    1. 如果分段数有限且每段内数字在一定范围内,可以考虑转换成 int 来排序;比如 1-1-2 => 001001002 => 1001002
    2. 如果不满足 1,php version_compare 函数试试,效率不确定,但实现简单
    rrfeng
        15
    rrfeng  
       Apr 16, 2019
    各种库都带接口啊,自己写一个 compare 不就行了吗?
    glaucus
        16
    glaucus  
    OP
       Apr 16, 2019
    @shench #12 试了一下,感觉挺符合需求的,正好用的 PHP,感谢
    @thesharjah #14 natsort 可行,version_compare 还没试
    @rrfeng #15 我就是在请教自己写 compare 的实现细节
    Lin0936
        17
    Lin0936  
       Apr 16, 2019
    mark 一下,之前也有这种需求,而且编号最大数是 5000+,总共十万多条,沿用了之前代码里的版本对比函数。等一个好点的方法。
    Doldrums
        18
    Doldrums  
       Apr 16, 2019
    在 sql 遇到的话我估计会这么操作
    1.统计“-”的数量 AS Level [例如 3-2-1:L2 3-2:L1]
    2.去除“-” trans 为纯数字 AS No. [例如 3-2-1:321 3-2:32]
    3.两列排序
    whileFalse
        19
    whileFalse  
       Apr 16, 2019
    对于 x-y-z,如果 x、y、z 均在 100 以内,则比较 x*10000 + y* 100 + z 即可。
    annielong
        20
    annielong  
       Apr 16, 2019
    数据库的话最好建辅助字段,如果数组的话解析后再排序
    AlisaDestiny
        21
    AlisaDestiny  
       Apr 16, 2019   1
    ```java
    public class Test {

    public static void main(String[] args) {
    new Test().test1();
    }
    public void test1(){
    ArrayList<String> list = new ArrayList<>();
    list.add("2-3");
    list.add("1-3-3");
    list.add("2");
    list.add("4-3-3-2");
    list.add("1-2-3");
    list.add("1");
    list.add("2-4");
    list.add("5-3-3");
    list.add("2-3-1");
    list.sort((o1, o2) -> {
    String[] s1 = o1.split("-");
    String[] s2 = o2.split("-");
    int mLen = Math.min(s1.length,s2.length);
    for(int i=0;i<mLen;i++){
    int a = Integer.parseInt(s1[i]);
    int b = Integer.parseInt(s2[i]);
    if (a != b){
    return a - b;
    }
    }
    return (s1.length - s2.length);
    });
    System.out.println(list);//[1, 1-2-3, 1-3-3, 2, 2-3, 2-3-1, 2-4, 4-3-3-2, 5-3-3]
    }
    }
    ```
    tantalu
        22
    tantalu  
       Apr 16, 2019
    都有数据范围的,果断桶排序
    wxb2dyj
        23
    wxb2dyj  
       Apr 17, 2019 via iPhone
    先去掉-,原下划线之间的数字不够两位的补齐为两位,然后桶排序,时间复杂度 O(n),排好序后再补-,去掉多余的 0
    wxb2dyj
        24
    wxb2dyj  
       Apr 17, 2019 via iPhone
    @wxb2dyj 说错了,应该用基数排序。
    no1xsyzy
        25
    no1xsyzy  
       Apr 17, 2019
    多维链表简单插排不就行了?
    要觉得这样效率不行链表部分换堆
    fsafdasfsdafsd
        26
    fsafdasfsafsd  
       Apr 17, 2019
    分隔,排序。
    About     Help     Advertise     Blog     API     FAQ     Solana     4314 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 70ms UTC 01:01 PVG 09:01 LAX 18:01 JFK 21:01
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86