简介
地址 https://github.com/firebroo/UnixTools/tree/master/uniq
可能有造轮子的嫌疑,去重思想就是借鉴的 awk '!a[$0]++{print}',但是极端情况还是有用的,自己测试当文本超大的时候,速度上可以比 awk 高两倍左右,时间在一个量级内当然这不是特别有用的,但是内存差不多也可以节约二倍左右,个人感觉这还是非常有用的,毕竟内存还是毕竟宝贵的,各位顺便看看还有没有可以优化的余地?
优点
- 根据需求精简了 hashtable 里的 hash 节点的结构体,hash 节点里面只保存 key 和为了解决 hash 冲突的指针,节约内存;
- 根据文本行数调整 hashtable.h 的 HASH_TABLE_MAX_SIZE,减少 rehash 次数,有利于加快去重速度;
