问个机器学习问题,卷积神经网络的通道数是怎么定的? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
maxxfire
V2EX    程序员

问个机器学习问题,卷积神经网络的通道数是怎么定的?

  •  
  •   maxxfire 2020-08-05 10:59:57 +08:00 3373 次点击
    这是一个创建于 1900 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如 LeNet 网络,它的通道数是为何这样设计的,有什么依据?
    比如:
    1. 第一层卷积层的通道为何是 6,按道理图片也就 RGB 三个通道。
    2. 第二层卷积层的通道又是 16,这个依据是什么?
    3. 在用 mxnet 实现时,卷积核的具体数字定义在何处,比如图像边缘检测,它的卷积核是:
    [-1, 0, 1]
    [-2, 0, 2]
    [-1, 0, 1]
    有很多核,有些核用来做边缘检测,有些核用来做高斯模糊。具体可参考: https://blog.csdn.net/chaipp0607/article/details/72236892
    但在具体 mxnet 代码中,却未找到这些核的定义。
    13 条回复    2020-08-05 15:48:09 +08:00
    mscb
        1
    mscb  
       2020-08-05 11:19:19 +08:00 via Android
    当然是炼丹练出来的呀!炼丹师这个俗称可不是开玩笑的,哈哈哈哈,手动
    maxxfire
        2
    maxxfire  
    OP
       2020-08-05 11:30:14 +08:00
    @mscb 啊哈哈,还真有点形象,不过其网络结构一开始就定好了,这就是厉害之处了
    jingous
        3
    jingous  
       2020-08-05 11:36:42 +08:00
    随便定的。默认的分辨率降低一倍,通道数增加一倍。除开始几层外,通道一般都是 2 的 N 次方
    jmc891205
        4
    jmc891205  
       2020-08-05 11:54:11 +08:00 via iPhone
    这属于 hyperparameter
    也要调的
    jimliang
        5
    jimliang  
       2020-08-05 11:58:19 +08:00
    不断调参后的相对最优解
    labnotok
        6
    labnotok  
       2020-08-05 12:31:33 +08:00
    深度学习的意义就是把特征的提取从手工的构建中解放出来,filter 是由数据和网络的训练决定的,自然不会出现功能确定的 filter 。而且你也很难在某个 filter train 完之后明确说它的作用是什么。filter 与其说是 convolution,直接理解成使用 cross-correlation 层次化提取特征会清晰很多。


    运算上讲,channel 数是由上一层 filter 的个数决定的,而不是数据的维度。而你选择多少 filter 是个玄学的问题,稍微有点依据的说法是考虑你 GPU 的 CUDA 数和显存数据宽度,提高运算效率。
    xiri
        7
    xiri  
       2020-08-05 12:56:07 +08:00
    这东西就是随便猜(可能会有一点经验在里面),不断试错,最后选出一个最优的
    nightwitch
        8
    nightwitch  
       2020-08-05 13:03:34 +08:00
    channel 算是中等重要程度的超参数吧,直观的理解就是你想要把你的数据投影到多少维度的空间。没啥特定的规则,一般靠近原始输入的地方 channel 数逐渐增加,从低维空间升到高维,然后接近输出的的地方逐渐减少到 1 维输出,网络中可能有多个 1x1xchannel 的操作来调整通道数。
    maxxfire
        9
    maxxfire  
    OP
       2020-08-05 13:46:15 +08:00
    @labnotok 软件和数学都是严谨的,像这种玄学的东西我学不来
    VDimos
        10
    VDimos  
       2020-08-05 13:57:49 +08:00 via Android
    炼丹就是要试的
    realcaoqi95
        11
    realcaoqi95  
       2020-08-05 15:02:47 +08:00
    玄学问题
    superlc
        12
    superlc  
       2020-08-05 15:19:27 +08:00 via iPhone
    一个 hyperparameter 而已
    肯定是越多越好,参数越多能学到的信息量越大。不过一般来讲只要 filter 数够用了,再增加的话对性能的提升也十分有限,所以最终是一个参数量与资源消耗的权衡

    和传统算法里面的各种 threshold 差不多,说白了就是在满足要求的前提下随便选的
    IanPeverell
        13
    IanPeverell  
       2020-08-05 15:48:09 +08:00
    第一层 6 是经验值,并不是根据 RGB 而来的。意思是,在对输入提取特征值时,获取 6 种特质,然后再进行组合最后训练出来的效果、模型的性能等是最佳的。第二层的 16,是对 6 种特征进行组合得到的。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2801 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 07:08 PVG 15:08 LAX 00:08 JFK 03:08
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86