1.75 万亿个参数?这是不是就有点离谱,这就是未来人工智能的发展方向吗? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Raven316
V2EX    分享发现

1.75 万亿个参数?这是不是就有点离谱,这就是未来人工智能的发展方向吗?

  •  
  •   Raven316 2021-06-01 17:12:58 +08:00 4246 次点击
    这是一个创建于 1673 天前的主题,其中的信息可能已经有所发展或是发生改变。

    理论没啥大突破,就硬堆参数和算力呗。

    https://mp.weixin.qq.com/s/iziwgtHTpZO-f1eZbx3pJQ

    20 条回复    2021-06-03 15:08:25 +08:00
    statement
        1
    statement  
       2021-06-01 17:26:50 +08:00
    多核就不是技术了?
    Raven316
        2
    Raven316  
    OP
       2021-06-01 17:41:59 +08:00
    @statement 算什么技术,就这么大个模型,他能达到高中毕业生的数学水平吗?
    wateryessence
        3
    wateryessence  
       2021-06-01 17:47:51 +08:00
    @Raven316 老哥是做相关方向的吗,这么暴躁

    超大模型只能说是一个探索方向,谷歌那篇文章更侧重再讲在超大模型里针对不同任务的优化手段
    kop1989
        4
    kop1989  
       2021-06-01 17:50:48 +08:00
    目前的 AI 依然是“统计学”范畴。
    “机器学习”、“神经网络”都是统计学最终落地的算法方式。
    此文中提出的“超大模型”也是一种。

    他们的最终目的都是高效的总结出既有数据的最优解或局部最优解。
    kop1989
        5
    kop1989  
       2021-06-01 17:52:35 +08:00   1
    换句话说,目前的 AI,依然是“举三反一”,而不是“举一反三”。
    villivateur
        6
    villivateur  
       2021-06-01 17:52:49 +08:00 via Android   2
    我不知道楼主是不是学相关方向的,但就我来讲的话,我对自己不熟悉的领域,是抱有敬畏之心的
    Raven316
        7
    Raven316 
    OP
       2021-06-01 19:50:09 +08:00
    @villivateur 你看他文章里说了的吗?

    “悟道 2.0”不仅仅是个语言模型,它是一个全能选手,一统文本和视觉两大领域,在问答、绘画、作诗、视频等任务中正在逼近图灵测试。

    他这个模型,能写出 50 万字的连贯的前后一致,没有矛盾,没有 bug,有整体逻辑和架构感的小说?现在 nlp 写的小说,超过几千字就没有任何逻辑可言了,在这吹接近图灵测试,我真的笑了。
    lxiian
        8
    lxiian  
       2021-06-01 19:50:13 +08:00 via Android
    同意楼上↑
    lxiian
        9
    lxiian  
       2021-06-01 19:51:33 +08:00 via Android
    怎么和楼主同一时间回复了。。。。。同意楼上不是楼主那一层。。。是同意 6 楼
    mxT52CRuqR6o5
        10
    mxT52CRuqR6o5  
       2021-06-01 20:04:52 +08:00   1
    你们就已经预设楼主不懂 AI 领域了,没有敬畏之心
    我也没太明白现阶段搞个全能 AI 是想干嘛
    GeruzoniAnsasu
        11
    GeruzoniAnsasu  
       2021-06-01 20:26:07 +08:00 via Android
    我不懂 AI 算法怎么算

    但我知道 CNN 的核心思路是找到提取特征的方法降低参数量,而深层神经网络能帮助拟合出有效特征。


    那由此即可以推广:
    1. 神经网络的作用就是自动寻找样本的特征提取方式
    2. 基于类似神经网络结构的“AI”,原理必定是特征提取+统计回归。起码“判定网络”必定如此。
    3. 目前还没看到突破性的新“生成网络”技术手段,因此现阶段所有的生成网络必定要由 2 所述的判定网络进行约束。
    4. 人类创新能力的本质特征就是能够突破经验框架或历史模式。
    5. 综上,现有结构的“AI” 与 4 矛盾,因此永远无法完成类人的创造性事务



    其实讲个笑话,艺术创作往往是在试探人类逻辑的边界,比如人们能不能欣赏无调式音乐,能不能感受色块代表的光影,能不能接受最恶最善的社会属性共存。不会有人指望人们能搞出一个“能搞出自己认知边界外的东西”吧?
    worryfree
        12
    worryfree  
       2021-06-01 20:28:51 +08:00 via iPhone
    @Raven316 那你造啊,怎么天天论坛僵的人那么多
    johnsona
        13
    johnsona  
       2021-06-01 20:32:24 +08:00 via iPhone
    @kop1989 还是统计的思路 深度学习中的很多技术是工程上技术 比如随机梯度下降
    love
        14
    love  
       2021-06-01 21:06:07 +08:00
    现在的 AI 和大家认识中的真正的 AI 完全不是一个东西,离真 AI 一步都没走出过,没什么好比较的
    zagfai
        15
    zagfai  
       2021-06-01 23:18:30 +08:00
    参数这么多为什么没有过拟合?
    ignor
        16
    ignor  
       2021-06-02 00:18:20 +08:00 via Android
    面向经费编程罢了
    Trim21
        17
    Trim21  
       2021-06-02 08:44:02 +08:00 via Android
    图灵测试有个具体标准吗,比如问多少个问题之类的。

    不过一个语言模型要啥高中毕业生数学能力啊
    InvincibleDream
        18
    InvincibleDream  
       2021-06-02 18:00:38 +08:00
    @GeruzoniAnsasu 不严格的来讲神经网络定义了一类函数空间,特定的结构和参数可以从中划分出子空间使得其映射满足一定的约束,把这些约束简单分为特征提取及统计回归可能不够充分。经验框架或历史模式的突破能否在神经网络这类函数空间内求解还不是很清楚。
    namelosw
        19
    namelosw  
       2021-06-03 03:07:14 +08:00
    这种类似 GPT3 的大模型在做很多事情很有用,比如发垃圾公众号,按口述要求写代码供程序员校对,自动生成 WordPress 预售网站之类的。

    虽然不是大家期望的 AI,也不是真的有思想和智能。

    但是假如放出来每个人都能随便用的话,会对世界造成巨大影响。比如最直接的,搜索引擎有可能被垃圾信息打垮,因为每个人都可以把有版权的东西让 AI 「用自己的话抄袭一遍」,还可以整合和续写等等,这些东西还能应用在图像和视频上,之前还有一些自动生成动画和美工设计的应用。

    讲真,现在很多人写的公众号空洞得还不如机器写的,其中还有很多订阅量很高。
    wateryessence
        20
    wateryessence  
       2021-06-03 15:08:25 +08:00
    @zagfai 整合多个专家系统,对不同任务激活不同路径的思路
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3191 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 04:33 PVG 12:33 LAX 20:33 JFK 23:33
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86