大语言模型训练请教 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
cookgo

大语言模型训练请教

  •  
  •   cookgo 2024 年 2 月 23 日 2279 次点击
    这是一个创建于 790 天前的主题,其中的信息可能已经有所发展或是发生改变。
    • 各位佬,小弟我想训练一个对话机器人,其功能为:
      • 根据用户遇到的场景提供法律咨询。
    • 比如能达到这样的效果:
      • 自己买的商品楼烂尾了,把内容丢给机器人,机器人能提供为消费者进行维权的相关法律条款的介绍。
    • 请问这个要如何入手?提前谢谢各位佬。
    8 条回复    2024-02-28 09:38:45 +08:00
    makejohn2015
        1
    makejohn2015  
       2024 年 2 月 23 日   1
    不用从零开始找数据训练,可以找网上现有的法律对话、问答的东西,写个脚本疯狂问,用来训练你的“机器人”,知识蒸馏。
    sentinelK
        2
    sentinelK  
       2024 年 2 月 23 日   2
    有几个问题需要先明确。

    1 、是从 0 开始模型训练?还是模型微调?还是只是注入上下文信息?
    2 、对信息的准确度要求如何?
    3 、你想付出多少成本?
    cmos
        3
    cmos  
       2024 年 2 月 23 日 via Android   1
    1. 不管什么方法,弄到至少 100G 的法律资料。
    2. 找 3-5 个 5 年以上经验,不同方向的律师,让他们把上述内容分类整理。
    3. 买至少 4 张 H100 以上的卡,初期可以在 llama2 的基础上,使用 LoRA 进行微调。后期至少需要 3 台英伟达 DGX 服务器。
    4. 找至少 20 位律师(不要求经验),对输出进行 ground truth 核对。
    vivisidea
        4
    vivisidea  
       2024 年 2 月 23 日   1
    你是否在找 https://github.com/PKU-YuanGroup/ChatLaw?tab=readme-ov-file

    自己搞投入有点大的,我是建议用业界最强 gpt4 试试
    mU9vX912XopmAoE1
        5
    mU9vX912XopmAoE1  
       2024 年 2 月 23 日   1
    现在的 AI ,无论中外,只要能搜互联网的,都可以满足你的要求

    你自己试试就知道了

    官方的,税务总局的机器人客服有类似的功能,通过关键词会触发对应的条例和具体条款

    其他部门的没碰到过
    Alias4ck
        6
    Alias4ck  
       2024 年 2 月 23 日   2
    阿里有一个法律的 通义法睿 https://tongyi.aliyun.com/farui/chat
    cookgo
        7
    cookgo  
    OP
       2024 年 2 月 28 日
    @makejohn2015 这种方式是指的《模型微调》吗?
    cookgo
        8
    cookgo  
    OP
       2024 年 2 月 28 日
    @sentinelK 对信息的准确要尽可能的高,因此应该是要从 0 开始训练模型了吧
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5409 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 75ms UTC 06:43 PVG 14:43 LAX 23:43 JFK 02:43
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86