业务型后端程序员如何入门大语言模型? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
xiaokangz
V2EX    职场话题

业务型后端程序员如何入门大语言模型?

  •  
  •   xiaokangz 2024-09-05 11:02:37 +08:00 1997 次点击
    这是一个创建于 450 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我是一名.NET 后端程序员,目前主要从事企业管理系统开发。
    不过最近接到一个需求,要做一个 ChatBot ,主要目的是回答用户针对系统操作方面的问题,答案主要来自于用户手册。

    我就想了解下,作为后端程序员(没有任何 AI 经验)要怎么入门大语言模型?比如搭建一个 ChatBot 大概需要哪些步骤之类的,主要希望对大语言模型有一个整体的理解。

    另外,看到了这篇文章 https://botpress.com/blog/open-source-chatbots ,给我的感觉这些开源项目都只是个前端,需要配合后端的 NLU 和 LLM 使用。不知道这样理解对不对?
    5 条回复    2025-03-27 18:31:28 +08:00
    dododada
        1
    dododada  
       2024-09-05 11:14:17 +08:00
    有个基于 streamlit 做的 langchain-chatchat ,搭起来跑一下看看,其实就是调接口,调整 prompt, 现在连调参都不要了,但是本地跑有些吃资源
    xiaokangz
        2
    xiaokangz  
    OP
       2024-09-05 15:10:48 +08:00 via iPhone
    @dododada 感谢回复,我先研究研究
    xiaokangz
        3
    xiaokangz  
    OP
       360 天前 via iPhone   1
    回复下自己的帖子吧,分享下自己做这个项目的经历,说不定对跟我一样懵的小伙伴有点帮助。

    起初,我以为要通过微调来实现,但搞了几天后,发现根本搞不起来,一来没有机器,二来也没有数据。后来有一个同事提到说,可以用 RAG 实现。当时我还没听过这个词,于是换了换思路,发现市面上已经有很多现成的工具,比如 MaxDB 、AnythingLLM 之类的,而且使用下来发现效果还过得去。于是就开始尝试理解 RAG (检索增强生成)的工作原理。就这样,一边学一边做,最后把整个流程跑通了。

    现在看来 RAG 无非就是让大模型做阅读理解,唯一的难点是如何提升检索内容的相关性与准确性,这是提升大模型回答质量的关键。

    在深入研究之后,发现传统的 RAG 更适合回答那些知识库已经有明确答案的问题,比如如何创建一个用户,这类问题通常手册里已经给出了明确答案。但诸如“这本书大致讲了一个什么样的故事?”之类的全局性问题,传统 RAG 无能为力。此时可以考虑使用 LightRAG ,或者 GraphRAG 。
    chixinzei
        4
    chixinzei  
       247 天前
    咨询下 up 最终用了哪个开源或者收费的 RAG ?搭配了什么 LLM 呢(本地部署还是三方收费)?
    xiaokangz
        5
    xiaokangz  
    OP
       247 天前 via iPhone   1
    @chixinzei 基于 Langchain 自己开发的 RAG ,对比了多个开源模型,最终选择了 GPT-4o 作为 LLM ,text-embedding-3-large 作为 embed model 。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     937 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 21ms UTC 23:26 PVG 07:26 LAX 15:26 JFK 18:26
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86