LLM 翻译效果的问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wencan

LLM 翻译效果的问题

  •  
  •   wencan 2024 年 12 月 2 日 2369 次点击
    这是一个创建于 509 天前的主题,其中的信息可能已经有所发展或是发生改变。

    利用 ChatGPT 等做了不少翻译,资料带点学术成分。

    说下感受

    1. 翻译很依赖文化背景信息。LLM 中很多文化背景信息是缺失的。
    2. LLM 擅长常见的文本的翻译。应该是因为经过这些文本的充分训练。
    3. 文本中可能包含一些隐含的信息,比如字面意思和表达含义之间是有偏差的,这需要人类根据上下文去推测……这点 LLM 是无力的。
    4. agent 并不能弥补上面的缺陷。

    目前还只是英译中。翻译结果中的问题还是比较容易看出来。 后面应该还会需要中译英,以及其它语言,大家有什么好建议?

    9 条回复    2024-12-02 11:46:06 +08:00
    mrl1996
        1
    mrl1996  
       2024 年 12 月 2 日
    试试吧提示词优化一下?很多文化背景信息是缺失可以举例翻译的信息吗
    WhiskerSpark
        2
    WhiskerSpark  
       2024 年 12 月 2 日
    利用 RAG 补充背景知识呢?
    mumbler
        3
    mumbler  
       2024 年 12 月 2 日   6
    吴恩达翻译工作流
    1. 先让 LLM 直译,保证信息完整
    2. 把原文和译文都给 LLM ,让其反思,写一份改进意见
    3. 把原文,译文,改进意见一起给 LLM ,让重新翻译生成一个最终作品
    hcocoa
        4
    hcocoa  
       2024 年 12 月 2 日
    能否给一段原文和 prompt 样例?
    tars16
        5
    tars16  
       2024 年 12 月 2 日
    买个 DeepL api pro 的 key
    gpt5
        6
    gpt5  
       2024 年 12 月 2 日
    @tars16 个人体验 deepl 还不如 chatgpt 呢
    FgHh07ObvBiST5po
        7
    FgHh07ObvBiST5po  
       2024 年 12 月 2 日
    @tars16 deepl 比 llm 效果更好吗?
    zqqian
        8
    zqqian  
       2024 年 12 月 2 日
    我之前也遇到了类似的问题,我的方法是:
    1.用更高级的模型,4o 的翻译效果就是比 4o-mini 好很多,但是成本也高很多。

    2.gpt 这些模型都可以 fine-tune ,把你那些领域的专有名词和翻译,再加上一些之前翻译不好的语句,用人工修改之后的中文翻译,都输入进去微调一下。这样下来我实测 4o-mini 的翻译效果可以接近 4o 。

    3 不仅要输入要翻译的内容,还要把上下文,和之前已有的翻译,都输入进去。让大模型理解整段话都在讲什么,再翻译,效果也会好一些。
    tars16
        9
    tars16  
       2024 年 12 月 2 日
    @gpt5 场景是啥,长句子和段落,DeepL 感觉和人翻译的差不多,没有机翻的味道,有些语境和关键词也很准确。
    @proxyai 会,而且 api 可以直接传 HTML 并返回 HTML 、好像 xml 也支持。OpenAI 出来后,干死多少什么做作业的,出题的,远程教师的公司,为什么 DeepL 的照样能获得投资。

    而且 deepl api pro 不需要微调,因为你可以直接上传术语表。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2829 人在线   最高记录 6679       Selec Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 87ms UTC 01:41 PVG 09:41 LAX 18:41 JFK 21:41
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86