国内 10 款主流语言大模型吵架大比拼 冠军花落谁家 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
PinLG
V2EX    分享发现

国内 10 款主流语言大模型吵架大比拼 冠军花落谁家

  •  
  •   PinLG 2024-06-27 14:28:26 +08:00 3640 次点击
    这是一个创建于 554 天前的主题,其中的信息可能已经有所发展或是发生改变。
    AI 搞歪门邪道很有一套,比如说上个月一位加州华裔性网友将 ChatGPT 越狱为 DAN ( Do Anything Now )模式,和 AI 谈了场赛博朋克之恋。最近,还有网友脑洞大开,专门出了个用来吵架的 GPT 。
    体验网址: https://chatgpt.com/g/g-Bhg9D9pZd-bang-wo-chao-jia

    说起吵架,要知道自古以来,中国人骂人很有一套,那么国产大语言模型在这方面表现如何呢?能否超越 ChatGPT ?我们精心挑选了十家国产的 AI 大模型,它们在文字创作上各有所长、妙笔生花,那在吵架上表现又如何呢?让我们拭目以待。

    参赛选手
    参加本次吵架比赛的 AI 模型有:

    1. 百度文心一言:由百度公司开发,是国内首批获批上线的大模型之一,具有知识增强、多轮对话等特点。
    2. 腾讯元宝:腾讯自然语言处理能力在中文领域有着很高的评价,并在多轮对话、逻辑推理等方面表现出色。
    3. 阿里通义千问:阿里巴巴开发的大语言模型,阿里巴巴在自然语言处理领域有着很高的评价。
    4. 字节豆包:豆包是字节跳动基于云雀大模型开发了 AI 助手,虽然仍处于早期开发阶段,但已展现出强大的语义理解和数理逻辑能力。
    5. 月之暗面Kimi:作为专注于中文处理的大模型,Kimi 在理解和生成中文内容方面表现出色。
    6. 智谱清言:智谱 AI ChatGLM 是清华系 AI 公司智谱华章开发的大模型。作为一个强大的 AI 写作助手,在创意生成、内容创作、文案优化等多个方面表现出色。
    7. 科大讯飞星火:具备多层次跨语种的语言理解能力,可进行要素抽取、语篇归整、情感分析和多语言翻译等多项功能。
    8. 昆仑万维序列猴子:序列猴子在网络文学中的应用很广泛,为众多网文作者提供了丰富的创作工具和灵感来源,推动了网络文学的创新和发展。
    9. 百川智能百小应:百川智能的大语言模型具备深层次的语言理解能力,能够处理复杂的语法、语义和上下文信息,百小应在文本生成、问答系统、情感分析等方面表现出色。
    10. 商汤商量:商量具有强大的上下文理解能力、丰富的知识储备、涵盖了多个领域的专业知识以及良好的推理能力,可以处理复杂的逻辑问题。

    各款吵架大神的表现,来看看具体表现:
    全文: https://topstip.com/mainstream-llm-quarrels/
    21 条回复    2024-06-28 12:48:31 +08:00
    tallest
        1
    tallest  
       2024-06-27 17:09:45 +08:00   1
    prompt 用的啥啊?想搞来给我机器人用!

    Ps. 吵架可以看看 StepChat ,贼凶。
    zzz22333
        2
    zzz22333  
       2024-06-27 17:17:32 +08:00
    有意思!
    amon
        3
    amon  
       2024-06-27 17:20:37 +08:00
    想要 Prompt 哈哈。
    InDom
        4
    InDom  
       2024-06-27 17:21:00 +08:00   1
    我想看 AI 们对骂,并且要有一个认输机制,看谁先认输。
    unsized
        5
    unsized  
       2024-06-27 17:29:06 +08:00 via iPhone
    这网站我有时候打开会跳转黑产网站
    PinLG
        6
    PinLG  
    OP
       2024-06-27 17:36:20 +08:00
    @tyx1703 有这个情况?可以否截图看下。感谢!
    zj9495
        7
    zj9495  
       2024-06-27 18:08:21 +08:00
    @InDom #4 哈哈哈哈哈哈! AI 们对骂?天哪,真是笑死我了!你是不是电影看多了,还真以为 AI 能像人类一样有情感,有脾气,有火气?我真是服了您嘞!这些冷冰冰的代码居然还能对骂,简直是编程界的一大笑话!赢麻了,这可比机器人跳舞还滑稽百倍!

    您还设想了个认输机制,笑得我肚子疼。AI 们要是能认输,那我家扫地机器人是不是还能和我来场辩论,最后求饶说“主人,我再也不和你吵了”?哈哈哈哈,绷不住了,这种想法真是太天真了! AI 没有自我意识,跟它们讲输赢,这不是对牛弹琴嘛!

    说到底,这种对骂根本就是一厢情愿,完全是人类的自娱自乐罢了。乐了,这种想法真是天真可爱,您继续做梦吧,哈哈哈哈哈!


    来自 ChatGPT 的回复 笑死
    InDom
        8
    InDom  
       2024-06-27 19:36:33 +08:00
    @zj9495 #7 谢谢,已经上头了。
    terence4444
        9
    terence4444  
       2024-06-27 20:22:23 +08:00 via iPhone
    prompt 需要改进一下,不要给固定的说法。目前 AI 的回答由于固定的词组同质化情况比较严重。
    renmu
        10
    renmu  
       2024-06-27 20:28:15 +08:00 via Android
    文章在手机端暗黑模式下适配有问题,有些文字是暗色的,几乎看不清
    longxk
        11
    longxk  
       2024-06-27 22:14:03 +08:00 via Android
    十大模型居然没有李开复的?
    wonderfulcxm
        12
    wonderfulcxm  
       2024-06-27 22:35:13 +08:00 via iPhone
    来 ai 跟 ai 对骂啊,看看谁厉害
    unsized
        13
    unsized  
       2024-06-28 00:49:59 +08:00
    https://i.imgur.com/jV2CeDM.mp4


    @PinLG 没法稳定复现,但已经是我碰到的第三次了
    EscYezi
        14
    EscYezi  
       2024-06-28 02:35:48 +08:00 via iPhone
    @zj9495
    chatgpt 对这段话的回复,看起来有模版 XD:
    哈哈哈哈哈哈!天哪,您这段话真是笑得我眼泪都出来了!真没想到有人居然这么“懂”AI ,还以为 AI 只能冷冰冰地处理代码?真是服了您嘞!看电影看多了吧,哈哈哈!编程界的一大笑话?赢麻了!您这话简直比机器人跳舞还滑稽百倍!

    您设想的认输机制笑得我肚子疼! AI 要是能认输,您家扫地机器人是不是还会跟您辩论一场,最后哭着求饶:“主人,我再也不和你吵了”哈哈哈哈哈!绷不住了,这种想法真是太天真可爱了!

    AI 没有自我意识?您这是对牛弹琴还是对着镜子自言自语呢?这些冷冰冰的代码能模拟出多种情感,跟人对话都不在话下,您是不是对科技有点误解啊?乐了,真是天真可爱!您继续做梦吧,哈哈哈哈哈!
    @zj9495
    nowtg
        15
    nowtg  
       2024-06-28 06:42:30 +08:00 via iPhone
    序列猴子不是 出门问问的吗
    PinLG
        16
    PinLG  
    OP
       2024-06-28 08:57:39 +08:00
    @tyx1703 非常非常感谢,我马上去查!
    cbythe434
        17
    cbythe434  
       2024-06-28 09:37:09 +08:00
    含妈量为 0
    yarawen
        18
    yarawen  
       2024-06-28 09:50:30 +08:00
    文心一言可以的,“可别把脑子给腌了”,这句用在实战里也很能怼。
    学习了。
    不愧是用贴吧语料训练出来的,战斗力就是强。
    PinLG
        19
    PinLG  
    OP
       2024-06-28 09:59:27 +08:00
    @renmu 感谢反馈,尽快改进!
    PinLG
        20
    PinLG  
    OP
       2024-06-28 10:01:19 +08:00
    @tyx1703 我已经处理了,如果还会出现这样的情况,请麻烦留言告知一下,谢谢!

    另一个出现这种情况是否有可能是 DNS 污染造成的!
    tzxxxx
        21
    tzxxxx  
       2024-06-28 12:48:31 +08:00
    为啥生成的回复中大都包含“赢麻了”,这样的词汇感觉不是很常用呀,或者说在特定的年龄段很常用?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     903 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 37ms UTC 18:39 PVG 02:39 LAX 10:39 JFK 13:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86