为什么国内大模型速度比 chagpt 慢很多 - V2EX

为什么国内大模型速度比 chagpt 慢很多 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 555 天前的主题，其中的信息可能已经有所发展或是发生改变。

我大段文本，gpt-4o 3 秒左右就能返回，国内比如智谱清言，文心一言就要 10 秒多才能返回，有没有知道原因啊，真难搞

速度

21 条回复 2024-05-23 10:23:15 +08:00

1

kyor0

2024-05-22 11:49:01 +08:00 via iPhone

这不正常么

2

jr55475f112iz2tu

2024-05-22 11:51:09 +08:00

虽然 4o 本身就是牺牲质量换速度
但除了技术比不过，你觉得还能有什么其他影响因素？

3

TheJustin

2024-05-22 11:56:09 +08:00

老黄专程送 H200 给奥特曼，国内还在用上一代的阉割算力，阉割不说，数量还跟不上……

4

Antihank

2024-05-22 11:57:46 +08:00

体会到了登子扼颈的窒息吧

5

ktqFDx9m2Bvfq3y4

2024-05-22 12:01:03 +08:00

还有就是人才的意愿问题，如果给人才一个选择的机会，去美或中，答案就是原因。

6

ronyin

2024-05-22 12:03:09 +08:00

百度文心一言还有人用么。。

7

pi7m1Dr691wfl95q

2024-05-22 12:06:01 +08:00

8

gpt-4o sleep()写太小了

8

weijancc

2024-05-22 12:28:24 +08:00

我目前对比了所有国内 AI 产品,抖音的豆包和讯飞的 AI 比较快, 但是训分的 UI 太丑了.. 抖音的回答质量会稍微弱一点, 但是够用了.

9

kenvix

2024-05-22 12:42:18 +08:00

没钱
实际上你自己部署开源的国内大模型就会发现速度也很快的...比如阿里 Qwen1.5

10

Retas

2024-05-22 12:51:24 +08:00 via iPhone

moonshot 基本秒回

11

yiwanjidanmian

OP

2024-05-22 13:16:41 +08:00

@Retas 那我试试

12

Reid

2024-05-22 13:58:38 +08:00

@Retas moonshot 输入长文本，经常卡住啊

13

ardour

2024-05-22 14:18:00 +08:00

算力都不在一个级别

14

frankkly

2024-05-22 14:59:22 +08:00

@pingpz #7 华为：别逼我写 sleep(0)

15

JoeDH

2024-05-22 15:57:38 +08:00

国内的那回复都是一个一个字返回来的，gpt 的是一大段直接吐出来给你

16

Donaldo

2024-05-22 16:01:06 +08:00

没钱没卡

17

kenvix

2024-05-22 17:02:43 +08:00

@eastjoehan #15 你这说的，哪个 LLM 不是 token by ken ？

18

wweerrgtc

2024-05-22 17:24:26 +08:00

也许是需要审核输入和输出的内容

19

zhangdp

2024-05-22 17:37:03 +08:00

3

可能需要分析审核内容耗时了，不允许违法的特别的反动的词语

20

macaodoll

2024-05-22 22:15:36 +08:00 via Android

问就是制裁没显卡，

21

yinmin

2024-05-23 10:23:15 +08:00 via iPhone

试试：海螺 ai 、通义 ai 、零一万物 ai 、deepseek v2 ，都是很快的。

关于帮助文档自助推广系统博客 API FAQ Solana 828 人在线 最高记录 6679

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 25ms UTC 20:20 PVG 04:20 LAX 12:20 JFK 15:20
Do have faith in what you're doing.

ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86