DeepSeek V4 终于出来了。。不知道强不强 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
tianjiyao

DeepSeek V4 终于出来了。。不知道强不强

  •  
  •   tianjiyao 1 天前 7727 次点击

    Imgur

    Imgur

    56 条回复    2026-04-25 10:24:55 +08:00
    JoeJoeJoe
        1
    JoeJoeJoe  
    PRO
       1 天前
    如果可以本地部署的话, 我觉得还是很香的.
    rammiah
        2
    rammiah  
       1 天前
    好像不支持多模态啊
    tianjiyao
        3
    tianjiyao  
    OP
       1 天前
    @JoeJoeJoe 好像是支持本地部署的
    Mrun
        4
    Mrun  
       1 天前
    @rammiah 我记得他们之前就说过,会专注文本类。不会浪费资源去搞多模态
    blirun
        5
    blirun  
       1 天前
    没有多模态,怎么写 UI ?
    xing7673
        6
    xing7673  
       1 天前
    @JoeJoeJoe 开源还是会开源的,其他几家都还在开源的,ds 没道理闭源
    mightybruce
        7
    mightybruce  
       1 天前
    1.6T 还想什么本地部署,现在应该等待腾讯、阿里、字节云上线有 deepseek v4 的代码套餐,或者一些计算云很快就提供了。
    dingawm
        8
    dingawm  
       1 天前
    @blirun #5 确实,不支持多模态,写 UI 没办法参考图片。倒是也能通过让其他支持多模态的模型“转译”一下,但是这样又太麻烦了,没啥必要。。
    JoeJoeJoe
        9
    JoeJoeJoe  
    PRO
       1 天前
    @xing7673 @tianjiyao 那就真的很香了
    xiaomushen
        10
    xiaomushen  
       1 天前
    @blirun 写 UI 就 K2.6 吧,用起来感觉没啥问题
    poorcai
        11
    poorcai  
       1 天前
    @dingawm #8 我记得 GLM5.1 也不支持多模态?但是好像也不错啊,他们一般怎么实现写 UI 的?
    ProphetN
        12
    ProphetN  
       1 天前
    问答不支持多模态,编程弱于 Kimi K2.6 和 GLM 5.1 。1.6T 的参数量部署成本更高。评价拉完了。
    dingawm
        13
    dingawm  
       1 天前
    @poorcai #10 glm5.1 我好久没用,也忘记了。不支持多模态的话,一般就用文字描述吧
    cubecube
        14
    cubecube  
       1 天前
    @mightybruce 估计有不少头铁的企业会买一体机部署。。大力飞砖
    zhiyu1998
        15
    zhiyu1998  
       1 天前
    开始抽卡:

    songco
        16
    songco  
       1 天前 via Android
    yokisama
        17
    yokisama  
       1 天前   5
    意义在于用国产芯片做出 sonnet 级别的模型吧,这个模型其实落后了半年多
    华萎太 fw 了
    xyzos
        18
    xyzos  
       1 天前   3
    @yokisama 国产芯片的问题 不应该归咎到华为一个身上吧
    zhonghao01
        19
    zhonghao01  
       1 天前
    刚才用 v4-flash 做了个小需求,没啥问题。需求大概就是把线程的微信小程序的代码,转成 vue 同样功能的 PC 端的。

    一次性完成,并且功能完整且正确,没有臆想去生成 UI 之类的,完全按照 PC 端的风格来生成的代码和 UI
    tool2dx
        20
    tool2dx  
       1 天前
    竞技场排名第 34 ,说实话还是有点小失望的,虽然开源领域已经是 TOP3 了.

    mashimaroinfo1
        21
    mashimaroinfo1  
       1 天前   1
    很高兴。顺便这里总结张 当前的价格 表供诸位参考。


    国内外主流大模型 API 定价对比 (2026 年 4 月)
    单位:元/百万 tokens | 美元按 1 USD ≈ 7.3 CNY 估算

    阵营 厂商 模型 输入(未命中) 输出 缓存命中
    ───────────────────────────────────────────────────────────────────
    国产 DeepSeek V4 Flash 1 2 0.2
    V4 Pro 12 24 1
    阿里云 Qwen3.5-Plus 0.8 4.8 ~0.4
    Qwen3-Max 2.5 10 ~1.25
    腾讯云 混元 HY3.0 Preview 1.2 4 0.4
    百度 ERNIE 4.5 4 16 无
    智谱 AI GLM-5.1 8 (~$1.40) 28 (~$4.40) ~3.4 (~$0.48)
    字节跳动 豆包 Seed-1.8 0.8 8 无
    科大讯飞 星火 X2 3 3 无
    月之暗面 Kimi K2.5 4 无 无
    MiniMax M2.5 2 8 (~$1.1) 无
    ───────────────────────────────────────────────────────────────────
    海外 Anthropic Claude Sonnet 4.6 $3 (~22) $15 (~110) 含在价内
    Claude Opus 4.7 $5 (~37) $25 (~183) 含在价内
    OpenAI GPT-5.4 $2.50 (~18) $15 (~110) $1.25 (~9.1)
    GPT-5.5 (NEW!) $5 (~37) $30 (~219) 无
    ───────────────────────────────────────────────────────────────────
    备注:
    - V4 Flash / Qwen3.5-Plus 为入门级极致性价比之选
    - 国产模型缓存命中后可节省 70%-90% 成本
    - GPT-5.5 于 2026.4.24 发布,对标 Claude Opus 4.7
    - Kimi K2.5 拥有 256K 超长上下文
    bjzhou1990
        22
    bjzhou1990  
       1 天前
    试了下编程领域不太行,其他还行,试的不多,价格看起来也不太行
    mashimaroinfo1
        23
    mashimaroinfo1  
       1 天前
    修正一下格式

    国内外主流大模型 API 定价对比 (2026 年 4 月) 单位: 元/百万 tokens $1 ≈ 7.3

    ┌────────────┬─────────────────────┬
    │ 厂商 │ 模型 │输入(未命中)│ 输出 │ 缓存命中 │
    ├────────────┼─────────────────────┼
    │ DeepSeek │ V4 Flash │ 1 │ 2 │ 0.2 │
    │ │ V4 Pro │ 12 │ 24 │ 1 │
    ├────────────┼─────────────────────┼
    │ 阿里云 │ Qwen3.5-Plus │ 0.8 │ 4.8 │ ~0.4 │
    │ │ Qwen3-Max │ 2.5 │ 10 │ ~1.25 │
    ├────────────┼─────────────────────┼
    │ 腾讯云 │ 混元 HY3.0 Preview │ 1.2 │ 4 │ 0.4 │
    ├────────────┼─────────────────────┼
    │ 百度 │ ERNIE 4.5 │ 4 │ 16 │ │
    ├────────────┼─────────────────────┼
    │ 智谱 AI │ GLM-5.1 │ 8 │ 28 │ ~3.4 │
    ├────────────┼─────────────────────┼
    │ 字节跳动 │ 豆包 Seed-1.8 │ 0.8 │ 8 │ │
    ├────────────┼─────────────────────┼
    │ 科大讯飞 │ 星火 X2 │ 3 │ 3 │ │
    ├────────────┼─────────────────────┼
    │ 月之暗面 │ Kimi K2.5 │ 4 │ │ │
    ├────────────┼─────────────────────┼
    │ MiniMax │ M2.5 │ 2 │ 8 │ │
    ├────────────┼─────────────────────┼
    │ Anthropic │ Claude Sonnet 4.6 │$3(~22) │$15(~110)│ 含在价内 │
    │ │ Claude Opus 4.7 │$5(~37) │$25(~183)│ 含在价内 │
    ├────────────┼─────────────────────┼
    │ OpenAI │ GPT-5.4 │$2.5(~18)│$15(~110)│$1.25(~9)│
    │ │ GPT-5.5 NEW │$5(~37) │$30(~219)│ │
    └────────────┴─────────────────────┴
    seagoat
        24
    seagoat  
       1 天前
    claude code 里面接了 api, 玩了下.
    2 个小问题都完成了, 速度有点慢, 价格有点贵.
    asuka02
        25
    asuka02  
       1 天前 via Android
    @seagoat 1/10 的价格也不算贵吧
    dingawm
        26
    dingawm  
       1 天前
    @seagoat #23
    @asuka02 #24 因为他家还没有 Coding Plan ,用 API 是会显得比较贵的,而且官方也说了下半年会降价
    yh7gdiaYW
        27
    yh7gdiaYW  
       1 天前
    @poorcai 以我们的实践经验,非要用 glm 写又有明确的设计稿的话,口述+连到浏览器让模型自己看设计稿(的代码)。能用但不是很好用,这一步一般就切别的模型代劳了
    stefwoo
        28
    stefwoo  
       23 小时 53 分钟前
    Dream4U
        29
    Dream4U  
       23 小时 27 分钟前
    不推 coding plan 的话,这谁顶的住,oc 里两个小任务直接干了两块钱。
    而且不支持识图?
    poorcai
        30
    poorcai  
       22 小时 55 分钟前
    @yh7gdiaYW #27 所以说,不支持多模态的大模型,一般推荐只用来干后端任务了。
    isnullstring
        31
    isnullstring  
       22 小时 33 分钟前
    输出价格跟目前部分 CC 中转站差不多,但是不支持图片识别,那基本上没法调用 chrome MCP 去检查页面设计效果
    jaleo
        32
    jaleo  
       21 小时 34 分钟前
    这次首发国产平台 还得是 DeepSeek 迈出了关键一步 这才是黄皮衣最担心的事
    frankkly
        33
    frankkly  
       21 小时 30 分钟前
    @xyzos #18 如果没有行政手段强制企业使用,那确实不能怪华为,但是现在是行政强制企业使用华为,不怪华为怪谁??
    itnoob
        34
    itnoob  
       21 小时 9 分钟前
    @tool2dx 这个好像变了,动态更新到第 14 了;可能芯片国产是重点吧,人都被挖了好多了
    Dav1s
        35
    Dav1s  
       20 小时 44 分钟前
    好像没看到 pdf 里面的 pro max
    dajj
        36
    dajj  
       20 小时 41 分钟前
    英伟达股价毫无动摇,评价是 适合中国人体质的 AI
    opeth
        37
    opeth  
       20 小时 22 分钟前
    @dajj 不是哥们,美国和中国有时差啊。NASDAQ 北京时间 16:00 才开始盘前,现在微跌中
    alleluya
        38
    alleluya  
       20 小时 18 分钟前
    @dingawm #8 ds 不是有个论文写了什么 OCR 识图么 V4 模型看不了图片吗
    caption312
        39
    caption312  
       20 小时 10 分钟前   1

    https://openaiapi.xyz
    key:sk-n9pAA64de311VINBWrIq3n3RISyjelnZuojtvowE3DMTCSvo
    模型名:deepseek-v4-flash ,deepseek-v4-pro
    caption312
        40
    caption312  
       20 小时 6 分钟前
    给各位佬测测,
        41
    RRL  
       20 小时 0 分钟前
    @caption312 感谢,测上了
    MzM2ODkx
        42
    MzM2ODkx  
       19 小时 57 分钟前
    你这表格怎么画的,markdown 支持跨行/合并单元格?
    MzM2ODkx
        43
    MzM2ODkx  
       19 小时 54 分钟前
    @poorcai 调用了个 MCP 查询
    tianjiyao
        44
    tianjiyao  
    OP
       19 小时 54 分钟前
    @MzM2ODkx 哈哈这是图片。。
    caption312
        45
    caption312  
       19 小时 46 分钟前   1
    @RRL 不客气,大家免费蹬就行,应该还有几百额度
    MzM2ODkx
        46
    MzM2ODkx  
       19 小时 38 分钟前
    @tianjiyao 刚没注意,我看文本能选中,还以为是文字
    Damn
        47
    Damn  
       19 小时 21 分钟前   2
    @xyzos 国产芯片的问题全都归咎到他一个身上当然不对。
    但他有黑历史,各种领域都有,应该不难检索到。
    以下图片来自网络:
    frantic
        48
    fratic  
       18 小时 54 分钟前
    v4-flash 是真的便宜,好几次调用才一分钱
    hongye
        49
    hongye  
       16 小时 16 分钟前
    @MzM2ODkx #42 html 格式增强吧
    bronyakaka
        50
    bronyakaka  
       16 小时 12 分钟前
    非常强,非常便宜,推理非常快,够用了。千万别出 coding plan ,不然又算力不够
    germain
        51
    germain  
       14 小时 38 分钟前
    更新 v4 之后老版本的模型居然有质的飞跃,我用 reasoner 让它写一个 Ping Pong 游戏,thinking 花了 1.7 秒,消耗 5526 个 token ,输入 230 ,输出 5296. 总共消耗人民币两毛钱。

    可惜老版本 7 月份就要彻底下线,其实老版本跑很多东西都绰绰有余了。

    EscYezi
        52
    EscYezi  
       8 小时 5 分钟前 via iPhone   1
    @germain 官网 api 的 reasoner 现在是 v4flash 思考模式了
    germain
        53
    germain  
       7 小时 22 分钟前
    @EscYezi 你确定吗?我看 api 文档里没这么说,只说了老版本两个 model 到 7 月正式下岗,不过不管怎样,这效果还是比较令人满意的。
    5waker
        54
    5waker  
       3 小时 49 分钟前   1
    @germain 是的,文档写了的`deepseek-chat 与 deepseek-reasoner 两个模型名将于 2026/07/24 弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。`
    Danswerme
        55
    Danswerme  
       3 小时 38 钟前   1
    @germain 官网 `deepseek-chat` 和 `deepseek-reasoner` 这两个模型名为了保持兼容性,目前是 `deepseek-v4-flash` 的别名,将于 2026/07/24 弃用。

    Ref: https://api-docs.deepseek.com/zh-cn/
    germain
        56
    germain  
       2 小时 25 分钟前
    @5waker
    @Danswerme

    多谢,我可能没看到那行小字
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2620 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 121ms UTC 04:50 PVG 12:50 LAX 21:50 JFK 00:50
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86