Grok 的图片生成功能太强了,我有点忍不住想付费了 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cmdOptionKana
3.16D
V2EX    分享发现

Grok 的图片生成功能太强了,我有点忍不住想付费了

  •  
  •   cmdOptionKana 31 天前 8349 次点击
    第 1 条附言    31 天前
    大家知道哪里有专门与人分享 AI 图的社区论坛吗?
    95 条回复    2025-09-10 10:05:08 +08:00
    yandif
        1
    yandif  
       31 天前   2
    这种效果本地文生图模型应该也能实现吧
    国内: https://www.liblib.art/
    国外: https://civitai.com/
    dji38838c
        2
    dji38838c  
       31 天前
    比别人强在哪里了?
    Sting1226
        3
    Sting1226  
       31 天前   2
    并没有强到哪里去。好好看第二张图妹纸的左手,食指、中指、无名指一般长。
    dule
        4
    dule  
       31 天前
    看着很一般啊,自己电脑显卡好直接 Stable Difusion + civitai 模型,效果不比这强得多?还能 nsfw
    cmdOptionKana
        5
    cmdOptionKana  
    OP
       31 天前
    @dji38838c 最大的优点是速度快,一秒输出几十张,质量还算不错,每张图点进去,它会给出一句加入了创意的 prompt ,同时基于这个新创意又给你一堆图,并且每张图都可以生成几秒视频。
    hh4646908
        6
    hh4646908  
       31 天前
    没看出哪里强了,能达到这个效果的模型不少
    cmdOptionKana
        7
    cmdOptionKana  
    OP
       31 天前
    @yandif 谢谢,我试试看这两个的效果
    cmdOptionKana
        8
    cmdOptionKana  
    OP
       31 天前
    @dule 显卡要求高不高?我现在没台式机,只有个普通办公笔记本
    cmdOptionKana
        9
    cmdOptionKana  
    OP
       31 天前
    @dji38838c
    @Sting1226
    @hh4646908

    它的优点是速度快,而且量大管饱,基于你的 prompt 自动给你微创新,一秒几十张图,每张图又可以继续发散(每张图点进去又自动生成新图),因此获得一种满意的图比较容易,整个过程很丝滑
    Dream4U
        10
    Dream4U  
       31 天前
    AI 感太重了
    dule
        11
    dule  
       31 天前
    @dule 不少开源的模型效果挺好,之前比较出圈的应该是韩国 lora 模型吧,手指的问题应该也能解决,局部重绘或者优化,借助 ControlNet 之类的
    kaed
        12
    kaed  
       31 天前
    需要 grok heavy 吗?合租一个月 100
    cmdOptionKana
        13
    cmdOptionKana  
    OP
       31 天前
    @Socrazy AI 感不重的目前我只知道一个 flux pro ,但价格就更贵了( flux dev 也不太行)
    jijijjijjjjiijjj
        14
    jijijjijjjjiijjj  
       31 天前
    你说的几个优点,除了速度,别的开源闭源都能实现.
    目前生成效果只有大香蕉断档碾压
    dule
        15
    dule  
       31 天前   1
    @cmdOptionKana #8 要求不高,只是生成速度会慢很多,想快跟稳定还是搞专门的 gpu 服务器云端部署吧,也不咋贵,谷歌跟 Kaggle 应该挺多人用的
    2en
        16
    2en  
       31 天前
    提示词是什么
    cmdOptionKana
        17
    cmdOptionKana  
    OP
       31 天前
    @jijijjijjjjiijjj 网上试用过一些模型,效果不是很理想
    mogutouer
        18
    mogutouer  
       31 天前
    试试生成上面有中文字的呢
    dule
        19
    dule  
       31 天前
    @cmdOptionKana #8 当然了,减少或者不想折腾踩很多坑就直接用现成的服务挺好,只要能满足自己预期,楼上说的那个 Nano Banana 最近挺出圈,听说挺猛,只刷到几个讨论的,自己还没体验,可以两者互相对比一下效果
    cmdOptionKana
        20
    cmdOptionKana  
    OP
       31 天前
    @2en 我给它的提示词是 Real-life photography: A Hong Kong female high school student wearing socks is doing homework at the desk.

    它给我生成一堆图,每张图都有可能自动扩写提示词,这两张它扩写后是这样 Real-life photography: A Hong Kong female high school student with almond-shaped eyes and a bright smile, wearing a grey school uniform with shorts and thigh-high navy socks, engrossed in her homework at a cluttered desk filled with colorful stationery, captured from a high-angle perspective.
    itenyh
        21
    itenyh  
       31 天前
    第二张图妹子怎么出来
    cmdOptionKana
        22
    cmdOptionKana  
    OP
       31 天前
    @mogutouer 生成中文也是我很喜欢的一点,喜欢那种假汉字,并且担心以后只能生成正确汉字。另外我也试过生成一些照镜子的图,结果可能会有点诡异,但这也是乐趣所在,如果非常正确地照镜子,反而不好玩了。
    razios
        23
    razios  
       31 天前 via iPhone
    这种图片 ai ,能输出不可描述图片不?
    cmdOptionKana
        24
    cmdOptionKana  
    OP
       31 天前
    @razios 据说私有部署可以,但我没显卡就一直没有去研究。想找找看有没有社区,看看别人的图。
    crocoBaby
        25
    crocoBaby  
       31 天前
    太真实了,上年纪的根本分辨不出来,商业逻辑可以用于 yellow 产业,包赚钱的
    cmdOptionKana
        26
    cmdOptionKana  
    OP
       31 天前
    @crocoBaby 主要是现在很多真的摄影照片,P 图后可能比这个还假,而他们又必然要 P 图的
    cmlx1014
        27
    cmlx1014  
       31 天前
    跟最近很火的 谷歌 banana 相比如何?
    su3sl3h06
        28
    su3sl3h06  
       31 天前
    这个效果被即梦爆杀吧。。。而且今天即梦出 4.0 ,效果更好了
    jjwjiang
        29
    jjwjiang  
       31 天前
    用 SD 和 comfui 的已经玩到你不能想象的地步了,你这竟然还在对着别人差不多 1 年前的产出付费……
    lingeo
        30
    lingeo  
       31 天前
    comfyUI ,网上教程一大堆,懒的话就直接复制人家的工作流。
    cmdOptionKana
        31
    cmdOptionKana  
    OP
       31 天前
    我去 https://nanobanana.ai/#generator 试用了一下,效果如下

    https://cdn.sa.net/2025/09/08/OZU3T1qcICEm5gv.png

    生成速度很慢,而且每次只能出一张图,也没有联想功能,价格还更贵,比 grok 的体验差很多。但是出来的真实感还不错,如果可以多测试几张就好了,现在免费只能生成一张,不好评价。
    su3sl3h06
        32
    su3sl3h06  
       31 天前

    第一张图用 gemini 反推后,即梦 4.0 根据反推的提示词生成的
    tediorelee
        33
    tediorelee  
       31 天前
    @dule #4 哥有整合包指路吗
    cmdOptionKana
        34
    cmdOptionKana  
    OP
       31 天前
    @jjwjiang
    @lingeo

    我搜索了一下 comfyUI 美女图,没有找到特别好的作品,你们是在哪里看到 comfyUI 的优秀图片的?我想去看看
    mf2019d
        35
    mf2019d  
       31 天前
    gemini 的更漂亮
    2en
        36
    2en  
       31 天前
    @cmdOptionKana #20 nano banana 效果,平均生成时间 15s
    dule
        37
    dule  
       31 天前
    @tediorelee 没,网上搜一下看看吧,我是之前自己无聊个人研究玩了一段时间
    dule
        38
    dule  
       31 天前
    @razios 那可太可以了 涩涩才是第一生产力
    cmdOptionKana
        39
    cmdOptionKana  
    OP
       31 天前
    @su3sl3h06 感谢推荐!试用了即梦,出来的图有中国特色,这点很好!而且不用翻墙,价格和购买方式也比较方便。
    june4
        40
    june4  
       31 天前
    一股子 ai 味,不是你提示词不行就是 grok 不行
    cmdOptionKana
        41
    cmdOptionKana  
    OP
       31 天前
    @2en nano banana 的真实感更强。速度虽然慢但我也不介意,最大的问题是价格也不便宜…
    cmdOptionKana
        42
    cmdOptionKana  
    OP
       31 天前
    @june4 哪个模型比较好,ai 味少点的?
    HeyWeGo
        43
    HeyWeGo  
       31 天前
    @2en #35

    这是我这 banana 的生成图,看上去都差不多?
    cmdOptionKana
        44
    cmdOptionKana  
    OP
       31 天前
    @HeyWeGo 你们是用了字数更多的那个提示词吧?我一般选择字数少那个,让 ai 有更多自由发挥的空间
    cmdOptionKana
        45
    cmdOptionKana  
    OP
       31 天前
    @HeyWeGo 但在联想发散这方面,可能 grok 有点小优势,因为 grok 速度极快,很积极联想
    logyxiao
        46
    logyxiao  
       31 天前
    我算是专业做 ai 图的,不过都是二次元的。我 5090d 跑一张 1024*1546 的图大概十几秒一张。不过我没有下载现实人物模型,不然也帮你试一下。
    这种语义化的本地可以使用 wan2.2 或者混元的模型,还能图生视频。
    现在很多云显卡平台,可以先试用一下,然后在考虑要不要购置显卡。


    2en
        47
    2en  
       31 天前
    @HeyWeGo 我也发现,我使用同个提示词,不停开新对话,生成出的图也都大差不差
    2en
        48
    2en  
       31 天前
    @cmdOptionKana #44 我用字数更多的那个提示词发现效果不如字数更少的提示词,有时候让 ai 自由发挥反而会更好
    lingeo
        49
    lingeo  
       31 天前
    @cmdOptionKana #34 comfyUI 只是一个 SD 的 web 前端,需要自己选择模型配置节点去生成图像,如果要看作品的话,可以去模型站 https://civitai.com/查看,缺点是需要一点学习门槛,优点是免费,一般的显卡也能运行。
    BarackLee
        50
    BarackLee  
       31 天前 via Android
    付钱以后,可以 nsfw 吗
    IndexOutOfBounds
        51
    IndexOutOfBounds  
       31 天前
    @cmdOptionKana #41 可以试试我这个 https://image-generation.zenfeed.xyz 免费
    IndexOutOfBounds
        52
    IndexOutOfBounds  
       31 天前
    @cmdOptionKana #31 这个是李鬼网站,昨天还发帖讨论了( t/1157573?p=1#reply6 ),官网 AI Studio 完全免费
    HumbertHumbert
        53
    HumbertHumbert  
       31 天前
    Grok 速度很快,但是实在是太贵了。
    songsongqaq
        54
    songsongqaq  
       31 天前
    要不试试纳米香蕉
    labdum
        55
    labdum  
       31 天前
    @cmdOptionKana #31 这不是 nano banana 的 google 官网,是别人的套壳网站。ai studio 免费,之前也有可以可以撸的羊毛免费一年会员,gemini 里也可以用,真要付费他家也不贵吧,综合体验就它和 GPT 值得付费。
    squirrelgg
        56
    squirrelgg  
       31 天前
    @crocoBaby hhh ,日本某倒闭的片商,老板跑了,网站还在,剩下的员工已经在搞 AI 相关的了,老片子 AI 做高清、4K ,还有探索 AI 生成
    byby
        57
    byby  
       31 天前 via iPhone
    论图片,我只服 chatgpt 和 banana
    npe
        58
    npe  
       31 天前
    国产豆包也可以做到这个效果。 更好的就 gpt 和 gemoni
    xiayun
        59
    xiayun  
       31 天前
    现在的生成图总有一种一眼就是 AI 出来的感觉 什么时候这种感觉没有了就牛逼了
    sky3hao9
        60
    sky3hao9  
       31 天前
    差评! 画那么多衣服不累吗
    cmdOptionKana
        61
    cmdOptionKana  
    OP
       31 天前
    @labdum google 说限制地区不让我用,我也嫌麻烦不想搞外区帐号了
    cmdOptionKana
        62
    cmdOptionKana  
    OP
       31 天前
    @logyxiao 狱卒!
    daybreakfangyang
        63
    daybreakfangyang  
       31 天前
    @su3sl3h06 极梦的看着挺好
    cmdOptionKana
        64
    cmdOptionKana  
    OP
       31 天前
    @IndexOutOfBounds google 限制地区,我无法直接使用。感谢你这个网站,让我可以试用 nano banana ,效果还不错:

    cmdOptionKana
        65
    cmdOptionKana  
    OP
       31 天前
    @2en 如果舍得花钱,先用 grok 快速批量生成,再精选几张用 nano banana 提高质量,那就最爽了。
    cmdOptionKana
        66
    cmdOptionKana  
    OP
       31 天前
    @lingeo 找了一些 Stable Diffusion 的图片,感觉 AI 味方面也没有明显优势。civitai 看起来很不错,玩法比较高级。
    cmdOptionKana
        67
    cmdOptionKana  
    OP
       31 天前
    @logyxiao 有没有 AI 图的社区论坛?
    HumbertHumbert
        68
    HumbertHumbert  
       31 天前
    有没有论坛或者提示词优化的工具?现在是让它自己优化,效率比较低。或者来回换不同 AI 优化提示词。好累
    monkeyWie
        69
    monkeyWie  
       31 天前
    可以试试我的免费生图站,开源且支持自部署: https://typix.art
    monkeyWie
        70
    monkeyWie  
       31 天前
    @monkeyWie Cloudflare AI 免费提供的模型,效果还不错
    bytealan
        71
    bytealan  
       31 天前
    @monkeyWie #70 图 2 的腿好吓人 hhhh
    Goooooos
        72
    Goooooos  
       31 天前
    grok 生成的妹子不太符合个人审美
    monkeyWie
        73
    monkeyWie  
       31 天前
    @bytealan 哈哈 还得多抽卡才行
    cmdOptionKana
        74
    cmdOptionKana  
    OP
       31 天前
    cmdOptionKana
        75
    cmdOptionKana  
    OP
       31 天前
    @monkeyWie 是我喜欢的风格
    logyxiao
        76
    logyxiao  
       31 天前
    1 楼发的那两个就是国内外最大的 ai 生图论坛了。中午抽空下载了一下 wan2.2 的模型,测试了一下现实人物。随便跑了两张。效果如下。
    像素为 1280*720 ,每张耗时 60 多秒。并且试了一下 nsfw 似乎不行,如果要 nsfw 骨架用 sdxl 的开源模型比较好,那个没有限制





    @cmdOptionKana #67
    logyxiao
        77
    logyxiao  
       31 天前
    @logyxiao #76 注意我这个生成时间是因为我用的是 5090D, 如果想本地跑。显存起码也要 12G 以上比较好一点。
    monkeyWie
        78
    monkeyWie  
       31 天前
    @cmdOptionKana #75 哈哈,那就好,要是有 key 的话我那里还提供了各种生图的提供商,NanaBanana 、Flux Kontext 、GPT4o 、qwen-image 都可以用
    kcerty
        79
    kcerty  
       31 天前
    @logyxiao #77 老哥搞封面的吗?
    logyxiao
        80
    logyxiao  
       31 天前
    @kcerty 没有,单纯自己做着玩。并没有赚钱。只不过前年就开始有跑 AI 图
    ttgo
        81
    ttgo  
       31 天前
    @monkeyWie chatgpt 就不许画这种俯视视角
    kamal
        82
    kamal  
       31 天前
    是 ABC 风格
    cmdOptionKana
        83
    cmdOptionKana  
    OP
       31 天前
    @logyxiao 自己有显卡就是比较爽啊,生图真的很好玩。但是也比较消耗想象力,我经常玩着玩着就脑袋空空想不出个好场景。
    vipfts
        84
    vipfts  
       31 天前
    是 ani 不好玩吗?
    cmdOptionKana
        85
    cmdOptionKana  
    OP
       31 天前
    ihmily
        86
    ihmily  
       31 天前
    @cmdOptionKana

    >我搜索了一下 comfyUI 美女图,没有找到特别好的作品,你们是在哪里看到 comfyUI 的优秀图片的?我想去看看

    https://www.liblib.art/
    cmdOptionKana
        87
    cmdOptionKana  
    OP
       31 天前
    @ihmily 去看了,二次元图的质量比较好,真人照片类型的好图有一些,想减少 AI 味还是难
    wsbqdyhm
        88
    wsbqdyhm  
       31 天前 via iPhone
    @su3sl3h06 #32 这个比楼主的好多了,ai 味道没有那么浓
    bao3
        89
    bao3  
       31 天前
    @Sting1226 哈哈哈哈,你这眼神可以啊,我就说这图片怎么手胖呼呼,原来是手指一样长……
    另外妹子个 Apple watch 居然被手腕给给削掉了…… AI 只级提供创意蓝图啊
    slowgen
        90
    slowgen  
       31 天前   1
    这个太低水平了,你需要见识一下 NSFW 的顶尖生产力 https://www.reddit.com/r/unstable_diffusion/
    hanguofu
        91
    hanguofu  
       31 天前
    请问国内哪里可以体验一下 ?
    cmdOptionKana
        92
    cmdOptionKana  
    OP
       30 天前
    @hanguofu 国内可以用这几个(我也是才知道):

    https://www.liblib.art/
    https://www.doubao.com/
    https://jimeng.jianying.com/ai-tool/generate
    cmdOptionKana
        93
    cmdOptionKana  
    OP
       30 天前
    @shuimugan 刺激!牛逼!
    OrLm0qz8vMzb2sLo
        94
    OrLm0qz8vMzb2sLo  
       29 天前
    村通网? 现在强的应该是谷歌的小香蕉,字节的即梦 4.0 ,grok 那玩意有点幽默,grok4 刚出那会,我充了 90 元,结果跟 sd 开源一样效果
    cmdOptionKana
        95
    cmdOptionKana  
    OP
       29 天前
    @cabudon 经过上面讨论,各种 ai 我都试用了,banana 效果是好,但速度慢,联想能力不如 grok 。即梦效果也不错,而且有中国照片风格比较亲切。上面也有很多人夸 sd ,但我看别人的图,sd 貌似二次元的效果比较好,真人照片没有多少优势。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1357 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 23:57 PVG 07:57 LAX 16:57 JFK 19:57
    Do have faith in what you're doing.
    (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){ (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o), m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m) })(window,document,'script','//www.google-analytics.com/analytics.js','ga'); ga('create', 'UA-11940834-2', 'v2ex.com'); ga('send', 'pageview'); ga('send', 'event', 'Node', 'topic', 'share'); ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86