拿 cursor 整了 soulx tts 的工具 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
yihy8023
V2EX    程序员

拿 cursor 整了 soulx tts 的工具

  •  
  •   yihy8023
    jianyun8023 60 天前 2324 次点击
    这是一个创建于 60 天前的主题,其中的信息可能已经有所发展或是发生改变。

    拿 cursor 整了 soulx tts 的工具,适配了 macos gpu 。可以生成播客,有 web 、api 两种方式。全程没有写一行代码,问题由 agent 、plan 两种方式去分析解决。对比一个月前,提升巨大。

    使用模型 Sonnet 4.5

    github 仓库: https://github.com/jianyun8023/soulx-tts-metal

    有兴趣可以去仓库下载玩玩,cursor 写了很多文档和脚本,这个过程部分也都放在 github 上了。

    测试文本生成时间

    • 使用 mac M3 max 64G 版本
    • 总耗时:262.50 秒
    • 音频时长:192.52 秒
    • 参与者:2 人
    • 对话数:27 段
    第 1 条附言    57 天前
    目前的 ai 编程,个人体感是需要清楚整个流程怎么做,沟通生成 plan ,然后按计划执行,校准错误。 生成这个 tts 工具,让他分析 cpu 为什么用了很多,它加了很多日志分析耗时,然后告诉我没有问题怎么着。我沟通到第三轮让它去检查实际模块里面的代码才发现问题。
    今年我对 ai 工具的评价,需要你懂怎么做,让它给实现。利好大龄程序员,有能力没精力这样。
    8 条回复    2025-10-31 19:23:00 +08:00
    Modesty
        1
    Modesty  
       60 天前
    先点个星,后面试试
    graymmon
        2
    graymmon  
       59 天前
    不错,我也昨天刷推看到这个了 现在还下载模型看到你写好了
    yihy8023
        3
    yihy8023  
    OP
       59 天前
    @graymmon 昨天想试试,发现 cursor 整的太好了,就让它把功能都做了
    soulx 给的 python 包里面没适配好 mps ,跑起来 cpu 蹭蹭的涨。也让它找到问题,给修了
    badboy200600
        4
    badboy200600  
       59 天前
    唔 这种没办法部署到 ecs 给 app 用吧 这种 ecs 贵得吓人
    menghuitangchao
        5
    menghuitangchao  
       59 天前
    老哥用的是 cursor 2.0 吗
    xiaohuangya
        6
    xiaohuangya  
       58 天前
    声音我试了试,女声腻腻的。
    yihy8023
        7
    yihy8023  
    OP
       58 天前
    @xiaohuangya 自己找个声音放进去,直接可以克隆
    yihy8023
        8
    yihy8023  
    OP
       58 天前
    @menghuitangchao 写的时候,2.0 还没发,不过 2.0 用下来还行
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5159 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 09:25 PVG 17:25 LAX 01:25 JFK 04:25
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86