指挥 AI 做了一个 LLM API 网关 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
midraos

指挥 AI 做了一个 LLM API 网关

  •  
  •   midraos 3 月 10 日 1935 次点击
    这是一个创建于 47 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在只想到了路由配置、APIKEY 配置、token 统计与限制、限速与并发控制、自动化的封禁规则和监控。

    还有哪些功能能够添加进去?

    route

    Token 统计 token 统计

    14 条回复    2026-03-11 00:19:42 +08:00
    cryptovae
        1
    cryptovae  
       3 月 10 日
    我缓缓打出了一个?

    为什么我不直接用 oneapi newapi
    midraos
        2
    midraos  
    OP
       3 月 10 日
    @cryptovae #1 为了满足自己的需求,轻量化、低资源占用与保护真实的 apikey ;
    heimoshuiyu
        3
    heimoshuiyu  
       3 月 10 日 via Android
    负载均衡,透明重试,首字符超时,缓存识别,解码速度监控,模型别名,http 连接复用,绕过风控的多 key 轮训网络代理
    meeop
        4
    meeop  
       3 月 10 日
    我倒是有建议:
    1 实现极高可靠性,可靠到你个人和服务器都被物理封禁,服务依然可靠稳定可用,换句话说可保证无视各家 api 地域政策保证可用性
    2 实现 api 供应商的收款支付能力,这样就能构成一个 api 供给和采购的市场
    midraos
        5
    midraos  
    OP
       3 月 10 日   1
    @heimoshuiyu #3 解码速度监控和 http 连接复用加进来很不错。
    我设计的目标是一个 LLM api 特化的 Nginx 透明代理类型的网关,用于保护与隐藏真实的 apikey ,网关中会拦截 LLM api 中的 apikey 、X-Forwarded-For 和 UA ,其他的都直接进行透传了,所以像重试、首字符超时这些都扔给使用 api 的 client 了;
    加入负载均衡可能会导致 LLM 服务商的输入缓存失效,就没做这个功能了
    userff
        6
    userff  
       3 月 10 日
    我前一段也用 rust 的 Tauri 做了一个:
    https://github.com/userfhy/SSLProxyManager-Tauri
    userff
        7
    userff  
       3 月 10 日
    @fhy1994 不好意思 没看仔细 我做的是一个通用的代理管理工具 O(∩_∩)O
    HFX3389
        8
    HFX3389  
       3 月 10 日
    这也是一个聚合层吗?现在好多聚合层了 metapi 、octopus 、Aether 、axonhub 都是,可以让 AI 参考他们的功能嘛~
    beyondstars
        9
    beyondstars  
       3 月 10 日   1
    当作一个练手项目我觉得是没问题的,造轮子的学习意义大于实用意义,市面上的确有成熟的方案前面的回复已经有人说了。
    midraos
        10
    midraos  
    OP
       3 月 10 日
    @HFX3389 #8 可以看作是 axonhub 这类平台的劣化版,好听点叫轻量化,设计目标就是一个轻量级的透明反向代理,针对 LLM 服务进行了特化定制,确实可以借鉴学习这几个项目中对边界的划分
    midraos
        11
    midraos  
    OP
       3 月 10 日
    @beyondstars #9 和市面上的成熟的平台化产品的叙事角度不太一样,我的设计目标是一个轻量化的透明反向代理,服务跑起来后只占用 20M Ram 和 0.5%的 Cpu ,不算是一个完全自嗨的玩具
    qwer666df
        12
    qwer666df  
       3 月 10 日
    好奇这个后台也是 AI 做的吗,包含登录注册吗?最近想做一个新的管理后台,需要从老的移植到新的,包括登录/权限,感觉 AI 做不了啊,
    hanguofu
        13
    hanguofu  
       3 月 10 日
    有意思~ 我可以试用一下吗 ?
    daimaosix
        14
    daimaosix  
       3 月 11 日 via Android
    @qwer666df 肯定可以啊
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2788 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 50ms UTC 09:44 PVG 17:44 LAX 02:44 JFK 05:44
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86