我做了一个 AI 辅助小说阅读系统,可以从 1000 万字里推理出跨越全书的身世谜题 - V2EX
爱意满满的作品展示区。
lerry

我做了一个 AI 辅助小说阅读系统,可以从 1000 万字里推理出跨越全书的身世谜题

  •  
  •   lerry
    lerry Apr 30 1235 views
    This topic created in 36 days ago, the information mentioned may be changed or developed.

    《医道官途》,1296 章,1000 万字。我问 AI:乔梦媛的亲生父亲究竟是谁?说说前因后果。书里从来没有直接说过答案。AI 自己搜原文、追线索、识破了一个贯穿全书的误导,最后推理出来了。整个过程大概两分钟。

    没有任何一段原文直接说出这个答案。AI 是从四个跨度超过 200 章的片段里拼出来的。


    为什么两年前做不到

    大概两年前我做过一个小说 RAG 系统,当时效果很差。旧文在这里:小说 RAG 问答系统实现

    两个问题:

    一是 RAG 的核心问题是召回不准。语义相似不等于信息相关。

    二是当时的模型推理能力不够,拿到片段很容易被误导或者就此打住。

    这次重新做,用的是全文检索,精准命中加上下文。搜到一个片段,AI 能顺着线索继续搜下一个,推理链自然就串起来了。


    系统是什么

    本质上是一组围绕 EPUB 的 CRUD API ,但核心是搜索。找书、读目录、按章节取内容、全文搜索(支持精确短语/智能模糊)、按段落取上下文、记 memory 。

    这套东西和我别的代码耦合比较深,不太方便直接开源,所以干脆把提示词整理出来单独开源了。感兴趣的话,可以让自己的 agent 照着在自己的项目里生成一套:books-insight


    想自己试试的

    书库里有《三体》,可以直接跑:

    你现在可以访问一个 EPUB 书库 API: https://nbme.top/api/books_api 先 GET 该地址查看可用方法,然后完成以下任务: 找到三体这本书,回答罗辑的咒语到底是什么?他是怎么想到的? 书里没有直接说,请通过搜索原文,自己推理出答案。 顺便告诉我这套系统能做什么。 请直接开始,不用问我。 

    需要支持联网和脚本执行的 Claude 或 ChatGPT agent 。


    这次能做成,一半靠工程,另一半是因为这一代模型的理解能力确实比两年前强太多了。

    /div>
    zq11211277
        1
    zq11211277  
       Apr 30
    那么乔梦媛的亲生父亲究竟是谁呢
    lerry
        2
    lerry  
    OP
       Apr 30
    @zq11211277
    其实是薛世纶,萧国成设计的,为了侮辱乔家。

    让 AI 直接读 1000w 字,现在根本不现实,我现在把各种东西都 api 化,AI 可以直接操作。
    About     Help     Advertise     Blog     API     FAQ     Solana     931 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 31ms UTC 22:06 PVG 06:06 LAX 15:06 JFK 18:06
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86