给若干未分类的小说 txt ,根据里面的关键词、词频、描写等自动划分至都市言情、玄幻仙侠等分类文件夹,再新建 tag 标签文件夹,把分类的小说放进去
下载的皇叔太多,15 来 G ,个人懒得写代码,就来问问有没现成的分类器可用
![]() | 1 wu67 2023-02-10 09:25:57 +08:00 既然是刘备, 别的不说, 我就问问怎么区分 ntr 和纯爱类好了 |
![]() | 2 cxsz 2023-02-10 11:06:10 +08:00 提供一个思路,爬一个小说站的书名和分类,然后匹配书名,套用它的分类 |
![]() | 3 givenge 2023-02-10 11:20:03 +08:00 皇叔给大伙分享一下 |
![]() | 4 ALLROBOT OP |
![]() | 5 MindMindMax 2023-02-10 12:58:26 +08:00 ntr 类的,一般有苦主心理描写,比如痛苦,目呲欲裂这类比较频繁的词语,分类有相关的词汇用于描述,也许决策树适合这场景?没做过这方面的分类器 --- 随机森林就行了,主要是你要收集到足够的语料特征然后亲自调教 lol |
![]() | 6 zoharSoul 2023-02-10 13:20:25 +08:00 顺便问下有没有提取小说目录的算法模型 |
8 dusu 2023-02-10 14:59:09 +08:00 via iPhone 把小说内容发给 chatgpt 让他给你从分类里选 |
![]() | 9 killva4624 2023-02-10 15:09:22 +08:00 让 chatgpt 先读一遍(不是 |
10 Ediacaran 2023-02-10 15:46:33 +08:00 via iPhone 在整理一批书,打算用词袋搞。有些书的分类是有的,可以用来做训练。 |
![]() | 11 huiyadanli 2023-02-10 16:00:29 +08:00 细说 15G (话说这量,你是要建站吧...) |
![]() | 12 sadfQED2 2023-02-10 16:20:30 +08:00 via Android 15G 资源?纯 txt 格式吗?能分享一下吗,我想拿来喂 ai ,看看能不能搞一个写小说的模型 |
![]() | 13 xwcs 2023-02-10 17:17:36 +08:00 15G 你是准备建站嘛,罗森都因为刘备文给进去了,小心点 |
![]() | 14 ALLROBOT OP @dusu @killva4624 chatgpt ,可真有意思,我怎么没想到呢,比自建模型省事多了 @huiyadanli @sadfQED2 这有啥,磁力搜索引擎能搜到 20G 以上的皇叔,别告诉我你们没有电子检索能力 @xwcs 怎么可能啊,自用的,jc 都懒得抓 |
![]() | 15 longyuzichen 2023-02-11 00:01:37 +08:00 链接发一下啊 |
![]() | 16 ALLROBOT OP @longyuzichen https://clg106.buzz/hash/ea906ba7d6fa138aa65e2fdb0a8db46c5fa42551.html |
![]() | 18 ALLROBOT OP @zoharSoul github 有开源阅读,具体算法可以找找作者问问 https://github.com/gedoor/legado |