数据库中有 10w 条没有分类的文章,含有标题,内容(文本),创建时间等等字段
现在需要将这 10w 数据分到政策,行情,军事等等 7 个分类下
有没有好的解决方案

数据库中有 10w 条没有分类的文章,含有标题,内容(文本),创建时间等等字段
现在需要将这 10w 数据分到政策,行情,军事等等 7 个分类下
有没有好的解决方案
1 maemolee Dec 3, 2018 对七个分类预设一批关键词,去匹配?我瞎说的,抛砖引玉。 |
2 xiaoxinshiwo Dec 3, 2018 分表 或者 es |
3 gsscsd Dec 3, 2018 via Android tfidf+机器学习多分类或者词向量+深度学习多分类 |
4 banks0913 Dec 3, 2018 scikit-learn,利用朴素贝叶斯分类器训练模型 |
5 to Dec 3, 2018 via Android 小批量训练个模型就好了 |
6 yangzhezjgs Dec 3, 2018 via Android 文本分类了解一下 |