爬了某小说的网站,小说章节以不带 html 的形式直接存到数据库中,但是这样的话前端展示的时候才发现没有带格式,导致整个章节都是一个自然段没有空行。请问这种情况下怎么处理比较好呢?

爬了某小说的网站,小说章节以不带 html 的形式直接存到数据库中,但是这样的话前端展示的时候才发现没有带格式,导致整个章节都是一个自然段没有空行。请问这种情况下怎么处理比较好呢?
1 ipwx Jan 18, 2020 replace("\n", "<br/>") |
2 ipwx Jan 18, 2020 或者 "".join(["<p>{}</p>".format(line) for line in content.split("\n")]) |
3 opengps Jan 18, 2020 找找<br /> <p>标签,哪个适合用来当做分段分行符号,就腿硬替换成一咯提示的 ascii 换行控制符,等着回到前端时候在替换回对应的标签 |
4 duan602728596 Jan 18, 2020 via iPhone <pre></pre> |
5 cyheng OP 感谢,顺便问一下如果我前端要编辑的话是用富文本编辑器还是 textarea 比较好?富文本编辑器文本都是 html,这样就和数据库里面的章节不一致。 |
6 ClericPy Jan 18, 2020 例子呢? 换行什么的, 用 lxml 也可以实现类似 JS 的 innerText 方法是带换行的吧 |
7 ClericPy Jan 18, 2020 前端可编辑的话, textarea 可以, 也可以像 4 楼说的用 pre code, 带上 Editable 属性就行了 https://developer.mozilla.org/zh-CN/docs/Web/HTML/Global_attributes/contenteditable |
9 annielong Jan 18, 2020 看爬取数据格式了,一般都会保留基本的排版 html,除非过滤的所有的 html 标签 |
10 redam Jan 18, 2020 white-space: pre-wrap; |
11 imicksoft Jan 18, 2020 aardio 有 string.html 类库,可以 html 转 text,也可以 text 转 html py 没有这样的类库么 |
13 cyheng OP 爬取的时候没有爬基本的 html,只爬了 text |
14 JCZ2MkKb5S8ZX9pq Jan 18, 2020 爬了人家的网站,为啥要重新做成前端?交作业? |
15 cyheng OP @JCZ2MkKb5S8ZX9pq 爬了的话总是要展示的吧,不然我爬它干嘛? |
16 JCZ2MkKb5S8ZX9pq Jan 18, 2020 数据分析,做语言分析模型,交作业,用途很多的。 但如果是复制他人站点,盗版内容的话,就不合适了。所以想确认下。 |
17 guolaopi Jan 19, 2020 C#有 Html.Raw("")方法渲染字符串为 html。。搜一下有没有库吧 |
18 dengwen168 Apr 27, 2020 我想请问一下楼主这个问题解决了没有? 我也所到同样的问题,有时候从新闻源里得到的文章都是没有分段符的,我输出的时候全部都成了一段,也正在找方法。 |
19 cyheng OP @dengwen168 前面几楼都回答得很好啊,看你的选择吧。我是用 pre 。 |
20 dengwen168 May 26, 2020 @cyheng 那就是说,采集入库的时候要将 p 标签,或者换行标签保留对吧? |