像http://epub.sipo.gov.cn/gjcx.jsp 这个网站,通过关键词检索能否遍历它数据库里面所有的项目?如果可以的话,这种网站的拖库是不是挺容易的?

1 arkilis Feb 7, 2015 但是你怎么知道这个是数据库中所有的内容呢。 拖库就是一点不剩给拖下来。拖:音调 一声 |
2 wdlth Feb 7, 2015 这个只能叫抓取、采集数据,真正的拖库不只是数据,还要有关系。 |
3 R4rvZ6agNVWr56V0 Feb 7, 2015 理论上是可以获取到所有专利文档数据的,但数据库中的表结构、关系你是“拖”不出来的。 |
4 professorz OP @arkilis 嗯,我发现了点bug,比如搜索1985年的数据,“只勾选发明公布”和“四项都勾选”两种情况下,得到的发明公布的数量不一样!奇怪~~ |
5 professorz OP @GeekGao 感觉上这种数据库好像没什么表关系。。。甚至4张表就能包含所有数据。。 |
6 R4rvZ6agNVWr56V0 Feb 7, 2015 @professorz 你跑题了,我是说他们的数据库本身,而不是如何设计这个系统。。。 |