关于 lxml.HTML 相关的问题
<dl class="dl-horizontal ip_list"> \n <dt>外观与性状:</dt> <dd><b>透明无色至非常略黄色液体</b></dd> \n <dt>密度:</dt> <dd><b>1.027 g/mL at 25 °C(lit.)</b></dd> \n <dt>熔点:</dt> <dd><b>187°C</b></dd> \n <dt>沸点:</dt> <dd><b>187 °C(lit.)</b></dd> \n <dt>闪点:</dt> <dd><b>200 °F</b></dd> \n <dt>折射率:</dt> <dd><b>n20/D 1.458(lit.)</b></dd> \n <dt>蒸汽压:</dt> <dd><b>0.216mmHg at 25°C</b></dd> \n <dt>蒸汽密度:</dt> <dd><b>4.02 (vs air)</b></dd> \n <dt>存储条件/存储方法:</dt> <dd><b/> <p> \n\t\t\t\t \t</p> <div>储存于阴凉、通风的库房。远离火种、热源。保持容器密封。应与氧化剂分开存放,切忌混储。配备相应品种和数量的消防器材。储区应备有合 \n <dt>稳定性相关:</dt> <dd><b/> <p> \n\t\t\t\t \t</p> <p>避免与氧化物接触。</p>\t\t\t\t </dd> \n <dt>其它信息:</dt> <dd><b/> <p> \n\t\t\t\t \t</p> <p>1.      性状:未确定</p> <p>2.      密度(g/mL,20℃):1.027</p> <p>3.      相对蒸汽密度(g/mL,空气=1):4.02</p> <p>4.      熔点(ºC):<-70</p> <p>5.      沸点(ºC,常压):187</p> <p>6.      沸点(ºC, kPa):未确定</p> <p>7.      折射率:1.458</p> <p>8.      闪点(ºC):93</p> <p>9.<     比旋光度(º):未确定</p> <p>10.   自燃点或引燃温度(ºC): 未确定</p> <p>11.   蒸气压(mmHg,20ºC):0.4</p> <p>12.   饱和蒸气压(kPa, ºC):未确定</p> <p>13.   燃烧热(KJ/mol):未确定</p> <p>14.   临界温度(ºC):未确定</p> <p>15.   临界压力(KPa):未确定</p> <p>16.   油水(辛醇/水)分配系数的对数值:未确定</p> <p>17.   爆炸上限(%,V/V):未确定</p> <p>18.   爆炸下限(%,V/V):未确定</p> <p>19.   溶解性:未确定</p>\t\t\t\t </dd> \n\t \n </div> \n</dd> </dl> 这是一个 html 格式 正常我用 //div[@id='phyChem']/h2[text()='物化性质']../div[@class='ip_box']/dl//dt 能拿到 11 个 dt 标签 但是用 //div[@id='phyChem']/h2[text()='物化性质']../div[@class='ip_box']/dl/dt 只能拿到 9 个 dt 标签 请问这个问题是因为什么原因呢?是不是 lxml 的一个 bug 呢?
1 xiaxichen OP 已经找到问题了 此贴终结。我犯傻气了 |