发新话题 回复该主题

采集列表正文时,未能采集正文内容 [复制链接]

1#
在采集文章列表及正文时,发现不能采集到正文内容,程序直接将标题赋值给了其他需要采集的正文变量,采集内容设置的xpath是正文的xpath,采集出来的全是与标题相同。




ces采集.vgp (, 下载次数:347)

测试脚本(2017/3/29 10:12:41 上传)

最后编辑jianlis 最后编辑于 2017-03-29 10:12:41
本主题由 管理员 老立 于 2017/3/29 10:44:48 执行 移动主题 操作
分享 转发
懂得多活的开
TOP
2#

采集正文,不能勾选“从当前循环元素中提取”复选框,请参考示例脚本和教程
TOP
3#

回复 2楼老立的帖子

那么,内容页的页面地址怎么同时提取呢,内容页面内是没有这个xpath的
懂得多活的开
TOP
4#

提取时在固定值那里输入浏览器变量{-Page.Url-}即可获取当前页的地址,如果还需要提取当前循环上的其他信息,可以再新建多一个提取数据的步骤,也就是说,循环里面有两个数据提取的步骤,一个提取循环上的列表数据,一个,提取内页里面的正文等数据。
TOP
5#

回复 4楼老立的帖子

好的,谢谢
懂得多活的开
TOP
发新话题 回复该主题