26.1.1 XPath helper 插件概述
xPath helper 是一款 Chrome 浏览器的开拓者插件,安装了 xPath helper 后就能轻松获取 HTML元素的 xPath,程序员就再也不须要通过搜索 html 源代码,定位一些 id 去找到对应的位置去解析网页了。
26.1.2 XPath helper插件功能先容

Google 插件 XPath Helper 可以支持在网页点击元素天生 xpath,全体抓取利用了 xpath、正则表达式、中间件、多线程调度框架(参考)。xpath 是一种构造化网页元素选择器,支持列表和单节点数据获取,他的好处可以支持规整网页数据抓取。
如果我们要查找某一个、或者某一块元素的 xpath 路径,可以按住 shift,并移动到这一块中,上面的框就会显示这个元素的 xpath 路径,右边则会显示解析出的文本内容,并且我们可以自己改动 xpath 路径,程序也会自动的显示对应的位置,可以很方便的帮助我们判断我们的 xpath 语句是否书写精确。
26.1.3 XPath helper 插件下载
你可以从 chrome 运用商店里找到 chrome 爬虫插件,如果你的 chrome 运用商店无法打开,你可以从我的网盘(对应书的配套工具)里获取(xpath-helper.crx)。
26.1.4 XPath helper 插件安装
1. 如果你能够打开 chrome 运用商店,并且可以找到 chrome 爬虫插件,那么直接点击“添加至 chrome”,如下图所示:
2 . 如果你的 chrome 运用商店无法打开,你从我的网盘或者其他路子得到了chrome 爬虫插件,那么就选择离线安装该插件。由于 chrome 爬虫插件同其他 chrome 插件一样都是 CRX格式的,详细的安装方法如下:
1)在 chrome 中新开一个窗口,输入:chrome://extensions/ 回车,打开运用管理器。
2)把 crx 文件拖到运用管理器界面里,松开鼠标,会弹出安装提示,点击确定安装就可以了。
3)重新启动浏览器,ctrl+shift+x 即可利用。
下面以腾讯社招网职位信息为例先容一下:
https://hr.tencent.com/position.php?&start=0