宸逸数据入库接口 https://www.xunruicms.com/shop/app/579.html
火车头不管是以前还是现在都是比较吃香的一个采集工具,有用了好久,觉得这个软件还是没有被淘汰,特别是对于那些喜欢做网站然而不喜欢发文章的seoer们,他们对于这个也是非常的熟悉,下面来看看具体的操作:
提示:采集不限网页,不限内容;分布式采集系统,提高效率;支持PHP和C#插件扩展,方便修改处理数据。
直接找到下载地方进行下载
直接注册一个账号,在登陆
在程序主界面中,点击“新建”下拉箭头,从中选择“任务”项。
在弹出的窗口中,输入“任务名”,同时点击“起始网址”栏目右侧的“添加”按钮。
接下来就极为重要的一步,就是对要进行采集的网站进行分板,对所采取的网站中各片文章的URL进行综合分析并找出规律,最后按如图进行填写。
然后切换至“第二步:采集内容规则”选项卡中,我们需要对网页内容进行分板。在此以“搜狗浏览器”为例,右击要进行分析的网页,从弹出的菜单中选择“审查元素”项。
在“开发式模式”界面中,点击“选择页面中的一个元素去透视”按钮,接着点击“标题”内容,此时就可以在“开发者”窗口中显示标题所对应的标签,此例为“h2"。
接下来在”采集内容规则“界面中,点击“添加”按钮来添加“标题”项,或者直接双击“标题”项进行修改。在弹出的界面中,勾选”前后截取“,将设置前后辍分别为
利用同样的方法添加其它采集内容的规则。
规则设置好之后,测试一下内容是否获取正常
接下来就是设置入库方式了