写在最前面:插件有两个文件是加密的,里面是爬虫写法和正则写法,如果你害怕不安全,可以自行解密文件,可能需要5块钱左右。
PHP解密网站 http://www.yunlu99.com/
如果在线充值失败,请加站长OO/微信。让站长手动为你充值。,上传文件,即刻解密。
说明:插件首发时间2018年。一直免费,未收费过,请放心使用。
采集插件是通过PHP+正则来远程获取目标网页内容,经过本地PHP+正则规则解析处理后存储到服务器的数据库内。
PHP获取整页源码。PHP提取指定内容。正则提取指定内容,这些需要慢慢学,不推荐你了解。很麻烦的。
采集规则与采集界面分离,编辑人员只需了解( [内容] 提取一切 [sky] 不要一切),只需选中自己想要采集的文章列表,就可以像发布文章一样,轻松地完成数据采集操作。
第一步:下载附件的插件。解压后-找到并将 sky_collection 文件夹及里面的所有文件,上传到
plugin 目录
第二步:网站后台>插件>找到xiuno天空内容采集并安装
第三步:采集>添加采集
比如以 https://www.186317.com/lingyi/1/
1 主要看网页源码
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
2 网址配置
页码使用以下字符做为通配符。
(*)
3 如果获取内容带首页各种分类等
请在>网址配置>网址中必须包含
分类独家字符(比如 lingyi ) 就不会有这些无意义内容
获取网址
源码(从 <ul class="clearfix"> 到 <div class="pagebar ta-c"> )
//列表源码
<ul class="clearfix">
<li class="post-list clearfix mb15">
<a href="https://www.186317.com/lingyi/7227.html" target="_blank"><span class="img-box" data-ratio="16:16"><img src="https://www.186317.com/zb_users/theme//tx_freecms/include/pic.png" alt="点到鬼"></span></a>
<li class="post-list clearfix mb15">
<a href="https://www.186317.com/lingyi/7182.html" target="_blank"><span class="img-box" data-ratio="16:16"><img src="https://www.186317.com/zb_users/theme//tx_freecms/include/pic.png" alt="演戏"></span></a>
</ul>
//分页源码了
<div class="pagebar ta-c">
<a href="https://www.186317.com/lingyi/"><span class="page">‹‹</span></a>
<span class="page now-page">1</span>
以 https://www.186317.com/lingyi/7227.html
标题源码
<title>点到鬼_灵异鬼故事_鬼故事之家</title>
标题规则
<title> [内容]</title>
就可以提取
点到鬼_灵异鬼故事_鬼故事之家
过滤选项
鬼故事之家 [sky]
就可以让 鬼故事之家 不显示
内容源码
<div class="tx-text f-16 mb15">
<p>灵异鬼故事《点到鬼》讲述了点名,大家应该都知道是怎么回事吧。简单的说就是查下人数,看看是不是都齐了,还差谁没有来,基本总在管理较多人的集体中,像是学校,一些企业单位什么的。如果是一个人推着一个小车,去卖煎饼果子,自然不需要点名,鬼段子分享:钥匙,一名保险推销员下班后去超市买过圣诞节送给女友的礼品,他最终买的是一个刻有月亮图案的纯银挂件。出超市后,他看见一个小姑娘在路边哭泣,就过去看怎么回事,突然发现那个小姑娘胸前有一串钥匙。第二天,警方发现小姑娘全身cl地死在街边,试分析原因。您看懂了吗?阅读更多精彩短篇鬼故事请随时关注 鬼故事网站灵异鬼故事栏目!</p></div>
内容规则
<div class="tx-text f-16 mb15"> [内容]</div>
就可以直接提取到
<p>灵异鬼故事《点到鬼》讲述了点名,大家应该都知道是怎么回事吧。简单的说就是查下人数,看看是不是都齐了,还差谁没有来,基本总在管理较多人的集体中,像是学校,一些企业单位什么的。如果是一个人推着一个小车,去卖煎饼果子,自然不需要点名,鬼段子分享:钥匙,一名保险推销员下班后去超市买过圣诞节送给女友的礼品,他最终买的是一个刻有月亮图案的纯银挂件。出超市后,他看见一个小姑娘在路边哭泣,就过去看怎么回事,突然发现那个小姑娘胸前有一串钥匙。第二天,警方发现小姑娘全身cl地死在街边,试分析原因。您看懂了吗?阅读更多精彩短篇鬼故事请随时关注 鬼故事网站灵异鬼故事栏目!</p>
特别说明
[内容]
可以提取一切内容
[sky]
前后接字符(支持正则),代表去掉不显示
正则请看
<a( [^>]")> [sky]
</a> [sky]
让所有的<a 内容失效
^ 正则开头
保存后>点击>测试
无错就
关于 定时发布
需要你自行挂计划任务才可以
http://你的域名/skycollection-post.htm
最后说明
高级设置 图片下载-默认是下载图片 推荐改成不下载图片哦
[内容] [sky] 它们的前后都支持任意代码,都支持正则
正则写法教程 http://hm46148.j.h57.site/?thread-104.htm
正则在线测试
https://deerchao.cn/tools/wegester/
这是可以提取任意网站内容的(视频/图/文)啥都可以的
<html>[内容]</html>
喜欢的可以试试哈,很简单的
最后再送大家一个 笑话段子采集规则
网址配置
https://m.xiaohua.com/duanzi?page=(*)
获取网址 从
<section class="index-content">
到
<div id="Pager" class="pagination-wrap">
内容规则:匹配规则
<div class="grid2"><p class="f36 fonts">[内容]</div>
演示网址
http://hm46148.j.h57.site/?forum-7.htm
演示截图
最后再给大家一个红牛电影采集规则
https://www.hongniuzy1.com/?m=vod-type-id-1-pg-(*).html
<div class="xing_vb">
<div class="pages" style="margin-bottom:10px;">
<div id="play_1">[内容]</div>
演示截图
最后于 2021-11-16
被大佬编辑
,原因: