在飞飞论坛上看到网友发的【linux下定时采集教程】,在本地测试了一下,效果很不错。
feifeicms2.8,feifeicms2.7都测试了,都能用。
只是配置文件中的网站后台路径不同。
我这里针对他的方法改进了一下。
改进后的文件下载地址,见文章底部。
1、用cfg.php文件替换了cfg.ini
cfg.ini文件如果服务器没限制,通过http://127.0.0.1/cfg.ini能够直接访问。
会导致网站的后台路径被暴露。
当然只要cfg.ini不被猜到放在哪这个问题不大。
2、将程序改成了能采集多个资源
他的这个采集教程只能采集一个资源。
大家一般会采集两个资源,qvod和bdhd吧。
3、新添加的采集权限的用户密码可以设置@$^&等等之类的
这个用处不大,呵呵
使用方法:
在使用程序前先要保证网站,在飞飞后台采集时是正常的。
1、在飞飞后台添加一个管理用户,只赋给这个管理员采集管理权限,其他权限不用。
比如我在后台添加一个管理用户为test 密码为test
2、下载压缩包,解压放在网站根目录。
里面有linux.php和cfg.php文件。
linux.php可以自己改个名字,什么乱七八糟的都可以,比如gemingcao.php?呵呵。
但是不要用符号咯,不然会很头疼的。
反正只要不容易被别人猜到就可以。
cfg.php的文件名就不要改了,用记事本或者Dreamweaver打开他。
"user_name" => "test",//在飞飞后台添加一个后台管理,只需要赋予采集管理权限 "user_pwd" => "test",//密码可以设置符号 "urlDomain" => "http://127.0.0.1", // 如http://127.0.0.1,最后不要加斜杠 "urlManage" => "http://127.0.0.1/admin.php", // 如 http://127.0.0.1/Admin/或者http://127.0.0.1/admin.php
下面我们就要用到第一步里面的用户名和密码了。
user_name,将test换成你第一步里面的用户名
user_pwd,将test换成你第一步里面的密码
urlDomain,你的网站地址,比如:http://www.gemingcao.com,这里记住,最后不要斜杠/。
urlManage,你的飞飞后台登陆地址,
feifeicms2.8的类似是http://qingqi99.com/admin.php
feifeicms2.7的类似是http://qingqi99.com/Admin/
urlCollect,采集地址,这里照抄了。
看上图,选择你想要采集的资源,然后【右击单击】采集当天,在弹出的右键菜单中选择【复制链接地址】。
http://127.0.0.1/index.php?s=Admin-Xml-Caijia-action-day-fid-21-xmlurl-http:||www.hakuzy.com|xml|maxresxml.asp?ac@videolist-h-24-reurl-http:||www.haozy.me|Data.asp?DataId=
然后粘帖到记事本中,应该类似上面这样的。
再替换cfg.php的urlCollect后面的链接。
一般选采集当天的链接就可以了,采集本周,采集所有什么的,太多了,程序运行时间太长超时会导致采集失败。
如果你要采集多个资源,就按上面的方法,复制多个采集当天的资源。
再一个一个替换cfg.php第二组中的urlCollect后面的链接。
添加计划任务:
Linux的WDCP控制面板添加计划任务,照抄了。
1.把cfg.php和linux.php(推荐改个文件名)文件放到根目录,我们直接访问http://127.0.0.1/linux.php
测试一下可以不可以返回正常的采集结果。如果返回正常就可以了。
2.添加计划任务,我相信想在国内的vps大多装的是WDCP控制面板吧,其他面板我就不介绍了,在WDCP里添加计划任务:
添加名为飞飞CMS自动采集的计划任务,按如下修改:
注意的是,执行程序就写刚才那2个文件存放的物理据对地址,如/www/dywangzhan/linux.php。保存后在点一下 中的“更新计划任务”就OK了。
好了,就这样就可以了。
- 相关文章
- 查看评论:(5)
【已经有5位大神发现了看法】
所以你说的if,echo这一句 可要可不要。
既然要输出,ereg_replace 这里就是过滤掉<meta
采集的那个文件最后的循环中:
if ($b) {
$con = ereg_replace("<meta http-equiv=\"refresh\" content=.;url=(.*)>", "#", $con);
}
echo $con;
这里,为什么要替换url为#号,为什么要输出这个$con 呢?
发表评论: