[分享]飞飞feifeicms定时自动采集程序(适用2.8,2.7)

2013-10-16飞飞CMS8620

在飞飞论坛上看到网友发的【linux下定时采集教程】,在本地测试了一下,效果很不错。

feifeicms2.8,feifeicms2.7都测试了,都能用。

只是配置文件中的网站后台路径不同。


我这里针对他的方法改进了一下。

改进后的文件下载地址,见文章底部。

1、用cfg.php文件替换了cfg.ini

cfg.ini文件如果服务器没限制,通过http://127.0.0.1/cfg.ini能够直接访问。

会导致网站的后台路径被暴露。

当然只要cfg.ini不被猜到放在哪这个问题不大。

2、将程序改成了能采集多个资源

他的这个采集教程只能采集一个资源。

大家一般会采集两个资源,qvod和bdhd吧。

3、新添加的采集权限的用户密码可以设置@$^&等等之类的

这个用处不大,呵呵


使用方法:

在使用程序前先要保证网站,在飞飞后台采集时是正常的。

1、在飞飞后台添加一个管理用户,只赋给这个管理员采集管理权限,其他权限不用。

比如我在后台添加一个管理用户为test 密码为test

飞飞后台添加管理员

飞飞后台添加管理员权限


2、下载压缩包,解压放在网站根目录。

里面有linux.php和cfg.php文件。

linux.php可以自己改个名字,什么乱七八糟的都可以,比如gemingcao.php?呵呵。

但是不要用符号咯,不然会很头疼的。

反正只要不容易被别人猜到就可以。

cfg.php的文件名就不要改了,用记事本或者Dreamweaver打开他。

	"user_name" => "test",//在飞飞后台添加一个后台管理,只需要赋予采集管理权限
	"user_pwd" => "test",//密码可以设置符号
	"urlDomain" => "http://127.0.0.1", // 如http://127.0.0.1,最后不要加斜杠
	"urlManage" => "http://127.0.0.1/admin.php", // 如 http://127.0.0.1/Admin/或者http://127.0.0.1/admin.php

下面我们就要用到第一步里面的用户名和密码了。

user_name,将test换成你第一步里面的用户名

user_pwd,将test换成你第一步里面的密码

urlDomain,你的网站地址,比如:http://www.gemingcao.com,这里记住,最后不要斜杠/。

urlManage,你的飞飞后台登陆地址,

feifeicms2.8的类似是http://qingqi99.com/admin.php

feifeicms2.7的类似是http://qingqi99.com/Admin/

urlCollect,采集地址,这里照抄了。

飞飞后台复制采集链接地址

看上图,选择你想要采集的资源,然后【右击单击】采集当天,在弹出的右键菜单中选择【复制链接地址】。

http://127.0.0.1/index.php?s=Admin-Xml-Caijia-action-day-fid-21-xmlurl-http:||www.hakuzy.com|xml|maxresxml.asp?ac@videolist-h-24-reurl-http:||www.haozy.me|Data.asp?DataId=

然后粘帖到记事本中,应该类似上面这样的。

再替换cfg.php的urlCollect后面的链接。


一般选采集当天的链接就可以了,采集本周,采集所有什么的,太多了,程序运行时间太长超时会导致采集失败。

如果你要采集多个资源,就按上面的方法,复制多个采集当天的资源。

再一个一个替换cfg.php第二组中的urlCollect后面的链接。


添加计划任务:

Linux的WDCP控制面板添加计划任务,照抄了。

1.把cfg.php和linux.php(推荐改个文件名)文件放到根目录,我们直接访问http://127.0.0.1/linux.php

测试一下可以不可以返回正常的采集结果。如果返回正常就可以了。

2.添加计划任务,我相信想在国内的vps大多装的是WDCP控制面板吧,其他面板我就不介绍了,在WDCP里添加计划任务:

wdcp计划任务

添加名为飞飞CMS自动采集的计划任务,按如下修改:

wdcp添加飞飞自动采集计划任务

注意的是,执行程序就写刚才那2个文件存放的物理据对地址,如/www/dywangzhan/linux.php。保存后在点一下  中的“更新计划任务”就OK了。

wdcp更新计划任务

好了,就这样就可以了。


文件下载地址:飞飞feifeicms定时自动采集程序(适用2.8,2.7)

关闭

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开微信扫一扫,即可进行扫码打赏哦

  • 相关文章
  • 查看评论:(5)
【已经有5位大神发现了看法】

你好  1970-01-01 08:33:34 回复该评论
还有,有时候可以采集成功,有时候又不行,就是采集到一半就断开了,请教是什么原因呢?
革命草  1970-01-01 08:33:34 回复该评论
这里的主要目的是输出当前采集的url,
所以你说的if,echo这一句 可要可不要。
既然要输出,ereg_replace 这里就是过滤掉<meta
你好  1970-01-01 08:33:34 回复该评论
有一事请教:
采集的那个文件最后的循环中:
if ($b) {
$con = ereg_replace("<meta http-equiv=\"refresh\" content=.;url=(.*)>", "#", $con);
}
echo $con;
这里,为什么要替换url为#号,为什么要输出这个$con 呢?
菜菜爱电影  1970-01-01 08:33:34 回复该评论
貌似不行
革命草  1970-01-01 08:33:33 回复该评论
飞飞1.9还要修改飞飞程序,去掉验证码,不然不能登陆

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

支付宝

微信