wordpress采集

时间:2024-10-15 17:43:49

1、安装wordpress,打开首页暂时空荡荡的只有默认的文章。

wordpress采集

2、进入wordpress仪表台,添加默认文章目录,根据网易的新闻分类,由于是演示,我们添加几个意思意思就行。

wordpress采集

3、我们去主题市场上搜索一个偏红色的,和网易门户稍微接近点的主题安装。

wordpress采集

4、打开EaSpider虚拟站长,点击连接网站,选择刚才安装的wordpress,数据库自动识别即可。

wordpress采集

5、点击创建采集任务,选择定向采集

wordpress采集

6、采集任务基本选项卡中只要填写任务名称,其他都使用默认设置。

wordpress采集

7、在浏览器中打开网易国内新闻:http://news.163.com/domestic/初步查看一下我们要采集的网页

wordpress采集

8、在文章列表提取选项卡中,填写任务首页URL,选取列表页位置。由于是新闻类网站,时效性要求较高,因为我们无需采集分页内容,点击实时监控列表首页URL,可以和网易新闻内容保持同步

wordpress采集

9、在快速网页选取工具中找到列表页所在位置。

wordpress采集

10、由于选取到的列表页中有一些我们不需要的URL,点击修正URL,选择保留URL,填写"f=dlist",只采集URL中包含这个的网页。

wordpress采集

11、切换到“二次加工&伪原创”选项卡中,点击随机抽取样本,添加一个实时翻译转换器,把中文翻译成英文内容,点击预览,查看转换后的效果。

wordpress采集

12、切换到“自动发布”选项卡,选择发布人和文章目录,其他使用默认设置即可。

wordpress采集

13、点击测试按钮,多测试几篇,看看是否还有需要改进的地方,如果觉得采集的效果可以了,点击确认,提交采集任务。

wordpress采集

14、打开任务开关,任务调度程序每个20秒会调俣觊鄄幼度一下所有任务列表,并判断是否需要运行采集任务。等待采集任务执行,可以查看采集效果和输出日志,在界面右下角有当前运行中的所有任务,可以随时关闭。

wordpress采集

15、右键刚才的采集任务,点击复制任务,快速添加“国际新闻"、”社会新闻“等其他栏目。

wordpress采集

16、采集任务会根据设定的频率定时去列表首页URL中抓取更新内容,实时监控会判断是否有更新的新闻,如果有则立刻抓取,转换成英文,并判断是否存在重复新闻,如果没有则立刻发布到自己的网站中。

wordpress采集

17、你可以自己稍微美化一下自己的wor蟠校盯昂dpress主题,让网页看上去更接近网易的风格,我们整个过程大概只用了5器皆阄诟分钟,就可以做成网易英文版。并且此后不需要任何工作量,只需要打开软件,就能让自己的网站每天与网易保持新闻同步,并且是100%属于自己的原创内容哦。

wordpress采集
© 手抄报圈