实用的Web脚本编程技巧与应用
1. 网站内容变更跟踪脚本
在Web开发和监控中,跟踪网站内容的变化是一项重要的任务。有一个名为changetrack的脚本可以实现这一功能。
1.1 脚本代码
else # Just showing the differences on the screen is ugly. Solution? diff $sitearchive/$fname $sitearchive/${fname}.new fi # Update the saved snapshot of the website. mv $sitearchive/${fname}.new $sitearchive/$fname chmod 755 $sitearchive/$fname exit 01.2 工作原理
该脚本需要两个参数:被跟踪网站的URL(必须是完整的以http://开头的URL)和接收更新网页的电子邮件地址。如果使用连字符-作为电子邮件地址,差异输出将显示在屏幕上。
- 脚本会抓取网页内容,并与上一次检查的内容进行比较。
- 如果网站有变化,新的网页将被发送到指定的收件人,并进行一些简单的重写,以确保图形和href标签正常工作。
- 使用lynx检索指定网页的源代码,然后sed执行三种不同的翻译:
-