利用网络与邮件进行脚本操作
1. 使用 Lynx 访问网络数据
在进行 shell 脚本编程时,互联网可能并非首先会想到的元素。不过,有一些实用工具能让你在 shell 脚本中轻松访问网络及其他网络设备的数据。Lynx 就是这样一款工具,它是一个基于文本的浏览器,由堪萨斯大学的学生于 1992 年创建,几乎和互联网本身一样古老。
1.1 Lynx 简介
由于 Lynx 是基于文本的,它允许你直接从终端会话浏览网站,用 HTML 文本标签替代网页上精美的图形。这意味着你几乎可以在任何类型的 Linux 终端上浏览互联网。Lynx 使用标准键盘键在网页上导航,链接以高亮文本显示,使用右箭头键可以跟随链接进入下一个网页。
Lynx 还有一个很棒的功能,它可以将网页的文本内容输出到标准输出(STDOUT),这对于挖掘网页中的数据非常有用。
1.2 安装 Lynx
尽管 Lynx 有些年代了,但它仍在积极开发中。目前最新版本是 2010 年 6 月发布的 2.8.8 版本,且还有新版本正在开发。由于它在 shell 脚本程序员中很受欢迎,许多 Linux 发行版在默认安装中就包含了 Lynx。
如果你使用的系统没有预装 Lynx,可以检查发行版的安装包,很可能能在那里找到并轻松安装。如果发行版不包含 Lynx 包,或者你想要最新版本,可以从 lynx.isc.org 网站下载源代码,然后自己编译(前提是你的 Linux 系统已经安装了 C 开发库)。
需要注意的是,Lynx 在 Linux 中使用 curses 文本图形库,大多数发行版默认安装了这个库。如果你的系统没有安装,在编译