XML语言的“站点图协议”来给服务器提供你的站点关于设计方面的信息。Google甚至给你提供Google站点图产生器,它可以很有趣的为你创建现成的Google站点图。
如果要满足下面几项要求,则使用Google站点图产生器是你最好的选择:
- 可以在网络服务器上运行Python2.2+脚本。
- 通过某些方式可以向网络服务器上传文件。
- 如果要使用access日志产生站点图,必须知道这些日志的编码方法。
开始时,需要有Google站点图产生器。因为我的示例站点建立在Linux服务器上,所以下载了产生器的“tar.gz”版本。我的主机支持运行Python脚本程序并且我使用的是Python 2.2.3版本。
将下载的命名成sitemap_gen-x.x.tar.gz文件放置于服务器的某个位置。我将下载的文件放在示例位置的根目录上。下一步,使用“gunzip”命令解压。
Gunzip –dc sitemap_gen-x.x.tar.gz | tar xvf
文件的内容将被解压到去掉“.tar.gz”后缀名的文件夹中。
在此文件夹中,找到example_config.xml文件 并将其拷贝到config.xml。编辑这个文件,注意下面几个必需(有些是可选)的参数。
- base_url基本_url(必须):你的站点的顶层URL,在我的例子中是http://www.allinvites.com。
- store_into存储信息(必需):路径和文件名将被写入到站点图中,在我的例子中是“/home/alowe/www/sitemap.xml.gz”,你不需要预先创建这个文件
- default_encoding默认编码(可选):默认值是UTF-8,如果你的系统上的URL和文件路径需要不同的编码方式,则改变这个值。
- verbose详细信息(可选):默认值是“1”,可以设置成0到3之间的任何数。0提供无诊断的输出,3提供重要的输出。
- url or urllist(url或urll列表)(可选):用这两个指令之一告诉站点图产生器那个URL应该包含到站点图中。可以在config文件中通过url指令单个列出每一个URL,或者可以使用urllist指令和指向一单独的包含所有需要的URL文本文件来列出所有的URL。在示例中我使用url指令来列出URL,在下文可以看到。如果你采用irllist指令,那么你需要在单独的文本文件中使用url指令。
- url指令包含有一个必需的参数:href.Href参数,正如你所希望的,是一个全路径,包含有你的域,你想要包括的URL。也可以使用可选的属性:changefreq, lastmod, 和 priority.