服务器 频道

AltaVista 康柏服务器配置指南


   一、性能规划
  
     信息搜集和询问都需要网络资源,AltaVista Search Intranet属于系统密集型应用。
  
   搜索站点性能取决于下面四个因素:
  
   搜索站点所包含的信息量
   搜索站点所处理的询问数
   网络基础设施
   共驻内存应用
  
     所有搜索站点都为资源密集型,因此,服务器必须经过正确配置,以全面支持所有加载的任务。
  
     这里所提供的信息列出了容量规划的原则,其目的是通过使用下列信息帮助您评估要求,并使您顺利实施第一次AltaVista搜索软件的安装工作,具体内容如下所示:
  
   一套入门的"经验法则"原则
  
   各种不同实施方案的代表性配置
  
   性能统计
  
   基本操作系统和网络要求
  
     还应根据发展的需要进行规划,因为用户会不断要求您将新的信息资源添加到以AltaVista搜索软件为动力的网站中,以供他们使用。
  
   二、主要系统处
  
     信息搜集和询问都需要网络资源。AltaVista Search Intranet属于系统密集型应用。AltaVista Search Intranet软件不断地运行于多个不同的线程进程之上。所有这些工作都需要CPU处理能力、RAM存储和磁盘存储。
   注意事项:
  
   Crawler和文件收集器处理完成信息收集工作。CPU处理能 力、RAM、磁盘存储和网络容量在本操作中会有所消耗。
  
   在系统磁盘和RAM上创建和存储索引。为尽快对询问作出响应,需要更大的RAM容量。
  
   所有不是文本或HTML格式的收集文件都会进行文档转换。这个操作属于CPU和内存密集型。所需的资源级别 取决于需要转换的PC应用文件数量。接收用户询问,然后运行,并将其格式化为HTML页,最后发送给用户。 将索引保存在RAM中有利于获得最高的性能。
  
   三、配置条件
  
   (一)决定因素:
  
   搜索站点的效率取决于下述四个条件:
  
   网络基础设施
  
   可用的RAM和磁盘存储
  
   CPU
  
   操作系统
     交换空间,也称为虚拟内存,可在内存密集型活动中增大系统的RAM。文件转换、信息搜集和询问高峰期都是典型的内存密集型操作。
   以下是各种因素的重要性:
  
   1. 网络基础设施
  
     搜索服务器的性能取决于网络。因为搜索服务器在网络上收集信息,而用户也是通过网络访问新的搜索站点,所以网络基础设施会直接影响到信息的收集和询问流程。
  
   以下几点是在规划过程中所必须牢记的关键问题。
  
   AltaVista Search服务器为收集新的和更新的信息,会在网络上发出线程,线程的数量会受到网络带宽的影响。
  
   信息源数量和一般网络流量负载也会影响信息收集的性能。
  
   以AltaVista Search为动力的新型网站的访问用户数也会增加网络负载。
  
   满意的用户会带来更多的用户。最初的用户会将他们对搜索网站的意见告诉他们的同事、合作伙伴及客户。这就是 说,询问流量会随着时间的推移而稳步增长。
  
   防火墙需要代理服务器和口令,这将影响吞吐量。
  
   Crawler流量经验法则:假设搜索站点每秒向网络放入10 页的额外流量。如果平均每页包含5,000字节的材料,则 每秒附加了50,000字节的网络流量。
  
   2. 可用的RAM和磁盘存储
  
   RAM和磁盘要求息息相关。
   增加内存和磁盘容量,是提高搜索站点性能最容易、最常见和最有效的方式。在RAM 和磁盘存储方面的目标是:
  
   (1) 通过安装足够的RAM来容纳足够的索引分区,从而减少虚拟内存分页。询问速率直接影响到指定索引大小所 需的RAM数量。
   (2) 具有足够的磁盘存储,能够将AltaVista Search索引与收集和转换过程中所创建的临时文件永久地保存在一起。
  
   根据经验,假设RAM和磁盘存储信息源:
   (1) 假设每个HTML和文本页包含5,000字节的原文材料。
   (2) 假设PC应用文件和PDF以及PS文件的每页至少包含 10,000字节的原文材料。
  
   假设RAM和磁盘存储:
   (1) AltaVista Search索引大约占要检索整体信息的30%。
   如果要检索1G字节的网页,可以保守地估计AltaVista Search Intranet索引的大小为300M。
   (2) 转换操作充分地提高了RAM要求。
   如果搜索站点会定期收集PDF、PostScript和PC应用文件,则将前表所列的RAM数量加倍。
  
   3. CPU
  
     AltaVista Search Intranet软件利用了多CPU系统中的处理器。它为处理器密集型任务提供了更多的能力和可伸缩性,如文件转换等。
  
   4.操作系统
  
     AltaVista Search Intranet软件可在Microsoft NT、Tru64 UNIX上运行,但各平台间有差异。运行于NT服务器上的AltaVista Search Intranet可以直接搜索基于Novell或Microsoft的文件服务器目录的文件。但Tru64 UNIX平台的AltaVista Search可通过Web Sever的URL映射到文件的目录,从而达成搜索服务器内的文件。
  
   (二)其它因素:
  
   还应考虑的条件包括:
  
   访问权限-搜索站点需要得到进入保护网站、服务器的许可。
   备份需求-搜索站点是重要资产,需要定期备份。
   信息收集-分全天候信息收集或非高峰信息收集,可轻松控制AltaVista Search Intranet在何时、以多快的速度 在网络上收集信息。
   镜像系统-镜像系统使搜索站点可以安装在其它位置,这有助于解决其他地区用户可使用与他们相近的搜索引擎。
   热备份-可以瞬间切换到在线备份系统。这样,搜索站点就能实现永不停顿。
   (三)满足大型伸缩需求的配置提示
  
   1. 可以在同一个UNIX服务器上装载多个搜索站点。
  
   每个搜索站点可以特定的索引信息。
  
   每个搜索站点可以具有各自的信息收集日程。
  
   多个搜索站点能够纳入到通用索引中,而不必考虑收集日程。
  
   2. 将AltaVista Search Intranet服务器处理分散到多台服务器,例如:
  
   可以使用适当装备的工作站处理询问流量,较大的服务器可以进行文档转换和检索操作。
  
   可以使用两台或多台服务器处理查询请求、搜索信息和检索信息,使用RAID阵列来进行索引。
  
   3. AltaVista Search Intranet软件在使用64位平台时,能获得强大的伸缩优势。
  
   32位平台能够伸缩至1千万检索页或20亿检索字。
  
   64位平台没有检索页或检索字限制。
0
相关文章