服务器 频道

网管实战:快速组建Linux集群

    【IT168 专稿】集群是最近几年中最为主要的一种 HPC 硬件:集群(cluster) 就是一组 MPP 的集合。集群中的处理器通常被称为 节点,它具有自己的 CPU、内存、操作系统、I/O 子系统,并且可以与其他节点进行通信。现在 Linux 集群在很多领域都已经变得非常流行了。目前有很多地方都使用常见的工作站运行 Linux 和其他开放源码软件来充当集群中的节点。

一、搭建linux集群

    现在就开始动手搭建和配置一个简单的高性能计算集群系统。初始方案是使用两台PC(系统的具体结构如图1所示),CPU为Pentium D 805,内存为 512MB,用1000Mbps交换机连接,整个硬件环境可以说是再普通不过了。操作系统采用的是Red Hat Enterprise Linux 4.0,该方法对于红旗Linux、Fedora Linux和SuSE等发布版本均可实现。


    图1系统的具体结构

    1.安装运行环境软件

    关于LAM MPI的软件包,请访问网站http://www.lam-mpi.org/进行下载。这里使用的是软件包7.1.4版本
同时,为了最终程序的正常运行,需要libf2c软件包,因为其中含有一些Fortune 77程序的共享库,这里的可执行文件是用Fortune语言编写的。
#wget http://www.lam-mpi.org/download/files/lam-7.1.4-1.i586.rpm #wget ftp://ftp.pbone.net/mirror/www.whiteboxlinux.org/whitebox/4/en/os/x86_64/WhiteBox/RPMS/libf2c-3.4.3-9.EL4.i386.rpm #rpm -ivh libf2c-3.4.3-9.EL4.i386.rpm #rpm -ivh lam-7.1.4-1.i586.rpm
    2.修改/etc/hosts文件

    修改服务器上的/etc/hosts文件,确保由主机名字到IP地址的正确翻译。
127.0.0.1 localhost localhost.localdomain 192.168.0.254 server1.example.com server1 192.168.0.1 station1.example.com station1 192.168.0.2 station2.example.com station2
    3.配置NFS服务器

    (1)安装软件包nfs-utils-1.0.5-3。
    (2)编辑/etc/exports文件如下,共享richard的home目录为可读可写:
#cat /etc/exports /home/richard 192.168.0.0/255.255.255.0(rw,sync)
    (3)启动服务,使用“showmount”命令来检查结果:
#showmount -e server1 Export list for server1: /home/richard 192.168.0.0/255.255.255.0
    4.配置NIS服务器

    (1)安装软件包yp-tools-2.8-1、ypbind-1.12-1和ypserv-2.8-1。
    (2)编辑/etc/sysconfig/network文件,加入NISDOMAIN一行:
NETWORKING=yes HOSTNAME=server1.example.com NISDOMAIN=notexample
    可以用“domainname”命令来验证结果或直接进行修改。
    (3)编辑/var/yp/Makefile文件,修改all一行为:
all : passwd group
    (4)启动服务ypserv和yppasswdd。
    (5)使用“/usr/lib/yp/ypinit -m”命令初始化数据库,并可在/var/yp目录下使用“make”命令更新数据库。

    5.客户端的配置

    下面介绍客户机station1、station2的配置。首先需要安装运行环境软件包lam和libf2c

    (1)配置NIS客户端
    在客户端运行“authconfig”命令,会出现如图2所示窗口。

     图2 运行“authconfig”命令设置NIS客户端

    (2)配置autofs自动加载nfs
    编辑/etc/auto.master文件如下:
#cat /etc/auto.master /home /etc/auto.misc --timeout=60
    并且编辑/etc/auto.misc如下:
#cat /etc/auto.misc Richard -rw,soft,intr 192.168.0.254:/home/richard
    (3)重启计算机
#reboot
    6 。添加一个用户

    由于LAM软件不能在root账号下运行,所以创建一个名为cjh的普通用户账号。
0
相关文章