赛门铁克VCS(Veritas Cluster Server)双机日常管理

来源:互联网 发布:马油扫码软件 编辑:程序博客网 时间:2024/05/22 11:30

1. 查看VCS版本及License信息

PSDB01:~ # vxlicrep Symantec License Manager vxlicrep utility version 3.02.51.010Copyright (C) 1996-2010 Symantec Corporation. All rights reserved.Creating a report on all VERITAS products installed on this system -----------------***********************-----------------   License Key                         = XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-X   Product Name                        = VERITAS Cluster Server   Serial Number                       = XXXX   License Type                        = PERMANENT   OEM ID                              = 2006   Site License                        = YES   Editions Product                    = YES Features :=    Platform                            = Unused                               Version                             = 5.1                                   Tier                                = Unused                                Reserved                            = 0    Mode                                = VCS                                   CPU_TIER                            = 2   VXKEYLESS                           = Enabled

2. VCS集群编号及心跳网卡设置

PSDB01:~ # lltstat -l LLT link information:link 0  eth10 on ether hipri        mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6        txpkts 67688788  txbytes 1843243673        rxpkts 76679165  rxbytes 1360585331        latehb 0  badcksum 0  errors 0link 1  eth9 on ether hipri        mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6        txpkts 67689522  txbytes 1843879628        rxpkts 276962155  rxbytes 1467872503        latehb 0  badcksum 0  errors 0link 2  eth8 on ether lowpri        mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6        txpkts 21897078  txbytes 1072847300        rxpkts 222319811  rxbytes 1191109452        latehb 0  badcksum 0  errors 0PSDB01:~ # cat /etc/llttab set-node PSDB01set-cluster 117link eth10 eth-80:fb:06:35:b8:9f - ether - -link eth9 eth-80:fb:06:35:b8:a1 - ether - -link-lowpri eth8 eth-80:fb:06:35:b8:a0 - ether - -PSDB01:~ # lltstat -nLLT node information:    Node                 State    Links   * 0 PSDB01            OPEN        3     1 PSDB02            OPEN        3
说明:我们这里使用了3张网卡用于心跳。如果lltstat查看时,links数量不够,那么就有可能是有网络故障,而我碰到最多是由于网卡在down状态,ifup一下网卡即可。

3. 查看VCS双机状态

RMCDB02:~ # hastatus -sum-- SYSTEM STATE-- System               State                Frozen              A  RMCDB01              RUNNING              0                    A  RMCDB02              RUNNING              0                    -- GROUP STATE-- Group           System               Probed     AutoDisabled    State          B  RCS_DB_SG       RMCDB01              Y          N               ONLINE         B  RCS_DB_SG       RMCDB02              Y          N               OFFLINE      

4. 启动、停止VCS集群

(1)启动时,如果是两个节点的集群,那么需要在每个节点上,用root用户执行:hastart,然后使用hastatus来查看启动过程中资源的状态信息

(2)停止时,只需要在其中一个节点上,使用root用户执行:hastop -all,同样是使用hastatus来查看状态,这个需要在每个节点上确认VCS已经停止完毕

注意:不管是启动,还是停止,VCS的日志是一定要查看,尤其是启动时,可以帮助排查启动过程中的问题。默认的VCS日志文件:

/var/VRTSvcs/log/engine_A.log

5. 冻结、解冻资源组

这是我经常使用的。何谓冻结,通俗的来说,就是让VCS暂时不管理集群,即使监控到有节占上资源组状态不正确,也不会发生切换或重新拉起操作。在维护中经常使用到,比如:oracle数据库打补丁、重启监听之类。

      <strong>冻结双机:</strong>RMCDB02:~ # hagrp -freeze RCS_DB_SGRMCDB02:~ # hastatus -sum-- SYSTEM STATE-- System               State                Frozen              A  RMCDB01              RUNNING              0                    A  RMCDB02              RUNNING              0                    -- GROUP STATE-- Group           System               Probed     AutoDisabled    State          B  RCS_DB_SG       RMCDB01              Y          N               ONLINE         B  RCS_DB_SG       RMCDB02              Y          N               OFFLINE        -- GROUPS FROZEN-- Group          C  RCS_DB_SG      -- RESOURCES DISABLED-- Group           Type            Resource            H  RCS_DB_SG       Application     ora_raw             H  RCS_DB_SG       Application     ora_vg              H  RCS_DB_SG       IP              ora_ip              H  RCS_DB_SG       NIC             ora_nic             H  RCS_DB_SG       Netlsnr         ora_listener        H  RCS_DB_SG       Oracle          ora_ora11g  <strong>解冻双机:</strong>RMCDB02:~ # hagrp -unfreeze RCS_DB_SG

6. VCS双机切换

这个也是我经常使用到的。主要是监控到集群内主机可能出现故障,所以人为有计划的将资源组切换到另外一个节点中;或者是硬件维护、系统重启。

NDMCDB04:~ # hastatus -sum-- SYSTEM STATE-- System               State                Frozen              A  NDMCDB03             RUNNING              0                    A  NDMCDB04             RUNNING              0                    -- GROUP STATE-- Group           System               Probed     AutoDisabled    State          B  RCS_NDMCDB_RG   NDMCDB03             Y          N               ONLINE         B  RCS_NDMCDB_RG   NDMCDB04             Y          N               OFFLINE   NDMCDB04:~ # hagrp -switch RCS_NDMCDB_RG -to NDMCDB04   ## 将资源从NDMCDB03切换到NDMCDB04主机上

7. VCS双机启动故障问题排查

故障现象
执行hastart 命令启动双机后,执行hastatus -sum命令查看双机状态,显示信息如下:
attempting to connect....connected
group           resource             system               message
--------------- -------------------- -------------------- --------------------
                                     test-smc3            STALE ADMIN WAIT: all systems stale
STALE_ADMIN_WAIT: The system has a stale configuration and no other system is in a RUNNING state.
ADMIN_WAIT: The system cannot build or obtain a valid configuration.
双机状态处于 STALE_ADMIN_WAIT 或ADMIN_WAIT 状态,不能正常启动双机软件。
操作步骤
步骤 1 验证配置文件main.cf是否正确。
请根据实际业务应用情况修改main.cf配置文件。
步骤 2 执行hacf –verify config_dir命令验证配置文件语法的正确性。如:
# hacf -verify /etc/VRTSvcs/conf/config
如果存在错误信息,则需要根据提示信息修改“main.cf”文件。
步骤 3 执行hasys -force 节点名命令启动VCS。

-- Bosco
---- END ----

-------------------------------------------------------------------------------------------------------

版权所有,文章允许转载,但必须以链接方式注明源地址,否则追究法律责任!



0 0
原创粉丝点击