赛门铁克VCS(Veritas Cluster Server)双机日常管理
来源:互联网 发布:马油扫码软件 编辑:程序博客网 时间:2024/05/22 11:30
1. 查看VCS版本及License信息
PSDB01:~ # vxlicrep Symantec License Manager vxlicrep utility version 3.02.51.010Copyright (C) 1996-2010 Symantec Corporation. All rights reserved.Creating a report on all VERITAS products installed on this system -----------------***********************----------------- License Key = XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-X Product Name = VERITAS Cluster Server Serial Number = XXXX License Type = PERMANENT OEM ID = 2006 Site License = YES Editions Product = YES Features := Platform = Unused Version = 5.1 Tier = Unused Reserved = 0 Mode = VCS CPU_TIER = 2 VXKEYLESS = Enabled
2. VCS集群编号及心跳网卡设置
PSDB01:~ # lltstat -l LLT link information:link 0 eth10 on ether hipri mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6 txpkts 67688788 txbytes 1843243673 rxpkts 76679165 rxbytes 1360585331 latehb 0 badcksum 0 errors 0link 1 eth9 on ether hipri mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6 txpkts 67689522 txbytes 1843879628 rxpkts 276962155 rxbytes 1467872503 latehb 0 badcksum 0 errors 0link 2 eth8 on ether lowpri mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6 txpkts 21897078 txbytes 1072847300 rxpkts 222319811 rxbytes 1191109452 latehb 0 badcksum 0 errors 0PSDB01:~ # cat /etc/llttab set-node PSDB01set-cluster 117link eth10 eth-80:fb:06:35:b8:9f - ether - -link eth9 eth-80:fb:06:35:b8:a1 - ether - -link-lowpri eth8 eth-80:fb:06:35:b8:a0 - ether - -PSDB01:~ # lltstat -nLLT node information: Node State Links * 0 PSDB01 OPEN 3 1 PSDB02 OPEN 3说明:我们这里使用了3张网卡用于心跳。如果lltstat查看时,links数量不够,那么就有可能是有网络故障,而我碰到最多是由于网卡在down状态,ifup一下网卡即可。
3. 查看VCS双机状态
RMCDB02:~ # hastatus -sum-- SYSTEM STATE-- System State Frozen A RMCDB01 RUNNING 0 A RMCDB02 RUNNING 0 -- GROUP STATE-- Group System Probed AutoDisabled State B RCS_DB_SG RMCDB01 Y N ONLINE B RCS_DB_SG RMCDB02 Y N OFFLINE
4. 启动、停止VCS集群
(1)启动时,如果是两个节点的集群,那么需要在每个节点上,用root用户执行:hastart,然后使用hastatus来查看启动过程中资源的状态信息
(2)停止时,只需要在其中一个节点上,使用root用户执行:hastop -all,同样是使用hastatus来查看状态,这个需要在每个节点上确认VCS已经停止完毕
注意:不管是启动,还是停止,VCS的日志是一定要查看,尤其是启动时,可以帮助排查启动过程中的问题。默认的VCS日志文件:
/var/VRTSvcs/log/engine_A.log
5. 冻结、解冻资源组
这是我经常使用的。何谓冻结,通俗的来说,就是让VCS暂时不管理集群,即使监控到有节占上资源组状态不正确,也不会发生切换或重新拉起操作。在维护中经常使用到,比如:oracle数据库打补丁、重启监听之类。
<strong>冻结双机:</strong>RMCDB02:~ # hagrp -freeze RCS_DB_SGRMCDB02:~ # hastatus -sum-- SYSTEM STATE-- System State Frozen A RMCDB01 RUNNING 0 A RMCDB02 RUNNING 0 -- GROUP STATE-- Group System Probed AutoDisabled State B RCS_DB_SG RMCDB01 Y N ONLINE B RCS_DB_SG RMCDB02 Y N OFFLINE -- GROUPS FROZEN-- Group C RCS_DB_SG -- RESOURCES DISABLED-- Group Type Resource H RCS_DB_SG Application ora_raw H RCS_DB_SG Application ora_vg H RCS_DB_SG IP ora_ip H RCS_DB_SG NIC ora_nic H RCS_DB_SG Netlsnr ora_listener H RCS_DB_SG Oracle ora_ora11g <strong>解冻双机:</strong>RMCDB02:~ # hagrp -unfreeze RCS_DB_SG
6. VCS双机切换
这个也是我经常使用到的。主要是监控到集群内主机可能出现故障,所以人为有计划的将资源组切换到另外一个节点中;或者是硬件维护、系统重启。
NDMCDB04:~ # hastatus -sum-- SYSTEM STATE-- System State Frozen A NDMCDB03 RUNNING 0 A NDMCDB04 RUNNING 0 -- GROUP STATE-- Group System Probed AutoDisabled State B RCS_NDMCDB_RG NDMCDB03 Y N ONLINE B RCS_NDMCDB_RG NDMCDB04 Y N OFFLINE NDMCDB04:~ # hagrp -switch RCS_NDMCDB_RG -to NDMCDB04 ## 将资源从NDMCDB03切换到NDMCDB04主机上
7. VCS双机启动故障问题排查
故障现象
执行hastart 命令启动双机后,执行hastatus -sum命令查看双机状态,显示信息如下:
attempting to connect....connected
group resource system message
--------------- -------------------- -------------------- --------------------
test-smc3 STALE ADMIN WAIT: all systems stale
STALE_ADMIN_WAIT: The system has a stale configuration and no other system is in a RUNNING state.
ADMIN_WAIT: The system cannot build or obtain a valid configuration.
双机状态处于 STALE_ADMIN_WAIT 或ADMIN_WAIT 状态,不能正常启动双机软件。
操作步骤
步骤 1 验证配置文件main.cf是否正确。
请根据实际业务应用情况修改main.cf配置文件。
步骤 2 执行hacf –verify config_dir命令验证配置文件语法的正确性。如:
# hacf -verify /etc/VRTSvcs/conf/config
如果存在错误信息,则需要根据提示信息修改“main.cf”文件。
步骤 3 执行hasys -force 节点名命令启动VCS。
执行hastart 命令启动双机后,执行hastatus -sum命令查看双机状态,显示信息如下:
attempting to connect....connected
group resource system message
--------------- -------------------- -------------------- --------------------
test-smc3 STALE ADMIN WAIT: all systems stale
STALE_ADMIN_WAIT: The system has a stale configuration and no other system is in a RUNNING state.
ADMIN_WAIT: The system cannot build or obtain a valid configuration.
双机状态处于 STALE_ADMIN_WAIT 或ADMIN_WAIT 状态,不能正常启动双机软件。
操作步骤
步骤 1 验证配置文件main.cf是否正确。
请根据实际业务应用情况修改main.cf配置文件。
步骤 2 执行hacf –verify config_dir命令验证配置文件语法的正确性。如:
# hacf -verify /etc/VRTSvcs/conf/config
如果存在错误信息,则需要根据提示信息修改“main.cf”文件。
步骤 3 执行hasys -force 节点名命令启动VCS。
-- Bosco
---- END ----
-------------------------------------------------------------------------------------------------------
版权所有,文章允许转载,但必须以链接方式注明源地址,否则追究法律责任!
0 0
- 赛门铁克VCS(Veritas Cluster Server)双机日常管理
- 赛门铁克VCS(Veritas Cluster Server)的资源说明
- VCS(Veritas Cluster Server)4.0软件安装介绍
- update---学习Veritas Cluster Server for DB2双机-入门
- Veritas Cluster Server for Oracle双机热备的配置
- 赛门铁克 Veritas Storage Foundatio
- 第一章 Veritas Cluster Server for UNIX,Fondamentals
- 第四章 安装VERITAS Cluster Server
- 高可用集群管理软件之Veritas Cluster Server
- Veritas双机基本原理
- 赛门铁克容灾方案VCS
- Veritas Cluster Configuration
- Veritas Linux Cluster
- Veritas Cluster Debugging Tips
- Veritas Cluster Debugging Tips
- vcs双机基础之一
- vcs双机基础之一
- VCS双机改主机名
- NOIP夏令营day6课程总结
- 【图论】大总结★★★★★
- 2014年3月usaco总结
- 2014.4.26 HAOI总结及感受
- 关于对HAOI2014四道题的吐槽(非专业吐槽)
- 赛门铁克VCS(Veritas Cluster Server)双机日常管理
- some tips
- google代理
- JVM笔记——调优案例分析与实战
- poj 3080 Blue Jeans (kmp暴力)
- 华为机试 - 判断if语句括号是否匹配
- 使用ffmpeg转换文件格式,及ffmpeg参数说明
- hdu4948 Kingdom
- 事物处理它包含了一组数据库操作命令