RAC 和 Oracle Clusterware 最佳实践和初学者指南 (AIX) (文档 ID 1526555.1)

来源:互联网 发布:域策略禁止安装软件 编辑:程序博客网 时间:2024/05/22 14:16


单击此项可添加到收藏夹转到底部转到底部

文档内容

用途 适用范围 详细信息 RAC Assurance 支持团队:RAC 和 Oracle Clusterware 初学者指南和最佳实践(不区分平台) RAC 特定平台的初学者指南和最佳实践 RAC on AIX 分步安装说明 RAC on AIX 最佳实践 OS 配置注意事项 存储注意事项 网络注意事项 Oracle 软件注意事项 参考

适用于:

Oracle Database - Enterprise Edition - 版本 10.2.0.1 到 12.1.0.1 [发行版 10.2 到 12.1]
Oracle Database - Standard Edition - 版本 12.1.0.1 到 12.1.0.1 [发行版 12.1]
IBM AIX on POWER Systems (64-bit)

用途

最佳实践和初学者指南之 Oracle Real Application Clusters (RAC) 系列,主要目标是为了帮助客户快速了解实施、升级与维护 Oracle RAC 系统的通用的以及针对特定平台的最佳实践。Oracle 根据自己的经验及其全球 RAC 客户的反馈编写和维护本文档。

本初学者指南的目的不在于取代 Oracle 文档集,而是作为它的补充。对于本文没有明确解决的任何问题,还应仔细阅读、理解和参考 Oracle 文档,以从中寻找答案。

您的运营团队应仔细审核所有建议,且只有通过了相应的风险评估后方能实施。风险评估只能由具备丰富的系统、应用和企业环境方面知识的人员来执行。

由 于每个客户环境都是独一无二的,因此 Oracle Database 实施(包括 Oracle RAC 实施)的成功源于成功的测试环境。对于本文中的任意建议,在生产环境中加以实施之前,务必要在作为目标生产环境复制品的测试环境中进行充分的测试和验证, 以确保不会产生与所实施建议相关的负面影响。

适用范围

本文章适用于所有新的和现有 RAC 实施以及 RAC 升级。

详细信息

RAC Assurance 支持团队:RAC 和 Oracle Clusterware 初学者指南和最佳实践(不区分平台)

以下文档重点介绍适用于所有平台的 RAC 和 Oracle Clusterware 最佳实践,包括可用的 RAC 系统负载测试工具的白皮书,以及针对 10gR2、11gR1 和 11gR2 的 RAC 的系统测试计划概述:

Document 810394.1 RAC and Oracle Clusterware Best Practices and Starter Kit (Platform Independent)

 

RAC 特定平台的初学者指南和最佳实践

以下文档包含特定平台的详细最佳实践,包括分步安装说明(可下载 PDF 格式):

Document 811306.1 RAC and Oracle Clusterware Best Practices and Starter Kit (Linux)
Document 811280.1 RAC and Oracle Clusterware Best Practices and Starter Kit (Solaris)
Document 811271.1 RAC and Oracle Clusterware Best Practices and Starter Kit (Windows)
Document 811293.1 RAC and Oracle Clusterware Best Practices and Starter Kit (AIX)
Document 811303.1 RAC and Oracle Clusterware Best Practices and Starter Kit (HP-UX)

 

RAC on AIX 分步安装说明

单击 此处 可获取用于在 AIX 上安装 Oracle RAC 10gR2 的分步指南.
单击 此处 可获取用于在 AIX 上安装 Oracle RAC 11gR1 的分步指南.
单击 此处 可获取用于在 AIX 上安装 Oracle RAC 11gR2 的分步指南.

 

RAC on AIX 最佳实践

此部分中的最佳实践特定于 AIX 平台。您还必须了解在 Document 810394.1 中介绍的不区分平台的最佳实践。

OS 配置注意事项

  • 所有在 AIX 平台运行 RAC 的客户务必查看 IBM/Oracle 联合编写的白皮书 Oracle Real Application Clusters on IBM AIX Best practices in memory tuning and configuring for system stability.
  • 对于 11gR2,从本文档开始 Document 1427855.1 - AIX: Top Things to DO NOW to Stabilize 11gR2 GI/RAC Cluster
  • 根据 RAC Technologies Matrix for Unix 验证您的硬件/软件配置。
  • 确保已安装所有需要的 OS 软件包,并已正确实现特定 Oracle 版本的系统先决条件。此信息已记录在 Document 169706.1 以及您的特定版本对应的安装指南中。
  • 如果是在 AIX 虚拟系统上进行部署,请查看 Document 1470654.1 以了解此配置中的资源利用。
  • 如果运行的是 AIX 6.1,确保已安装 APAR IV04047 的修正程序,以避免可能出现的实例挂起和节点驱逐。更多详细信息,请参阅 Document 1393041.1。
  • 为确保系统稳定性,请确认已经应用了 Document 282036.1 中记录的所有 AIX(5L 和 6)强制性修补程序。
  • 优化虚拟内存参数。IBM 建议的值为:
    minperm%=3
    maxperm%=90
    maxclient%=90
    lru_file_repage=0 *
    strict_maxperm=0
    strict_maxclient=1
    page_steal_method=1
  • AIX 7.1 lru_file_repage 默认值是0,不再需要修改。
  • 设置这些参数的示例脚本如下:
    #!/usr/bin/ksh
    vmo -p -o maxperm%=90;
    vmo -p -o minperm%=3;
    vmo -p -o maxclient%=90;
    vmo -p -o strict maxperm=0;
    vmo -p -o strict maxclient=1;
    vmo -p -o lru_file_repage=0;
    vmo -r -o page_steal_method=1; (need to reboot to take into effect)
    vmo -p -o strict_maxclient=1
    vmo -p -o strict_maxperm=0;
  • 在 AIX 5.3 上,应用 APAR IY84780 以修复每个 cpu 的空闲列表的已知内核问题。有关此 APAR 的详细信息,请参阅 IY84780: KERNEL MEMORY GARBAGE COLLECTOR FAILS TO FREE LISTS.
    注意:  此修正程序也包含在 Technology Level 4(TL4) 及更高级别中。如有必要,与 IBM 协商获取任何更新的修正程序。
  • 在系统环境中,设置 AIXTHREAD_SCOPE=S:export AIXTHREAD_SCOPE=S 以提高性能(AIX 6.1 及更高版本上默认为 S)。请参阅 Document 458403.1 (Why AIXTHREAD_SCOPE should be set to 'S' on AIX) 了解更多详细信息。
  • 使用 Processor Folding 功能(默认)时,务必应用 Fix Packs for AIX 5.3 and 6.1 以防止系统挂起。
  • 如果不使用 HACMP,就一定不能安装 HACMP 文件集。
     
  • 不要对 Oracle 主目录、软件升级或 temp 文件系统使用通过“cio”选项装载的文件系统。“cio”装载选项不受支持,它会导致安装、relink及其他意外故障。请参阅 Document 869644.1 了解详细信息。
  • 确保 GI 和 ORACLE 所有者帐户具有 CAP_NUMA_ATTACH、CAP_BYPASS_RAC_VMM 和 CAP_PROPAGATE 功能。这是 11gR2 安装指南中的要求,也是 11gR2 之前版本的所有安装所必需的。GRID 用户的检查和设置示例如下:
    #/usr/bin/lsuser -a capabilities grid
    #/usr/bin/chuser capabilities=CAP_NUMA_ATTACH,CAP_BYPASS_RAC_VMM,CAP_PROPAGATE grid

存储注意事项

  • 确保 SAN 存储驱动器能够并发读/写(同时从集群的任意节点写入)。这就是说,所发现磁盘(hdisk、hdiskpower、dlmfdrv 等)的“reserve_policy”属性必须能够设置为“no_reserve”或“no_lock”。请参阅 Document 422075.1 了解详细信息。
  • 不要为用于 ASM 磁盘组的磁盘或卷分配 PVID(物理卷 ID)。在添加至 ASM 磁盘组之前,必须清除所有候选磁盘或卷在所有节点上的 PVID。磁盘或卷一旦添加至 ASM 磁盘组,就不应再从集群中的任何节点分配 PVID,包括正添加至现有集群的节点。请参阅 Document 353761.1 了解关于此问题的更多详细信息。
    注意:  为 ASM 磁盘分配 PVID 将损坏磁盘头,从而导致灾难性的数据丢失!!
  • 将表决磁盘和 ASM 存储的 FSCSI 设备属性 FC_ERR_RECOV 设置为 FAST_FAIL。此设置已表明可避免因存储了三个表决磁盘之一的 SAN 存储卷停止而引起的重启。请参阅 Document 560077.1 了解详细信息。
  • 在实施 GPFS 时,请务必查看 Document 302806.1 了解关于 LUN 配置、文件系统块大小、AIO 配置, inodes的建议及实施示例。
  • 当系统中的其他应用程序正在运行大量磁盘写入时,AIX 用户可能会遇到较长的交互应用程序(interactive-application)响应时间。配置 I/O pacing 限制针对文件的过度I/O 请求。AIX 6.1 已默认启用 I/O pacing,默认值:“minpout=4096 和 maxpout=8193”对 AIX6.1 可行。但是,在 AIX 5.3 中,您需要明确地启用此功能。
Oracle 测试表明,minpout 为 8 和 maxpout 为 12 的起始值对于大多数 Oracle 客户都是比较好的基准。然而,每个环境都不相同,因此如果系统已经过正确优化并表明可使用不同的值进行工作,那么就可能很好地接受不同的值。要使用 Oracle 建议的基准值通过 SMIT 在系统上配置 I/O pacing,请以 root 用户身份在命令行中输入以下内容:
# smitty chgsys
# chdev -l sys0 -a minpout=8 -a maxpout=12
  • 在 AIX 上,ASM 可使用并发的 RAW 逻辑卷或 RAW 分区。当通过 ASM 使用多路径技术时,ASM 必须通过相应的多路径设备访问设备,主要的多路径技术的设备路径记录在  Document 294869.1 中。

网络注意事项

  • 目前为止,对于版本11gR2,Infiniband(无论是RDS还是IP over IB)在AIX平台仍然没有被认证。更多信息,请参考Document 751343.1 和 Document 282036.1。 
  • 确保网络优化参数设置与以下设置一致,以保证最佳的私网性能:
    tcp_recvspace = 65536
    tcp_sendspace = 65536
    udp_sendspace = ((DB_BLOCK_SIZE * DB_MULTIBLOCK_READ_COUNT) + 4 KB) but no lower than 65536
    udp_recvspace = 655360 (Minimum recommended value is 10x udp_sendspace, parameter value must be less than sb_max)
    rfc1323 = 1
    sb_max = 4194304 
    ipqmaxlen = 512

    注意: 对于 GI 版本 11.2.0.2 的安装,设置 udp_sendspace 失败将导致 root.sh 失败。请参阅 Document Document 1280234.1。
  • 在安装 Oracle clusterware 之前,其 VIP IP 地址和相应的节点名称不能在网络上已经被使用。不要在公网接口上起任何 AIX 别名,Clusterware安装将完成这一操作。每个 RAC 节点只保留 1 个 VIP 及其主机名。Oracle Clusterware VIP IP 和相应的节点名称将在 DNS 中定义。
  • 使用 AIX VIO 进行安装必须查看 Document 1305174.1 - AIX VIO: Block Lost or IPC Send Timeout Possible Without Fix of APAR IZ97457.

Oracle 软件注意事项

此部分中的软件注意事项特定于 AIX 平台。您还必须了解在 Document 810394.1 中介绍的不区分平台的最佳实践。

  • 对于在AIX 6.1 TL8 或者 7.1 TL2平台上,版本为11gR2的集群,请确认note 1528452.1 中提到的操作系统补丁被应用,以便提前预防由于CRSD和EVMD资源处于INTERMEDIATE状态而导致集群的第二个节点无法加入集群的问题。
  • 对于使用 IBM 逻辑主机以太网适配器 (LHEA) 接口在 AIX 系统上安装 10.2.0.4 和 11.1.0.7,需要应用 Bug 8725020 修正程序,以确保 VIP 功能。此修正程序包含在 10.2.0.5 和 11.1.0.7 CRS Bundle#1(及更高版本)中。请参阅 Document 959746.1 了解更多关于此问题的详细信息。
  • 为确保关键进程的线程在运行时具有适当的优先级(以防止节点驱逐),请应用 BUG 13940331 修正程序(特定于 AIX)。 Bug 13940331 在 11.2.0.4 中得以修正,目前在 Patch 13940331 下有适合于 10.2.0.5 和 11.2.0.3 的one-off 补丁程序。
  • 对于 11.2.0.2 安装和/或升级,在运行 root.sh 或 rootupgrade.sh 前请先应用 11.2.0.2.4 GI PSU Patch 12827731 (或更高版本),以防止这些脚本出现故障(由于 Bug 10370797,已在 11.2.0.2.4 中修正)。在运行 root.sh 或 rootupgrade.sh 之前如何应用 11.2.0.2.4 GI PSU Patch 12827731 的说明如下:
    注意:  这些说明是为 11.2.0.2.4 GI PSU 编写。虽然补丁程序编号会有所不同,相同的说明同样适用于以后的 GI PSU。

    1. 执行 Oracle Grid Infrastructure 11.2.0.2 安装或升级
    2. 就在运行第一个 root.sh(或 rootupgrade.sh)之前,停止当前安装:
    • 不要运行 root.sh 或 rootupgrade.sh
    • 不要关闭安装程序或中止正在进行的操作。
    • 请保留当前安装并打开新的终端。
    3. 下载 Patch 12827731 并准备应用,将修补程序解压缩至集群中每个节点上的空目录中。
    4. 下载并安装最新版本的 OPatch,以应用补丁程序。最新版本的 OPatch 可在 Patch 6880880 中下载。将 OPatch 安装在所有节点的 GI 主目录上,如下所示:
    $ unzip <OPATCH-ZIP> -d <ORACLE_HOME>

    5. 与补丁程序 readme 文件中的描述不同,
    • 不要使用“opatch auto”
    • 由于这是尚未配置的全新安装,因此不要执行“rootcrs.pl -unlock”或“rootcrs.pl -patch”
    • 请以GI软件所有者用户,例如 grid,使用:“opatch napply –local”
      $GI_HOME/OPatch/opatch napply -local <patch_location>/12827731
      $GI_HOME/OPatch/opatch napply -local <patch_location>/12827726
    注意: 此处在 Opatch 后面加上“-local”选项,您需要在每个节点上执行此操作。

    6. 集群中的每个节点都应用过补丁程序后,返回原来的安装
    7. 继续在所有节点上运行 root.sh (rootupgrade.sh),并遵循 OUI 界面的指示。

 

  • 在 11.2 之前的 AIX 系统(没有其他供应商集群管理软件)上,OPROCD 默认不在 AIX 全局运行队列运行 (Bug 13623902),这可能会导致 OPROCD 错误地重启节点。此问题的更正操作是修改 /etc/init.cssd 文件,如下所示:
    注意:  以下步骤以滚动(rolling)的方式执行,以避免数据库完全停止。

    1.  停止本地节点上的 Clusterware 。
    2.  如下修改 /etc/init.cssd:
    从:

       # Run oprocd synchronously and look for its status code
       cd $OPROCDIR

       # startup the some diagnostic collection scripts if any
       StartDiagCollect;

       $OPROCD run -t $OPROCD_DEFAULT_TIMEOUT -m $OPROCD_DEFAULT_MARGIN \
          $OPROCD_DEFAULT_HISTOGRAM $FATALARG
       RC=$?

    到:

       # Run oprocd synchronously and look for its status code
       cd $OPROCDIR

       # startup the some diagnostic collection scripts if any
       StartDiagCollect;

       RT_GRQ=ON
       export RT_GRQ

       $OPROCD run -t $OPROCD_DEFAULT_TIMEOUT -m $OPROCD_DEFAULT_MARGIN \
          $OPROCD_DEFAULT_HISTOGRAM $FATALARG
       RC=$?


    3.  重新启动本地节点上的 Clusterware。
    4.  在所有剩下的集群节点上重复步骤 1-3 。

此修正程序也包含在技术 4 级 (TL4) 及更高级别中。如有必要,与 IBM 协商获取任何更新的修正程序。

参考

NOTE:959746.1 - AIX: 10.2/11.1 VIP Fails to Come Up with "Invalid Parameters, Or Failed To Bring Up VIP"
NOTE:811306.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (Linux)
NOTE:811303.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (HP-UX)
NOTE:1393041.1 - AIX 6.1 Instance Hang Then Node Reboot due to High Load IV04047
NOTE:1427855.1 - AIX: Top Things to DO NOW to Stabilize 11gR2 GI/RAC Cluster
NOTE:1305174.1 - AIX VIO: Block Lost or IPC Send Timeout Possible Without Fix of APAR IZ97457
NOTE:169706.1 - Oracle Database (RDBMS) on Unix AIX,HP-UX,Linux,Mac OS X,Solaris,Tru64 Unix Operating Systems Installation and Configuration Requirements Quick Reference (8.0.5 to 11.2)
NOTE:282036.1 - Minimum Software Versions and Patches Required to Support Oracle Products on IBM Power Systems
NOTE:353761.1 - Assigning a Physical Volume ID (PVID) To An Existing ASM Disk Corrupts the ASM Disk Header
NOTE:422075.1 - Error ORA-27091, ORA-27072 When Mounting Diskgroup
NOTE:294869.1 - Oracle ASM and Multi-Pathing Technologies
NOTE:560077.1 - Asm Hangs After Loss Of Failgroup on AIX
NOTE:810394.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (Platform Independent)
NOTE:811271.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (Windows)
NOTE:811280.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (Solaris)
NOTE:811293.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (AIX)
NOTE:869644.1 - Having an ORACLE_HOME on a Filesystem Mounted With "cio" Option is Not Supported and Will Have Issues
BUG:8725020 - VIP WONT RUN ADAPTER 5.3 TL9
单击此项可添加到收藏夹转到底部转到底部

文档内容

用途 适用范围 详细信息 RAC Assurance 支持团队:RAC 和 Oracle Clusterware 初学者指南和最佳实践(不区分平台) RAC 特定平台的初学者指南和最佳实践 RAC on AIX 分步安装说明 RAC on AIX 最佳实践 OS 配置注意事项 存储注意事项 网络注意事项 Oracle 软件注意事项 参考

适用于:

Oracle Database - Enterprise Edition - 版本 10.2.0.1 到 12.1.0.1 [发行版 10.2 到 12.1]
Oracle Database - Standard Edition - 版本 12.1.0.1 到 12.1.0.1 [发行版 12.1]
IBM AIX on POWER Systems (64-bit)

用途

最佳实践和初学者指南之 Oracle Real Application Clusters (RAC) 系列,主要目标是为了帮助客户快速了解实施、升级与维护 Oracle RAC 系统的通用的以及针对特定平台的最佳实践。Oracle 根据自己的经验及其全球 RAC 客户的反馈编写和维护本文档。

本初学者指南的目的不在于取代 Oracle 文档集,而是作为它的补充。对于本文没有明确解决的任何问题,还应仔细阅读、理解和参考 Oracle 文档,以从中寻找答案。

您的运营团队应仔细审核所有建议,且只有通过了相应的风险评估后方能实施。风险评估只能由具备丰富的系统、应用和企业环境方面知识的人员来执行。

由 于每个客户环境都是独一无二的,因此 Oracle Database 实施(包括 Oracle RAC 实施)的成功源于成功的测试环境。对于本文中的任意建议,在生产环境中加以实施之前,务必要在作为目标生产环境复制品的测试环境中进行充分的测试和验证, 以确保不会产生与所实施建议相关的负面影响。

适用范围

本文章适用于所有新的和现有 RAC 实施以及 RAC 升级。

详细信息

RAC Assurance 支持团队:RAC 和 Oracle Clusterware 初学者指南和最佳实践(不区分平台)

以下文档重点介绍适用于所有平台的 RAC 和 Oracle Clusterware 最佳实践,包括可用的 RAC 系统负载测试工具的白皮书,以及针对 10gR2、11gR1 和 11gR2 的 RAC 的系统测试计划概述:

Document 810394.1 RAC and Oracle Clusterware Best Practices and Starter Kit (Platform Independent)

 

RAC 特定平台的初学者指南和最佳实践

以下文档包含特定平台的详细最佳实践,包括分步安装说明(可下载 PDF 格式):

Document 811306.1 RAC and Oracle Clusterware Best Practices and Starter Kit (Linux)
Document 811280.1 RAC and Oracle Clusterware Best Practices and Starter Kit (Solaris)
Document 811271.1 RAC and Oracle Clusterware Best Practices and Starter Kit (Windows)
Document 811293.1 RAC and Oracle Clusterware Best Practices and Starter Kit (AIX)
Document 811303.1 RAC and Oracle Clusterware Best Practices and Starter Kit (HP-UX)

 

RAC on AIX 分步安装说明

单击 此处 可获取用于在 AIX 上安装 Oracle RAC 10gR2 的分步指南.
单击 此处 可获取用于在 AIX 上安装 Oracle RAC 11gR1 的分步指南.
单击 此处 可获取用于在 AIX 上安装 Oracle RAC 11gR2 的分步指南.

 

RAC on AIX 最佳实践

此部分中的最佳实践特定于 AIX 平台。您还必须了解在 Document 810394.1 中介绍的不区分平台的最佳实践。

OS 配置注意事项

  • 所有在 AIX 平台运行 RAC 的客户务必查看 IBM/Oracle 联合编写的白皮书 Oracle Real Application Clusters on IBM AIX Best practices in memory tuning and configuring for system stability.
  • 对于 11gR2,从本文档开始 Document 1427855.1 - AIX: Top Things to DO NOW to Stabilize 11gR2 GI/RAC Cluster
  • 根据 RAC Technologies Matrix for Unix 验证您的硬件/软件配置。
  • 确保已安装所有需要的 OS 软件包,并已正确实现特定 Oracle 版本的系统先决条件。此信息已记录在 Document 169706.1 以及您的特定版本对应的安装指南中。
  • 如果是在 AIX 虚拟系统上进行部署,请查看 Document 1470654.1 以了解此配置中的资源利用。
  • 如果运行的是 AIX 6.1,确保已安装 APAR IV04047 的修正程序,以避免可能出现的实例挂起和节点驱逐。更多详细信息,请参阅 Document 1393041.1。
  • 为确保系统稳定性,请确认已经应用了 Document 282036.1 中记录的所有 AIX(5L 和 6)强制性修补程序。
  • 优化虚拟内存参数。IBM 建议的值为:
    minperm%=3
    maxperm%=90
    maxclient%=90
    lru_file_repage=0 *
    strict_maxperm=0
    strict_maxclient=1
    page_steal_method=1
  • AIX 7.1 lru_file_repage 默认值是0,不再需要修改。
  • 设置这些参数的示例脚本如下:
    #!/usr/bin/ksh
    vmo -p -o maxperm%=90;
    vmo -p -o minperm%=3;
    vmo -p -o maxclient%=90;
    vmo -p -o strict maxperm=0;
    vmo -p -o strict maxclient=1;
    vmo -p -o lru_file_repage=0;
    vmo -r -o page_steal_method=1; (need to reboot to take into effect)
    vmo -p -o strict_maxclient=1
    vmo -p -o strict_maxperm=0;
  • 在 AIX 5.3 上,应用 APAR IY84780 以修复每个 cpu 的空闲列表的已知内核问题。有关此 APAR 的详细信息,请参阅 IY84780: KERNEL MEMORY GARBAGE COLLECTOR FAILS TO FREE LISTS.
    注意:  此修正程序也包含在 Technology Level 4(TL4) 及更高级别中。如有必要,与 IBM 协商获取任何更新的修正程序。
  • 在系统环境中,设置 AIXTHREAD_SCOPE=S:export AIXTHREAD_SCOPE=S 以提高性能(AIX 6.1 及更高版本上默认为 S)。请参阅 Document 458403.1 (Why AIXTHREAD_SCOPE should be set to 'S' on AIX) 了解更多详细信息。
  • 使用 Processor Folding 功能(默认)时,务必应用 Fix Packs for AIX 5.3 and 6.1 以防止系统挂起。
  • 如果不使用 HACMP,就一定不能安装 HACMP 文件集。
     
  • 不要对 Oracle 主目录、软件升级或 temp 文件系统使用通过“cio”选项装载的文件系统。“cio”装载选项不受支持,它会导致安装、relink及其他意外故障。请参阅 Document 869644.1 了解详细信息。
  • 确保 GI 和 ORACLE 所有者帐户具有 CAP_NUMA_ATTACH、CAP_BYPASS_RAC_VMM 和 CAP_PROPAGATE 功能。这是 11gR2 安装指南中的要求,也是 11gR2 之前版本的所有安装所必需的。GRID 用户的检查和设置示例如下:
    #/usr/bin/lsuser -a capabilities grid
    #/usr/bin/chuser capabilities=CAP_NUMA_ATTACH,CAP_BYPASS_RAC_VMM,CAP_PROPAGATE grid

存储注意事项

  • 确保 SAN 存储驱动器能够并发读/写(同时从集群的任意节点写入)。这就是说,所发现磁盘(hdisk、hdiskpower、dlmfdrv 等)的“reserve_policy”属性必须能够设置为“no_reserve”或“no_lock”。请参阅 Document 422075.1 了解详细信息。
  • 不要为用于 ASM 磁盘组的磁盘或卷分配 PVID(物理卷 ID)。在添加至 ASM 磁盘组之前,必须清除所有候选磁盘或卷在所有节点上的 PVID。磁盘或卷一旦添加至 ASM 磁盘组,就不应再从集群中的任何节点分配 PVID,包括正添加至现有集群的节点。请参阅 Document 353761.1 了解关于此问题的更多详细信息。
    注意:  为 ASM 磁盘分配 PVID 将损坏磁盘头,从而导致灾难性的数据丢失!!
  • 将表决磁盘和 ASM 存储的 FSCSI 设备属性 FC_ERR_RECOV 设置为 FAST_FAIL。此设置已表明可避免因存储了三个表决磁盘之一的 SAN 存储卷停止而引起的重启。请参阅 Document 560077.1 了解详细信息。
  • 在实施 GPFS 时,请务必查看 Document 302806.1 了解关于 LUN 配置、文件系统块大小、AIO 配置, inodes的建议及实施示例。
  • 当系统中的其他应用程序正在运行大量磁盘写入时,AIX 用户可能会遇到较长的交互应用程序(interactive-application)响应时间。配置 I/O pacing 限制针对文件的过度I/O 请求。AIX 6.1 已默认启用 I/O pacing,默认值:“minpout=4096 和 maxpout=8193”对 AIX6.1 可行。但是,在 AIX 5.3 中,您需要明确地启用此功能。
Oracle 测试表明,minpout 为 8 和 maxpout 为 12 的起始值对于大多数 Oracle 客户都是比较好的基准。然而,每个环境都不相同,因此如果系统已经过正确优化并表明可使用不同的值进行工作,那么就可能很好地接受不同的值。要使用 Oracle 建议的基准值通过 SMIT 在系统上配置 I/O pacing,请以 root 用户身份在命令行中输入以下内容:
# smitty chgsys
# chdev -l sys0 -a minpout=8 -a maxpout=12
  • 在 AIX 上,ASM 可使用并发的 RAW 逻辑卷或 RAW 分区。当通过 ASM 使用多路径技术时,ASM 必须通过相应的多路径设备访问设备,主要的多路径技术的设备路径记录在  Document 294869.1 中。

网络注意事项

  • 目前为止,对于版本11gR2,Infiniband(无论是RDS还是IP over IB)在AIX平台仍然没有被认证。更多信息,请参考Document 751343.1 和 Document 282036.1。 
  • 确保网络优化参数设置与以下设置一致,以保证最佳的私网性能:
    tcp_recvspace = 65536
    tcp_sendspace = 65536
    udp_sendspace = ((DB_BLOCK_SIZE * DB_MULTIBLOCK_READ_COUNT) + 4 KB) but no lower than 65536
    udp_recvspace = 655360 (Minimum recommended value is 10x udp_sendspace, parameter value must be less than sb_max)
    rfc1323 = 1
    sb_max = 4194304 
    ipqmaxlen = 512

    注意: 对于 GI 版本 11.2.0.2 的安装,设置 udp_sendspace 失败将导致 root.sh 失败。请参阅 Document Document 1280234.1。
  • 在安装 Oracle clusterware 之前,其 VIP IP 地址和相应的节点名称不能在网络上已经被使用。不要在公网接口上起任何 AIX 别名,Clusterware安装将完成这一操作。每个 RAC 节点只保留 1 个 VIP 及其主机名。Oracle Clusterware VIP IP 和相应的节点名称将在 DNS 中定义。
  • 使用 AIX VIO 进行安装必须查看 Document 1305174.1 - AIX VIO: Block Lost or IPC Send Timeout Possible Without Fix of APAR IZ97457.

Oracle 软件注意事项

此部分中的软件注意事项特定于 AIX 平台。您还必须了解在 Document 810394.1 中介绍的不区分平台的最佳实践。

  • 对于在AIX 6.1 TL8 或者 7.1 TL2平台上,版本为11gR2的集群,请确认note 1528452.1 中提到的操作系统补丁被应用,以便提前预防由于CRSD和EVMD资源处于INTERMEDIATE状态而导致集群的第二个节点无法加入集群的问题。
  • 对于使用 IBM 逻辑主机以太网适配器 (LHEA) 接口在 AIX 系统上安装 10.2.0.4 和 11.1.0.7,需要应用 Bug 8725020 修正程序,以确保 VIP 功能。此修正程序包含在 10.2.0.5 和 11.1.0.7 CRS Bundle#1(及更高版本)中。请参阅 Document 959746.1 了解更多关于此问题的详细信息。
  • 为确保关键进程的线程在运行时具有适当的优先级(以防止节点驱逐),请应用 BUG 13940331 修正程序(特定于 AIX)。 Bug 13940331 在 11.2.0.4 中得以修正,目前在 Patch 13940331 下有适合于 10.2.0.5 和 11.2.0.3 的one-off 补丁程序。
  • 对于 11.2.0.2 安装和/或升级,在运行 root.sh 或 rootupgrade.sh 前请先应用 11.2.0.2.4 GI PSU Patch 12827731 (或更高版本),以防止这些脚本出现故障(由于 Bug 10370797,已在 11.2.0.2.4 中修正)。在运行 root.sh 或 rootupgrade.sh 之前如何应用 11.2.0.2.4 GI PSU Patch 12827731 的说明如下:
    注意:  这些说明是为 11.2.0.2.4 GI PSU 编写。虽然补丁程序编号会有所不同,相同的说明同样适用于以后的 GI PSU。

    1. 执行 Oracle Grid Infrastructure 11.2.0.2 安装或升级
    2. 就在运行第一个 root.sh(或 rootupgrade.sh)之前,停止当前安装:
    • 不要运行 root.sh 或 rootupgrade.sh
    • 不要关闭安装程序或中止正在进行的操作。
    • 请保留当前安装并打开新的终端。
    3. 下载 Patch 12827731 并准备应用,将修补程序解压缩至集群中每个节点上的空目录中。
    4. 下载并安装最新版本的 OPatch,以应用补丁程序。最新版本的 OPatch 可在 Patch 6880880 中下载。将 OPatch 安装在所有节点的 GI 主目录上,如下所示:
    $ unzip <OPATCH-ZIP> -d <ORACLE_HOME>

    5. 与补丁程序 readme 文件中的描述不同,
    • 不要使用“opatch auto”
    • 由于这是尚未配置的全新安装,因此不要执行“rootcrs.pl -unlock”或“rootcrs.pl -patch”
    • 请以GI软件所有者用户,例如 grid,使用:“opatch napply –local”
      $GI_HOME/OPatch/opatch napply -local <patch_location>/12827731
      $GI_HOME/OPatch/opatch napply -local <patch_location>/12827726
    注意: 此处在 Opatch 后面加上“-local”选项,您需要在每个节点上执行此操作。

    6. 集群中的每个节点都应用过补丁程序后,返回原来的安装
    7. 继续在所有节点上运行 root.sh (rootupgrade.sh),并遵循 OUI 界面的指示。

 

  • 在 11.2 之前的 AIX 系统(没有其他供应商集群管理软件)上,OPROCD 默认不在 AIX 全局运行队列运行 (Bug 13623902),这可能会导致 OPROCD 错误地重启节点。此问题的更正操作是修改 /etc/init.cssd 文件,如下所示:
    注意:  以下步骤以滚动(rolling)的方式执行,以避免数据库完全停止。

    1.  停止本地节点上的 Clusterware 。
    2.  如下修改 /etc/init.cssd:
    从:

       # Run oprocd synchronously and look for its status code
       cd $OPROCDIR

       # startup the some diagnostic collection scripts if any
       StartDiagCollect;

       $OPROCD run -t $OPROCD_DEFAULT_TIMEOUT -m $OPROCD_DEFAULT_MARGIN \
          $OPROCD_DEFAULT_HISTOGRAM $FATALARG
       RC=$?

    到:

       # Run oprocd synchronously and look for its status code
       cd $OPROCDIR

       # startup the some diagnostic collection scripts if any
       StartDiagCollect;

       RT_GRQ=ON
       export RT_GRQ

       $OPROCD run -t $OPROCD_DEFAULT_TIMEOUT -m $OPROCD_DEFAULT_MARGIN \
          $OPROCD_DEFAULT_HISTOGRAM $FATALARG
       RC=$?


    3.  重新启动本地节点上的 Clusterware。
    4.  在所有剩下的集群节点上重复步骤 1-3 。

此修正程序也包含在技术 4 级 (TL4) 及更高级别中。如有必要,与 IBM 协商获取任何更新的修正程序。

参考

NOTE:959746.1 - AIX: 10.2/11.1 VIP Fails to Come Up with "Invalid Parameters, Or Failed To Bring Up VIP"
NOTE:811306.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (Linux)
NOTE:811303.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (HP-UX)
NOTE:1393041.1 - AIX 6.1 Instance Hang Then Node Reboot due to High Load IV04047
NOTE:1427855.1 - AIX: Top Things to DO NOW to Stabilize 11gR2 GI/RAC Cluster
NOTE:1305174.1 - AIX VIO: Block Lost or IPC Send Timeout Possible Without Fix of APAR IZ97457
NOTE:169706.1 - Oracle Database (RDBMS) on Unix AIX,HP-UX,Linux,Mac OS X,Solaris,Tru64 Unix Operating Systems Installation and Configuration Requirements Quick Reference (8.0.5 to 11.2)
NOTE:282036.1 - Minimum Software Versions and Patches Required to Support Oracle Products on IBM Power Systems
NOTE:353761.1 - Assigning a Physical Volume ID (PVID) To An Existing ASM Disk Corrupts the ASM Disk Header
NOTE:422075.1 - Error ORA-27091, ORA-27072 When Mounting Diskgroup
NOTE:294869.1 - Oracle ASM and Multi-Pathing Technologies
NOTE:560077.1 - Asm Hangs After Loss Of Failgroup on AIX
NOTE:810394.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (Platform Independent)
NOTE:811271.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (Windows)
NOTE:811280.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (Solaris)
NOTE:811293.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (AIX)
NOTE:869644.1 - Having an ORACLE_HOME on a Filesystem Mounted With "cio" Option is Not Supported and Will Have Issues
BUG:8725020 - VIP WONT RUN ADAPTER 5.3 TL9
0 0
原创粉丝点击