grid control 10.2.0.1.1安装注意事项

来源:互联网 发布:淘宝扣分在哪里看 编辑:程序博客网 时间:2024/04/28 13:21

grid control 10.2.0.1.1安装注意事项
1.hostname

网络:
    尽量使用静态IP,/etc/hosts的文件格式很重要,不知道是个BUG还是要求就是那么严格。我一开始就是在这吃的亏,在precheck需求的时候忽略了/etc/hosts检查失败的错误,结果安装软件没问题,但配置的时候出错了,找不到主机名,而显式%hostname%替换变量。
   正确的格式sample:
   127.0.0.1   localhost.localdomain localhost
   192.168..128.130 hostname.domain hostname
    一定要有域名后缀.domain,而且hostname和hostname.domain不能调换位置,如果调换也报错。
    另必须要有127.0.0.1定义在/etc/hosts文件里,要不然数据库监听器启动不了。

2.配置oms时候报错oui 25031

修改配置文件后retry


改/opt/oracle/OracleHomes/oms10g/opmn/conf/opmn.xml文件,在

<ias-component id="HTTP_Server">
<process-type id="HTTP_Server" module-id="OHS">后插入

<environment>

<variable id="LD_PRELOAD" value="/opt/oracle/OracleHomes/oms10g/lib/libclntsh.so"/>

</environment>

重新点retry进行重新配置。

3.osm新添加的表空间位置要注意

4.oracle用户不要有环境变量

 

agent简便安装方法


首先用oracle用户在ORACLE_HOME/下创建一个目录,一般是OracleHomes,c:使用ftp,或者http,scp等方法,从Oms机器上下载安装脚本,该安装脚本路径如下:$ORACLE_HOME/OracleHomes/oms10g/sysman/agent_download/linux/agent_download.linux


在需要部署agent的机器上,首先给该脚本可执行的权限

jar 文件的目录 ORACLE_HOME/jdk/bin

Oralce10g Grid Control问题:
最近花了几天时间折腾了下Grid Control(简写为GC)
我的环境 Oracle 10g Solaris 10
下面就把在安装和部署过程中碰到的问题整理下

首先记住,一定要配好你的环境变量AGENT_HOME,OMS_HOME,ORACLE_SID
然后大致的步骤就是 在你用来管理的机器上安装OMS,在被管理的机器上安装AGENT,然后用AGENT上传被管理机器的信息。

问题1:OMS Configuration hang
先停止这一步。修改opmn.xml,这个文件的位置往往在你的$OMS_HOME/opmn/conf下,找到如下内容在后面插入(蓝色部分)
<ias-component id="HTTP_Server">
<process-type id="HTTP_Server" module-id="OHS">
<environment>
<variable id="LD_PRELOAD" value="$OMS_HOME/lib/libclntsh.so"/> ---这里的$OMS_HOME用实际值代替
</environment>

然后retry,就能过去,Agent Configuration可能会出错,不管,继续。
其实GC服务器上的AGENT装不装取决与你需要不需要也用GC来管理本地的数据库或机器。(比如你安装GC的机器上原来就有一个数据库,而这个数据库也需要用GC来管理)
其实这个改动完全是用来骗过安装中的配置这步的,装完以后也可以用手动配置。所以要么就干脆不改,直接失败后继续,要么就改了骗过去以后再改回来(不改回来的话OPMN的HTTPD起不来)

问题2:opmn起不来
如果在刚才修改过opmn.xml,则opmn是起不来的,就因为我们那个改动,把刚才的改动去掉就行。
执行
$OMS_HOME/opmn/bin/opmnctl startall
其他常用命令
./opmnctl stopall
./opmnctl status                                     --DSA和LogLoader可以不用起 其他的应该都要起
./opmnctl startproc ias-component='xxx' --这里ias-component就是status看到的 如果一个ias-component对应一个process-type 用这个起
./opmnctl startproc process-type='xxx'   --这里process-type就是status看到的 如果一个ias-component对应多个process-type 用这个起

问题3:手工配置OMS
如果在安装software的时候,出错后选择了跳过,是需要手工配置OMS的。
用$OMS_HOME/oui/bin/runConfig.sh进行配置
语法如下
./runConfig.sh ORACLE_HOME=$OMS_HOME ACTION=Configure MODE=Perform

问题4:启动OMS
启动OMS一般不会有问题,除非你的配置不对或者你的opmn没起来
$OMS_HOME/bin/emctl start oms

问题5:启动AGENT
1    如果你要管理的机器上没有装过AGENT,那就比较方便,直接按照文档装。
2    如果之前装过,而且你的OMS服务器换了(比如换机器了或者重装了等等)那么就稍微麻烦点。看下面

首先是清楚之前的信息
$AGENT_HOME/emctl stop agent
1. rm -r <AGENT_HOME>/sysman/emd/state/*
2. rm -r <AGENT_HOME>/sysman/emd/collection/*
3. rm -r <AGENT_HOME>/sysman/emd/upload/*
4. rm <AGENT_HOME>/sysman/emd/lastupld.xml
5. rm <AGENT_HOME>/sysman/emd/agntstmp.txt
6. rm <AGENT_HOME>/sysman/emd/blackouts.xml
7. rm <AGENT_HOME>/sysman/emd/protocol.ini
然后再用命令清除一遍
$AGENT_HOME/emctl clearstate agent
重新配置一遍
$AGENT_HOME/emctl secure agent --这里的密码就是在安装software的时候 填的其中一个
启动
$AGENT_HOME/emctl start agent

然后更改AGENT原来配置的OMS upload目录的url
在这个位置
$AGENT_HOME/sysman/config/emd.properties
找到如下部分 修改蓝色部分
#
# OMS Upload URL
#
# if there is no receiving OMS or if you wish to disable the UploadManager
# please set this value to empty or comment out below line
#
REPOSITORY_URL=https://mgdb01:1159/em/upload

这个地址如果你忘记了还有个方法,就是用OMS所在机器上的AGENT来看(默认的GC服务器也安装了AGENT),命令$AGENT_HOME/bin/emctl status agent 然后找到Repository URL这一项就是。

最后上传本地信息到OMS
$AGENT_HOME/emctl upload agent

问题6:配置AGENT
如果需要手工配置AGENT,和OMS类似。
用$AGENT_HOME/oui/bin/runConfig.sh进行配置
语法如下
./runConfig.sh ORACLE_HOME=$AGENT_HOME ACTION=Configure MODE=Perform

主要的几个log目录
$OMG_HOME($AGENT_HOME)/sysman/log --存放运行emctl emca时的log
$OMS_HOME($AGENT_HOME)/cfgtoollogs/cfgfw --存放运行runConfig.sh时的log

我的oracle enterprise grid control曲折之路

最近,一直在研究oracle enterprise grid control。从看文档到配置完成,经过了很多的曲折,下面描述如下,希望我的收获也能给朋友们以参考。

1、  环境:

Os:IBM aix 5.3.0.8

Cpu:2×2.2G Hz

Memory :10G

磁盘:内置硬盘,168G

这其实是我的一台练习机器的分区。

2、  安装步骤;

a)         软件资源准备

在下载软件之前,我先在itpub.net上,下载了1.1和2.0版的ou sg。Oracle的软件下载还不错,我的速度大约1MB/s。我想安装的是oracle enterprise grid control 10.2.0.4,但是必须下载oracle enterprise grid control 10.2.0.1(full installer)和oracle enterprise grid control 10.2.0.4 (patch set),这也是oracle的特色吧。软件下载完成后,ftp到我的机器上,主机名:gridi4。注意,这个不是一个普通的名字,这个名字至少浪费了我两天时间。详情见下文。

b)oracle基本环境准备,这和以往的安装差不多。注意,差不多,还是差很多。

首先建立了2个文件系统:/oracle和/oracle_software。分别用于安装软件和存放安装介质。把软件上传到gridi4上之后,估计有部分人就会傻眼了,文件扩展名是“.zip”,aix下没有命令能够解压,还是oracle想得周全,在下载页面有个链接,提供各种版本的unzip供大家使用,废话不说,弄个文件,放在了gridi4的/bin目录下,解压缩用如下方式即可:

#unzip –d AIX_Grid_Control_full_10201_disk1.zip

--这个命令自动把多卷解压缩在一个目录下。

这样软件就准备好了。

3)那就开始装吧。这里有个问题,需要大街注意,那就是.profile。一般说来,安装oroacle软件,例如数据库,每个安装文档总是讲要先配置环境变量,但这次不同。只需要建立oracle用户和dba组即可,不需要设置oracle的.profile内容。

把下载的安装介质解压,需要用到mpio和unzip,如果不会用,自己google吧。

进入到解压好的Disk1的目录,运行:

$./runInstaller

一般来讲,如果你想省点事的话,选择安装到新新建数据库中。因为repository内容要存储在数据库中,这个版本内置的是10.0.0.1版本的 oracle 10g。前半程没有什么问题,一路“next”下去,和安装oracle数据库差别不大,也会用 root 运行2个脚本。到了最后的环节,很多人会出错。配置oms和agent,这是最后两个步骤,很多人都会功亏一篑。

为什么会出现这样的现象呢?我分开讲述。

(1)      配置oms错误,多半问题出现在listener上,如果这台机器上原来有listener,并且port 为 1521,则肯定会出错。因为新装的10.0.0.1的listener与原有的listener port(1521)冲突,如何解决呢?修改原有listener的port。

(2)      配置agent错误,这个问题出现的比较搞笑。我在2周内安装了10几次,没有一次成功,全部是卡在这了。因为软件安装在最后,会生成agent模块的配置文件:

/oracle/OracleHomes/agent10g/sysman/config/emd.properties。其中关键点有三行:

REPOSITORY_URL=https://gridi4:1159/em/upload

emdWalletSrcUrl=http://gridi4:4889/em/wallets/emd

EMD_URL=https://gridi4:3872/emd/main/

在网上,很多解决方案均提到了主机名配置问题,但我认为没说到点上。关键点就一个:主机名不要有大写,/etc/hosts配置不要弄错就可以了。我最开始的主机名:GRIDI4,安装到配置agnet的时候,以上三行中,主机名有两个是大写,一个是小写,总是不能通过。这是安装程序脚本的bug,奉劝大家,如果想顺利安装,主机名一定要小写。我在碰壁多次之后终于醒悟了,改为了小写,结果到这还是不能成功。看网上的文档,一般不详解这个问题,我在有实验了几次之后,决定不管三七二十一,打补丁吧,说不定,10.2.0.1在aix还有除了主机名大小写之外的问题。

老天不负有心人,我在打了补丁之后,竟然成功了。

在这插叙一下,如何打补丁。其实很简单,解压缩补丁介质之后,进到3731593这个目录,运行runInstaller,在选择安装目录时,在上方下来菜单里面选择oms10g和agent10g即可,当然,安装前一定要停掉oms和agent服务(好像它就没起来过),安装两遍,dell的文档说安装四遍,我看不需要,除非你还想把内置的oracle 10g 10.0.0.1也升级。

安装完补丁,不出意外的话,就可以启动了,我找了浏览器,输入http://gridi4:4889/em/,出现了登录界面,登录后,发现“home” 下的“overview”中,出现了up:1,unkonw:13,这说明agent其作用了,分别进入到agnet里面配置一下,就成为 up:13:unkonwn:1了,这个unkown是microsfot mom,IBM机器没有这些东西,所以不用管它。

 

终于安装成功了,我的心情很舒畅,我想歌唱,啦啦啦……..,怎么我的securecrt登陆窗口死掉了,再刷新网页也不行了,这是为什么呢?我刚感受到成功的喜悦,怎么又给我当头一棒呢!

各位请认真看了,以下才是本文的重点,当然前面所述与以下内容也有关。

我重新登录终端窗口以后,执行:

bash-3.2$ ./emctl status agent

Oracle Enterprise Manager 10g Release 4 Grid Control 10.2.0.4.0.

Copyright (c) 1996, 2007 Oracle Corporation.  All rights reserved.

---------------------------------------------------------------

Agent is Not Running

我的天,怎么刚成功就又停掉呢?分析操作系统日志,发现大量的软件异常终止错误,都和agent10g有关,他为什么刚起来就停掉呢?分析 agent10g的emd.trc,发现最后几条说系统没有足够的内存,不会吧,我的机器可是有10G的内存,很多人的生产机的配置也不一定比我的好啊,难道还运行不了你这grid control。肯定有内存泄漏,agent进程被操作系统强行结束了。回想一下,确实有很多可疑的地方,例如我在安装的时候,xmanager窗口多次强行结束,这在以前从未出现过。又经过一番狂搜,终于在韩国人的oracle 论坛上找到了答案:

修改oracle用户的profile,添加如下内容:

LDR_CNTRL="MAXDATA=0x80000000"

export LDR_CNTRL

AIXTHREAD_SCOPE=S

export AIXTHREAD_SCOPE

AIXTHREAD_MUTEX_DEBUG=OFF

export AIXTHREAD_MUTEX_DEBUG

AIXTHREAD_RWLOCK_DEBUG=OFF

export AIXTHREAD_RWLOCK_DEBUG

AIXTHREAD_COND_DEBUG=OFF

export AIXTHREAD_COND_DEBUG

然后重新启动agent,一切ok,我的系统连续运行几天,在没有出现过内存泄露的情况,系统负载很轻,oem界面一切正常。我成功了

原创粉丝点击