IBM小型机巡检维护常用命令

IBM小型机巡检常用命令 Errpt 查看错误日志。

Errpt |head 查看最近产生的错误日志。 Errpt –d H |more 查看关于硬件报错的日志。 Errpt –aj查看错误详细信息,“错误的标识号”。

Errpt –a –j ****(日志ID)查看某个日志的详细内容。 Uptime 查看机器总共运行的时间。 Uname –uM 查看机器的型号。

Uname –a 列出系统ID号,系统名称,os版本等信息。 Oslevel –s 查看机器的系统版本等级。 Oslevel –r 查看补丁。

Instfix –i grep查找补丁文件。Lscfg –vp 检查所有设备的微码。 Lsvg –o 查看系统卷组。

Ls –l/image.date 查看系统有没有备份image文件,记录备份最后日期。 Lsvg –l rootvg 查看rootvg卷的详细信息,查看又符合要求的数据备份和保护。 Syncvg 修复“stale”状态的逻辑卷。 Lsvg –p rootvg 使卷组文件同步。

Bootinfo –k 查看系统内核版本是64位还是32位。 Bootlist –m –normal –o 查看显示当前的首选启动项。 Bootlist –m –normal cd0 设置当前的首选启动项为cd0.

Lslv –l datalv 和 lslv –p datalv 显示逻辑卷各种信息,如包括哪些盘,是否有镜像等。 Lslv –m hd5 找出bootimage所在的硬盘,如hdisk0. Bosboot –ad /dev/hdisk0

Bootlist –m normal /dev/hdisk0 重建启动顺序表。

Sysdumpdev –l系统的Dump设置,可以用来修改和查询。 Sysdumpdev P p /dev/hd6 s /dev/sysdumpnull 。 Sysdumpdev -P -c

Lsps –a显示所使用的分页空间。

Lsps –s 检查内存交换区(paging space)使用率是否超过70%。 Chps –sX pgname 超70%用此命令增加X个PP。

Mkps –a –n –sX myvg 超70%在myvg上增加一个PP数位X的内存交换区。 Svmon –G 查看内存使用的情况,svmon只能由root用户来执行。 Lslpp 查看文件组信息。

Lslpp –L |grep 23100020 devices.pci.23100020.rte 4.3.2.7 C IBM PCI 10/100 Ethernet Adapt ,查看某个文件组是否已安装,如以太网卡驱动。也用于查询补丁程序的版本。 Lslpp –ll bos.perf.tools 运行这个命令来确定 svmon 是否已安装并可用。

Vmstat 用来获得有关进程、虚存、页面交换空间及 CPU活动的信息。这些信息反映了系

统的负载情况。

Vmstat 1 10 ,Iostat 1 10 查看系统是否有性能瓶颈。 Topas 监控系统活动,比如Memory,I/O,CPU,Process。 Ifconfig –a 显示或者设置网络设备。 Netstat –in 显示网络状态。 Netstat –rn 显示路由状态。

Chdev –l inet0 –a route=‘10.47.0.0’,‘9.3.240.59’加入永久路由。

Route add 10.47.1.2 9.3.240.59 加入临时路由。 Vi/etc/hosts 查看hosts是否有特殊意义。 Ping *********(IP) 查看网络是否通的。 Lsattr –El inet0 路由的检查。

Smitty ssaraid 查看保护状态是否正确。 Smit aio进入可更改参数。

Lsdev –C|grep aio查看状态是否是 Available . Lsattr –El aio0 查看层面属性是否正确。 Smit aio 进入层面更改参数。

Ps –ef | grep erro 查看错误的守护程序。

Ps –ef | grep src 查看常驻的主控程序是否正常。 Diag 系统硬件诊断。

/usr/sbin/cluster/diag/clconfig -v '-tr' hacmp测试。 Lssrc –g cluster 获取子系统的高可用群集。

lsattr -El sys0|grep maxpout 查看最大输出功率。 lsattr -El sys0|grep minpout 查看最小输出功率。 Df –k 查看文件系统使用率是否超过90%。 Mount 列出已加载的逻辑卷及其加载位置。。

/usr/lpp/diagnostics/bin/utape –cd rmt0 –n 查看tape使用的时间,大于72小时就

清洗

/usr/lpp/diagnostics/bin/utape –d rmt0 –n 查看tape是否清洗。

Smitty ssraid 进入raid设置,Change/Show Attributes of an SSA RAID Array. Lsdev –Cc adapter 查看PCI卡的status Lsdev –Cc hisk 查看硬盘的status。 Lsdev –Cc processor 查看cpu的status。 Lsdev –Cc tape 查看tapedrive的status。 ps –ef |grep dt 查找dt有关的进程 kill PID 杀死dt有关的进程。

Hostname 检查当主机名。(主机名假如是 tscf50),列出系统网络名称。 Netstat –i |grep tscf50 查看主机名是否对应有效的IP地址。 Chdev –l inet0 –a hostname=myhost 更改主机名。

Chdev –l en0 –a netaddr=‘9.3.245.58’ –a netmask=‘255.255.255.0’修改网络地

址,在同一网中,subnetmask应一致。

Smitty tcpip 更改主机名或者IP地址,使主机名与当前有效地IP地址存在对应关系。 /etc/rc.dt 重新启动CDE界面。

Cat /etc/hosts HACMP环境下可把主机名alias到127.0.0.1上。

ps gv|head -n 1; ps gv|egrep -v \ 通过不同时间

输出的比较,就能观察出内存和CPU占用率的基本情况。 找出其中占用内存数不断变大的进程, 这个进程可能就已经发生了内存泄漏。

sar -P ALL 2 10 sar 指令也可以查看CPU占用率,但统计的结果不是很准确。表示2秒钟

输出一次结果总共有10次结果,然后平均。 目前,如果发现内存泄漏,最好重新启动系统。

Vi /usr/adm/cluster.log (查看)记录了HACMP的状态,由HA得守护进程产生。

Vi /tmp/hacmp.out (查看)记录了HA的详细脚本,如果出现event failed的字段,则有

可能问题出现在该层,如果在问题出现的时段,hacmp.out无信息出现,则问题可能出现在应用层

Vi /usr/sbin/cluster/history/cluster.mmdd (查看)记录了HA的各个事件的发生。 Vi /tmp/cm.log (查看)由clstrmgr进程产生,每次HA重启时会被覆盖。

Smit clstart 启动HACMP 双机系统,必须要有root 用户的特权分别进入到系统各节点主

机在命令行上执行上述命令即可。 或者下面的命令。

/usr/sbin/cluster/etc/rc.cluster -boot -N –I 需要注意的是在双机系统中HACMP 双

机软件先启动的节点将成为主节点拥有资源 并对外提供关键服务后启动的节点将成为备节点.

另外在启动HACMP 前需要启动双机上的INFORMIX 和SCP 应用. Smit clstop 或者clstop –gr HACMP 双机系统的关闭。要关闭某节点上的HACMP 双机软

件必须要有该节点root 用户的特权以root 用户进入到 该节点主机在命令行上执行下述命令即可.

Lssrc –g cluster 检查HACMP 双机软件在该节点是否已启动。Status显示是active就是

正常。

/usr/sbin/cluster/clstat –a 在确认双机系统HACMP正常启动的情况下在命令行执行此命

令来查看双机系统的当前状态。Status显示up就是正常。

Lsdev –C –s scsi 查看scsi设备的当前状态和相关信息。

Ps –ef 查看正在运行的所有进程的各种信息,(如进程号及进程名单)。 Lspv 查看物理卷信息。

Telinit S 到 init s 到 shutdown –m 执行此三中命令会关掉AIX到单用户模式。

2011年1月26日星期三

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4