性能优化工具:
Guest Tools (Linux) 包含以下部分:zwatch_vm_agent,node_exporter,collectd & collectd_exporter
Guest Tools (Windows) 包含以下部分:zwatch_vm_agent,Windows 的 qemu-guest-agent (QGA),virtio 以及 pvpanic 相关驱动
性能优化工具问题排查思路:
windows:
1.安装时确保未加载数据盘,如果需要带数据盘进行安装,可以通过手动挂载ISO进行安装。
2.确保三层网络是否开启了DHCP、支持userdata,保证云主机正确配置IP地址,确保云主机详情页设置的操作系统正确,IP地址与云平台界面分配的IP地址一致【这里在windows中不会导致安装失败,但是会导致安装后内部监控及部分功能无法使用】。
3.检查安全组是否限制了云主机到169.254.169.254的通信。
4.可能有残留,参考下列卸载性能优化工具重新安装。
linux:
1.确保三层网络是否开启了DHCP、支持userdata,保证云主机正确配置IP地址,确保云主机详情页设置的操作系统正确,IP地址与云平台界面分配的IP地址一致。
2.云主机内部检查是否能与169.254.169.254地址通信,route -n检查云主机路由,需要包含到169.254.169.254的主机路由。
3.安装性能优化工具需要使用curl、tar等命令,若无命令会提示明显报错,安装时需要root用户权限。
4.检查安全组是否限制了云主机到169.254.169.254的通信。
性能优化工具问题汇总:
问题一:云主机性能优化工具版本过低。
a.重新安装性能优化工具。
b.windows带数据云盘可以手动安装性能优化工具,上传 /opt/zstack-dvd/x86_64/c76/tools/guesttools/x86_64/KVM/GuestTools-1.3.0.iso至云平台,挂载镜像到云主机进行手动安装。
问题二:卸载性能优化工具:
windows:
1.在windows云主机的注册表中删除以下键值
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\MSDTC
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSDTCH
KEY_CLASSES_ROOT\CID
2.停止msdtc服务并重新安装,以管理员身份命令窗口运行
net stop msdtc
msdtc -uninstall
msdtc -install
3.重新启动windows云主机
4.卸载以前版本的QGA,以管理员身份命令窗口运行
C:\Windows\system32>msiexec /a “c:\Program Files\GuestTools\qemu-ga.msi” targetdir=”c:\Program Files”
C:\Windows\system32>”c:\Program Files\QEMU Guest Agent\Qemu-ga\qemu-ga.exe” -s vss-uninstall
linux:
1.停止agent,执行命令:service zwatch-vm-agent stop
2.删除文件/etc/systemd/system/zwatch-vm-agent.service
3.删除目录/usr/local/zstack/zwatch-vm-agent
问题三:windows安装性能优化工具报错 A network error occurred while attempting to read from the file:C\Program Files\GuestTools\ClOUDBASEINTSETUP_1_1_2_X6.MSI. 解决方法:先卸载cloudbaseinit后重新安装性能优化工具。
问题四:安装性能优化工具提示此程序需要windows的service pack 1【http://bbs.zstack.io/forum.php?mod=viewthread&tid=3829】
解决方法: 下载service pack 1的离线安装包并进行安装,注意安装时将会涉及云主机重启。
win7和windows server2008 R2离线包下载链接 https://www.catalog.update.microsoft.com/Search.aspx?q=KB976932
问题五:debian系统安装性能优化工具失败
解决方法:将vm-tools.sh脚本中service zwatch-vm-agent restart 修改为systemctl restart zwatch-vm-agent。
问题六:性能优化工具pprof漏洞。
windows:9182端口漏洞
3.x版本涉及:参考内部BBS修改注册表,将0.0.0.0:9182修改为127.0.0.1:9182.
4.x以上版本不涉及该漏洞。
linux:9100端口漏洞
临时解决方法一:
a.登录到发现漏洞的云主机内修改 collectdExporter.bindIp 和 nodeExporter.bindIp 修改为 127.0.0.1
# vim /usr/local/zstack/zwatch-vm-agent/conf.yaml //修改collectdExporter.bindIp和 nodeExporter.bindIp 修改为 127.0.0.1
# systemctl restart zwatch-vm-agent
b.低版本的配置文件中没有collectdExporter.bindIp和nodeExporter.bindIp参数可以参考以下方法:
方法一:
# ps aux |grep -i node_exporter
# ps aux |grep -i collectd_exporter
找到对应的进程,完整的记录进程,然后kill掉进程,手动强制修改IP。
# kill -9 pid
# nohup /usr/local/zstack/zwatch-vm-agent/node_exporter –web.listen-address 127.0.0.1:9100 &
方法二:
替换管理节点zwatch-vm-agent文件,重连物理机。
1.编辑管理节点的agent_version文件,替换 zwatch-vm-agent_aarch64和替换 zwatch-vm-agent,双管理节点情况下,两个管理节点均需编辑替换,同时对要修改的文件进行备份。
2.物理机上,删除 /var/lib/zstack/kvm/ 目录(确认该目录下仅有zwatch相关文件)
3.重连物理机
4.已经安装zwtach的云主机,需要在云主机内部,删除 /usr/local/zstack/zwatch-vm-agent/conf.yaml 文件
5.云主机重新安装zwatch并检查监控状态
问题七:查询性能优化工具版本。
windows:在程序管理中查看GuestTools版本。
linux:cat /usr/local/zstack/zwatch-vm-agent/agent_version