设为首页收藏本站

LinuxTone | 运维专家网论坛 - 最棒的Linux运维与开源架构技术交流社区!

 找回密码
 注册

用新浪微博连接

一步搞定

QQ登录

只需一步,快速开始

查看: 31328|回复: 18

[MySQL管理] DB平台化管理之MySQL监控   [复制链接]

Rank: 7Rank: 7Rank: 7

签到
64
注册时间
2008-11-27
最后登录
2015-1-16
在线时间
207 小时
阅读权限
100
积分
5859
帖子
771
主题
366
精华
4
UID
632

LT同学

发表于 2012-9-10 13:29:43 |显示全部楼层
本帖最后由 ytjwt 于 2012-9-10 13:45 编辑

上一篇博文介绍了(http://hi.baidu.com/ytjwt/item/d04380e39aca7a0964db0047 )为了应对大流量、大数据量的冲击,我们要脱离小规模的人工管理,需要搭建各个模块来帮助我们进行大规模自动化管理,本篇介绍,我是怎么做的MySQL数据库监控;这里不包括硬件、系统监控,因为我已经把他交给了更专业的系统部门,而我只需要关注数据库层面;
对于MySQL监控,我主要分为两类:
1、可用性监控;
2、性能监控;
在进行两项监控前,我们的考虑,我们用什么工具,是开源的,还是自己写的,开源的监控软件很多,哪一款才是我们需要的,如果全自己写一套监控系统,周期是不是会很长,因为我没有太多的时间,所以选择了开源的,而经过对比,终于一款脱颖而出:zabbix;因为现在已经有第三方公司fromdual(http://www.fromdual.com/mysql-performance-monitor )帮助我们编写了各个子模块,并且根据他提供的模型,我们可以很容易编写出更多的监控,如:对DB Proxy。选定了监控工具后,我们就考虑如何去实现上述两类监控,在这里,我把两类监控合并在一块,先监控可用性、可用性监控完毕后,立即监控性能;
一:监控整体流程:
当然我们也不是完全照搬fromdual的模型,经过改进,最终形成的体现结构如下:




我们看到,这里FromDualMySQLagent.pl了调用了5个模块,即在我的监控模块中,我监控了mysql、master、slave、innodb、proxy5个大类;对比官方的监控,有几个大的改进:
1、由于官方的FromDualMySQLagent.pl只能串行执行配置文件里的zabbix.host,而我通过FromDualMulti.pl切分,把zabbix.host切分到N多配置文件(一个zabbix.host一个配置文件),然后并行调用FromDualMySQLagent.pl,这样就并行化,提高效率,并且我们可以把监控的力度设置很细,还解决了当光纤断时,一个大的配置文件在一个监控周期中,监控不完所有的zabbix.host的问题;
2、我这里并没有通过zabbix_agent推送数据,而是通过crontab -l 执行,然后把结果通过trap,把监控数据推送给zabbix server;
如:



3、为了防止网络抖动,添加了连接超时,连接失败总次数,只需要在FromDualMySQLagent.pm基础模块中修改即可,如下:我选择超时5次;




在FromDual的整个模型中,我们很容易根据自己需求写监控模块,如:DB Proxy,这也是我选择他的主要原因,我们不需要修改主流程代码动态添加监控模块,为以后支持的其他类型DB监控提供了好的便利;
二:监控的点
对于MySQL,主要监控了如下信息:
1、daemon的可用性,是否能连接上,包括宕机、too many connection;
2、主库是否可以写入;
3、从库的同步状态;
4、从库是否延时,这里不仅仅判断behind,还判断时间戳,时间戳是在监控主库的时候,写入进去的;
5、性能监控,在连接没有异常的情况下,会取出一些性能数据,如果com_select, buffer使用情况等;
6、在监控Proxy的时候,当从库异常情况下,如:同步关系、延时等,会动态更新Proxy的backends的状态,摘除异常的从库;
三:添加监控
1、在zabbix web管理上添加host【非传统的机器概念】:


2、在总配置文件:FromDualMySQLagent.conf


我们看到,我做了一些约定,通过host名字,我就能清晰的看出,是哪台机器的哪个端口,角色是什么;这样在我们在以后的管理系统中,就能使用到了;
另外,我们只需要在新的监控点上部署相应的程序可以动态的扩张我们的监控,如各个IDC内部添加监控点;
四:报警
很庆幸,zabbix的报警模块很智能,哪些需要报邮件,哪些是报短信;我们自己都可以定义,在这里,我是通过级别分短信、邮件,当然我们可以定义更多的级别,也能定义更多的触发动作,我们还可以根据host group把不同的触发动作给相应的管理人员;这些都是zabbix 帮我们做;


另外,我们可以根据检测到的失效次数,来定义触发的动作,我们总不希望,当发现宕机后,我们在维修阶段,手机短信不停的报过来吧;如下:1-3次 报短信  4-10 邮件,11-13次在报短信等;


5、性能状态:
大家对数据可能都不太感冒,而图确是一目了然;目前的QPS多少,访问量波动是否正常等。如下:很明显,上线的新代码有问题了;果断让开发查原因,去掉不应该的查询;


6、zabbix的管理
我们的人力资源肯定跟不上开发,所以,zabbix再次带给我一个想要的功能,那就是权限管理,我们可以根据host group授予开发查看性能状态的权限,这样,他们会主动根据图、根据性能,去查看是否是自己的业务有问题;是否被恶意攻击等,减轻我们DBA的压力;

至此,监控整体框架也搭建完毕,只需要根据自己的特性来设置即可,但是还有很多的不足,需要改进,如:能否根据性能指标变动异常报警,能否快速联动添加新的监控host、如何解决zabbix_server单点问题及zabbix_server性能问题;
http://hi.baidu.com/ytjwt/

Rank: 8Rank: 8

注册时间
2011-9-16
最后登录
2017-1-17
在线时间
566 小时
阅读权限
90
积分
190406
帖子
2164
主题
2
精华
0
UID
15647
发表于 2012-9-10 20:41:14 |显示全部楼层
可惜图片都挂了,必须到原文那里才能看到

使用道具 举报

Rank: 8Rank: 8

注册时间
2011-2-23
最后登录
2015-9-28
在线时间
650 小时
阅读权限
90
积分
83677
帖子
376
主题
13
精华
0
UID
12125
发表于 2012-9-10 22:07:48 |显示全部楼层
是啊...百度防盗链啦...

使用道具 举报

Rank: 8Rank: 8

注册时间
2011-6-19
最后登录
2016-2-26
在线时间
126 小时
阅读权限
90
积分
39878
帖子
67
主题
1
精华
0
UID
14485
发表于 2012-9-11 10:35:31 |显示全部楼层
写的蛮不错的,即将成为一名Mysql DBA

使用道具 举报

Rank: 6Rank: 6

注册时间
2012-3-14
最后登录
2013-5-14
在线时间
29 小时
阅读权限
70
积分
9020
帖子
12
主题
3
精华
0
UID
18655
发表于 2012-10-8 10:26:33 |显示全部楼层
图片右击属性,复制链接在浏览器里就可以看到

使用道具 举报

Rank: 8Rank: 8

注册时间
2012-5-27
最后登录
2016-4-11
在线时间
118 小时
阅读权限
90
积分
29960
帖子
40
主题
2
精华
0
UID
20221
发表于 2012-11-21 18:02:30 |显示全部楼层
不错,要好好研究一下

使用道具 举报

Rank: 8Rank: 8

注册时间
2012-3-6
最后登录
2015-10-15
在线时间
51 小时
阅读权限
90
积分
38930
帖子
62
主题
4
精华
0
UID
18436
发表于 2012-12-10 09:40:37 |显示全部楼层
图片看不到的吗?

使用道具 举报

Rank: 8Rank: 8

注册时间
2011-2-22
最后登录
2013-8-29
在线时间
93 小时
阅读权限
90
积分
17818
帖子
111
主题
3
精华
0
UID
12110
发表于 2013-1-9 13:23:53 |显示全部楼层
图片看不到啊
运维博客:
    http://blog.awkton.com

使用道具 举报

Rank: 6Rank: 6

注册时间
2012-12-7
最后登录
2013-4-12
在线时间
8 小时
阅读权限
70
积分
2540
帖子
26
主题
3
精华
0
UID
36335
发表于 2013-1-10 17:07:08 |显示全部楼层
原文在哪?
www.reining.com.cn 瑞宁堡垒机

使用道具 举报

Rank: 8Rank: 8

注册时间
2011-11-14
最后登录
2016-4-22
在线时间
201 小时
阅读权限
90
积分
85542
帖子
84
主题
3
精华
0
UID
15935
发表于 2013-1-16 10:36:16 |显示全部楼层
百度防盗链了么?  楼主的原文地址:http://hi.baidu.com/ytjwt/item/2bbd69a0869d1ef314329b6a

需要看的同学去看看吧

使用道具 举报

Rank: 6Rank: 6

注册时间
2013-1-17
最后登录
2013-2-10
在线时间
6 小时
阅读权限
70
积分
2143
帖子
20
主题
0
精华
0
UID
36926
发表于 2013-1-27 13:16:10 |显示全部楼层
图片看不到啊,不过内容讲的很全面

使用道具 举报

Rank: 3Rank: 3

注册时间
2013-1-28
最后登录
2013-10-29
在线时间
3 小时
阅读权限
30
积分
326
帖子
3
主题
0
精华
0
UID
37033
发表于 2013-3-20 13:10:38 |显示全部楼层
很不错。真厉害。高手就是高手

使用道具 举报

Rank: 8Rank: 8

注册时间
2012-12-27
最后登录
2014-9-11
在线时间
160 小时
阅读权限
90
积分
32594
帖子
210
主题
10
精华
0
UID
36673
发表于 2013-3-21 10:14:55 |显示全部楼层

使用道具 举报

Rank: 8Rank: 8

注册时间
2011-4-1
最后登录
2017-1-17
在线时间
97 小时
阅读权限
90
积分
21591
帖子
129
主题
27
精华
0
UID
12637
发表于 2013-3-27 13:48:08 |显示全部楼层
重新整理学习的系统知识
网络无界限,分享无屏障http://www.idckx.com/  IDC快讯

使用道具 举报

Rank: 6Rank: 6

注册时间
2013-3-20
最后登录
2014-1-21
在线时间
40 小时
阅读权限
70
积分
4044
帖子
7
主题
0
精华
0
UID
37548
发表于 2013-3-27 16:01:59 |显示全部楼层
学习了,,谢谢

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

IT运维专家网感谢您的支持

合作联系: QQ:67888954/MSN:cnseek@msn.com/mail:netseek@linuxtone.org

Archiver|手机版|感谢所有关心和支持过LinuxTone的朋友们 转载本站内容请注明原作者名及出处 ( 京ICP备08103151 )   |

GMT+8, 2017-1-17 14:44 , Processed in 0.030075 second(s), 11 queries , Apc On.

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部