全球运维大会”观后感:打造传统银行“服务化运维体系”
Wednesday, December 23, 2015
9:41 PM
|
| | —- |
| Tags: #微信 #数据中心操作系统 |
全球运维大会”观后感:打造传统银行“服务化运维体系”
2015-12-23 周佳
推荐语:
这篇文章来自浙商银行信息科技部运维人员周佳的投稿。周佳在2015年10月参加完“全球运维大会上海站”之后,总结了各家运维理论的“干货”,并结合自身企业特点提出了一些“干货”的落地办法。
同时预告一下,2016年3月,“GOPS 2016 全球运维大会·深圳站”即将启航,规模更大,干货更多。
全球运维大会是在10月31日,我是网上报名参加了全球运维大会上海站的活动,因人数太多,是被抽签参加的,能够参加这个活动属机缘巧合。本次活动以“运维2.0行业的思与辩”为主题,讨论运维行业的现状与未来。这个活动名头很大,说是全球运维大会,其实是全国性的运维大会,以基层运维人员为主。现场参会的企业以互联网居多,传统行业为辅。互联网企业中既有BAT,也有规模仍不是很大或刚刚起步的、目前比较流行的互联网创业公司。传统企业以金融行业居多。
这次运维大会活动组织者是活跃在互联网企业的运维人,有10年以上的运维经验,有多家公司的从业经历,从切身实践出发,探讨对运维未来的思考,并在现场成立了开放运维委员会。(这个开放运维委员会是挂靠在数据中心联盟下,数据中心联盟是工信部下属的标准化组织,带有官方性质的。为运维人士、企业提供服务)。
运维发展至今,已然不是刀耕火种的时代,迷茫与徘徊、转型和进化,运维的将来会怎样?下一个路口在哪里?在本次活动中,我听取了几位运维经验丰富的运维专家对运维工作的讲解,从精益运维、白盒运维、智能化运维等3个方面学习运维工作,我做了一些整理,分享如下:
一、经验分享
1)精益运维(优维科技创始人 王津银(隔壁老王),腾讯公司、YY、UC) “精益思想”来自于丰田生产系统(TPS)。丰田生产又称精益生产,包括经营理念、生产组织、物流控制、质量管理、成本控制、库存管理、现场管理和现场改善等在内的较为完整的生产管理技术与方法体系。说的简单一点,就是通过各种标准化的方式控制成本,然后又好又快的造出丰田车。
当丰田的精益思想和运维工作相融合,可以形成精益运维,即以最小的成本(资源投入、系统设计、运维人力等),完成质量最好及速度最快的系统交付和优化。
如何实现精益运维呢?以标准化的资源为基础,提炼各种运维IT对象(硬件、操作系统、数据库、组件、运维文档等)的标准化等,利用CMDB系统(配置管理的标准化),结合各类自动化工具,再通过多种平台,如监控平台、调度平台、流程平台、质量管理平台等,实现精益运维。
2)白盒运维(云霁科技创始人 智锦 ,原支付宝运维团队初创成员、原建行总行云计算运维专家)
我要分享的第二个运维理念是白盒运维,这个词是将软件测试里面的“白盒测试”与“黑盒测试”的概念延伸到了运维领域。
企业管理者或业务部门会觉得运维部门是成本部门,从重视程度来看,运维工作只要能支撑业务就行。从体制职责上来看,开发部门完成功能开发后,很多非功能性的问题都由运维人员承担。运维人员实际上是所谓的“黑盒运维”,不完全清楚所维护系统里的业务依赖关系、应用配置关系等。当系统出现问题了,只能通过查询、分析各种日志文件来定位故障问题,通过积累出现各种问题的现象经验来提高运维水平。我把黑盒运维做个比喻,就是人在黑暗的房间里前进,只能摸索前进,看不见看不清,容易碰壁。黑盒运维是一种被动的运维、不清晰的运维。
有了黑盒运维就有白盒运维,白盒运维的核心是从配置管理着手,结合相应的工具和平台,从前端浏览器(或客户端)到后端应用服务器、数据库,能够实时、有效的监控和分析系统执行的每一个环节,真正清楚所管理的系统的应用功能和配置,从根本上解决运维的问题,实现标准化、自动化运维。打个比喻,白盒运维就是人在开灯的房间里前进,看的见看的清,不容易出问题。白盒运维是一种主动的、清晰的运维。
其中,智锦结合互联网和银行的跨界运维经验,提出了传统企业自动化运维的建设趋势:像互联网企业一样创新,像传统企业一样保证服务质量,以标准化、自动化为方向,打造服务化的运维体系。
3)智能化运维(腾讯游戏运维总监 刘栖铜)
我要分享的第三个运维理念是腾讯游戏提出的智能化运维,提出者是腾讯游戏运维总监,刘栖铜。
他认为运维工作是一种技术运营,在自动化运维的时代,作业操作以及场景自动化处理都是各类脚本和工具的使用,解放了大量的人工重复操作。
运维的未来方向是智能化运维,智能化运维是一种更为高级的自动化运维,通过运维部门自身开发的运维工具,重在实现故障自愈、复杂场景下的智能分析和决策、闭环的自动执行,并通过运维的大数据和逻辑预设来影响运营决策,最终实现成本与服务同时兼顾。
(腾讯游戏介绍:超过50%的利润由腾讯游戏产生,目前支撑了300多个游戏,运维部门260人,其中100人作为开发人员开发运维工具的)。
二、启发篇
1)我受到的启发
以上3位运维人讲述了各自的运维体系。隔壁老王以丰富的从业经历,参考丰田汽车的质量管理体系,提倡精益运维。智锦经历了阿里自下而上和建总行自上而下的运维发展,阐述了对运维的改良建议,提出了白盒运维。刘栖铜从腾讯游戏的5人运维团队到现在260人运维团队,经历了手工运维到在现在的自动化运维,并以智能化运维为方向。
我受到的启发是这些运维人的运维体系不同,运维理论有所差别,但标准化和自动化的方向都是明确的,他们各自的运维体系都说明这些运维人在运维工作中的思考,结合自身的行业特点,并在实践中检验获得了成功。运维工作就是服务工作,本质是输出服务。运维的价值需要依托被服务的业务体现出来。(被服务的业务,对内来说就是所维护的系统、硬件、运行值班、以及各个团队之间的协调工作等。对外来说就是运维部门以外的部门)。
2)听过别人家的运维,干过自己家的运维,结合自己的工作,谈谈体会,主要是3点。
2.1 细化工作还需提升。
今年开始,工作有了些小调整,在T3团队里,偏向硬件主机类的方向。根据行里的大发展战略,工作量提升了很多。接触的硬件主机数量可能超过以前3-4年的总和,新品牌、新型号设备也很多。在工作过程中有些细化的工作做的不够好。比如接触的新硬件,和原先有差别,有提高,有新特点,这些新内容都没有及时的了解和研究。在相关的标准化操作、自动监控上(装机标准规范、配置标准规范)也没有及时体现和改进。
2.2 工作内容不平衡
相对硬件设备,我对于操作系统类缺少系统性的学习,新版本的内容也都没有及时跟进了解,尤其在性能优化、一些基础操作上都需要后续改进,和大家一起进步。
2.3 储备更多的标准化、自动化的内容,发挥“以人为本”。
【1】、做好小标准化、小自动化。现在各个团队都有自己一些标准化、自动化的内容,这些都是在实际的运维工作中总结出来的。这些内容都非常宝贵,可以为未来的标准化平台、自动化平台打好基础。
【2】、发挥主观能动性,学习IT新工具、新知识以及相关金融业务知识等,适当参加外面的运维交流。目前运维小伙伴都很多,都是90后,能力好,对新事物有更多的接触和接受,更具有运维创新的潜力和动力。现在单位的条件好了,大家更要多动手,加强基础操作和系统性的学习。有需要的,可以在拷机间搭建自己的小环境动动手。
三、展望篇
3.1个人对运维未来的展望。
通过本次运维大会的学习,发现互联网企业的运维走在技术时代前沿,他们的产品工具、对数据库、对操作系统的研究和创新非常领先。金融业作为传统行业的代表,运维工作依靠着规范的组织架构、严密的规章制度、完整的技术人员保证着运维质量。
在互联网时代,金融行业现在越来越和互联网相结合,尊重和融合互联网,同时了解技术差距,利用自身优势,做好运维工作。在技术越来越成熟的今天,金融的运维工作不仅是技术,也是服务,运维部门不仅仅只是支撑部门,也可以有能力从运维的角度为开发部门提供技术服务,为业务部门提供更好的数据服务、保障服务。
3.2 愿景
借用刘行长的“真空妙有”,“妙”用互联网企业的运维经验,在自身的运维工作上形成特点并创新,建立基于运维标准化的规范和方法论,结合自身平台和产品工具,实现运维自动化,像互联网企业一样创新,像传统企业一样保证服务质量,打造服务化的运维体系。
·····························································································································
为了促进更加深入的业内同行技术交流,也为了传播先进技术理念,将于2016年3月25日、26日两天在深圳举行第二届全球运维大会——“ 运维之春 | GOPS 2016 全球运维大会·深圳站 ”,大会依然由四大运维体系发起人领衔、各大运维专家倾情演出。相对上海站规模扩大为2天,每天1个主会场,3个分会场,共计30余场精彩演讲。在此邀您共赏天下运维盛况,共商天下运维大事!
详情及报名,请点击“阅读全文”
已使用 OneNote 创建。