本人于2009年12月迁移至独立BLOG。
1、欢迎光临运维进行时,希望认识更多志向相同的朋友!
2、本站部分资源来源于网络,如有侵权请及时与我联系!
3、强烈建议使用Firefox、Opera、Safari及IE7以上的浏览器访问,以获得最佳浏览质量!
4、请勿发表与中华人民共和国法律、法规相抵触的言论,谢谢合作!
5、本人发布的文章与评论内容仅代表本人观点。
分页: 1/1 第一页 1 最后页 [ 显示模式: 摘要 | 列表 ]

       2014年11月21日至22日,51CTO传媒主办的2014WOT全球软件技术峰会·深圳站将在深圳召开,技术人员和企业实践用户将齐聚深圳。WOT是由51CTO传媒主办的国内最具有影响的技术峰会,自2012年以来,秉承专注技术、服务技术人员的理念,获得了广大IT从业者和技术爱好者的一致认可,成为了业界重要的技术分享交流平台以及人脉拓展平台。
    本次2014 WOT·深圳站将邀请国内外顶级的互联网及创新企业技术负责人,首次对外公开其当下最in技术,分享涵盖六大主题,共有30+课程,移动游戏运营、运维开发、Web安全、数据挖掘、团队管理等以及未来两三年的技术趋势。点击报名>>

本次采访对象是本次2014WOT深圳站<自动化运维>论坛的演讲人刘天斯,目前为腾讯的高级运维工程师

点击在新窗口中浏览此图片

1、您目前在贵公司负责哪些事情?能否先简单谈谈您在运维领域的从业经验,和您对此运维的理解?

        从事运维方面的工作刚满10年,前6年负责天涯社区的系统架构及运维的工作,2011年入职腾讯,先后负责静态类、大游戏下载业务的CDN运营,以及负责公司所有游戏的大数据接入、分析、提取等工作。

        简单分享个人在运维领域从业的两个经验:

        1)关于运维自动化这件事情,几乎所有的IT企业都在做,看似是一件非常好的事情,忽略了前提条件,往往付出更大的代价及运营成本。所提到的前提条件便是运维体系“标准化”、“流程化”、“规范化”的建设,覆盖企业中资源、版本、业务发布、监控、事件管理等环节。有了这些作为基础铺垫,运维自动化的建设才会很顺利实施,达成预期。

        2)业务的生命周期管理,运维扮演的角色。当一个产品在规划之初运维人员须第一时间介入参与,根据产品特点,提供业务平台前期架构设计、资源评估等数据。当产品进入开发阶段,须与开发人员保持密切沟通与互动,提供业务接入、缓存、存储、监控、安全等方面规范,以便在编码阶段更好磨合与对接,避免上线后反复做不必要的版本迭代,也使得开发出来的产品具备更高的可运维性。待业务上线后,务必定期同步相关运营数据给产品与开发人员侧,为后续优化、改进的工作提供数据支持,这也恰恰能体现运维人员的专业性及团队合作意识。

        运维体系中各个环节的工作犹如散落在地上的珠子,每个珠子分别代表事件、资源、监控、安全、自动化、日常工作等,看似是七零八落的,我们需要利用“流程”这条线将所有的珠子串起来,珠子的前后顺序及间隔由“标准规范”来控制。这样就形成了一条完整的链子,是一个有机的整体,最后会促使运维工作开展得井井有条。这条链子扣在三个点子上,就是“质量”、“效率”、“成本”。

2、能否讲讲这么多年运维工作的变化与演进?

云计算给IT行业带来的巨大冲击,从最初的不信任逐渐到认可,到最后各类云计算应用的落地普及。当然,这也给运维人员带来非常大的挑战,尤其承担企业私有云的建设,运维人员除了具备传统运维的能力外,还需要深入理解业务资源使用的特点,例如区分是计算性、内存型、IO型还是存储型,同时需要对资源进行合理的规划及定义扩容规则。私有云作为资源的一个大池子,如何保持其弹性,需要具备一套精准的监控手段,配合自动化运维工具来保障,包括自动化安装部署、配置管理、存储管理、故障处理、备份容灾等。实现业务快速上线,资源快速扩容,同时具备高可用的能力。在这种大背景下,运维人员除了会用“云”,且要求用好“云”,才能给企业带来价值。另外基于容器实现的虚拟化(Docker)已经兴起,将给业务的打包、部署、迁移、测试等都会带来革命性的变革,运维准备好了吗?

3、随着如今大数据的爆发,这给运维工作带来了怎样的冲击与改变?

大数据在企业做精细运营方面发挥了巨大的作用,作为底层服务支撑的运维,需要掌握大数据生态圈中关键技术点,包括Hadoop、hive、hbase、spark、storm等平台的日常运营,需要解决包括资源调度、数据接入、快速扩容、节点故障处理、高可用、数据存储生命周期管理等问题,这给运维人员提出了更高的要求,同时也给运维工作带来了新的机遇,一典型案例是将所有告警接入storm实时计算分析,过滤出有效告警,同时将信息入库Hadoop,以便做历史档的离线分析,让运维人员更懂业务。

4、贵公司在监控上用了哪些技术?使用开源的还是自主研发?

公司内部使用了自研方式实现监控体系的构建,局部会使用开源工具作为补充。

5、您认为目前国内的自动化平台以及数据可视化平台建设如何?还需要加强哪方面发展?

        自动化运维是每个企业都在追求的终极目标,做到一键触发业务上线、故障自愈、资源自动调度、高质量数据报表及业务智能分析等,既然是目标,说明大部分都还在路上,即使国内一线的互联网企业也未能达到该理想的状态。自动化之路是一个复杂的系统工程,是一个长期积累、沉淀且不断优化的过程。由于互联网行业的特殊性,包括新技术不断涌入及快速迭代,另一方面是互联网业务日新月异,各种颠覆性的产品层出不穷。作为服务支撑,这也给自动化运维带来变数及挑战。

        在国内需要加强的部分还是资源与技术的共享,很多时候大家都在同一件事情,贡献一个成熟且通用的组件对业界的影响是深远的,阿里在这方面做得就非常好。在个人著作《Python自动化运维:技术与最佳实践》中也分享一些实现方法与实践案例,可作参考。

6、您认为一名合格的运维工程师是如何定义的?需要具备哪些因素?

        我认为一名合格的运维工程师需要具备高度的责任心,有一定的沟通及协调能力,同时需要具备发现问题及解决问题的能力,平时要多思考,多总结,多输出,以便将现有的沉淀更好传承下去,即使人员变动也不会出现断层。另外对资源、质量要非常敏感,有一定的规划及ITIL能力。对运营的业务要做到全面性的了解,包括提供的服务、总体架构、技术实现原理以及存在的问题等。在技能方面需要熟悉主流的运维相关技术,包括网络、设备、操作系统、负载均衡、缓存、数据库、云计算技术等方面,并关注最新技术发展动向,评估并思考如何运用到实际工作当中,解决工作中碰到的问题。同时,需要具有很好的开发能力,理由是没有人比我们更清楚我们需要什么的平台或工具,在与产品或开发沟通时,才有更多的发言权,甚至是主导权。

原文:【2014WOT深圳站讲师专访】刘天斯:Docker的到来,运维准备好了么?
Tags: , , ,

51CTO专访记录[原创] 不指定

刘天斯 , 2011/03/29 16:36 , My Life , 评论(7) , 阅读(26540) , Via 本站原创
采访人: 51CTO 李晶
采访嘉宾:天涯社区 刘天斯
---------------------------------------------------------------------
      51CTO:首先,能否简单的介绍一下您在运维领域的经历?比如什么时候进入这行,现在主要负责哪方面的工作等等。
      刘天斯:03年毕业后在一家网络公司从事开发兼美工设计的工作,一次偶然的机会接触到了Linux,从一开始的系统安装到各类常用应用平台的搭建。一步一步从一个程序员到运维工程师的转变。2005年加入天涯,正式成为一名运维工程师。目前主要负责的工作有应用平台的上线、部署、监控、调优、事件处理、应急预案等,涉及的领域有架构设计与优化、运维开发、负载均衡、缓存应用、数据库、分布式存储等。

      51CTO:您在天涯社区做系统管理员的这段时间内遇到的最大困难是什么?您最难忘或最高兴的事是什么?
      刘天斯:如何协调各部门与运维的关系,不要再当炮灰了。最高兴的是部门定期聚餐,喝喝小酒,聊聊人生,畅所欲言。

      51CTO:您对开源是如何理解的?天涯社区在过去两年间陆续开源了包含LVS管理系统、Varnish缓存推送平台、高性能数据引擎memlink等好几个项目,业内的同行们都十分关注,您认为这个对整个产业带来了哪些好处?身为一个天涯的运维,您认为这个过程对您自己的价值在哪里?
      刘天斯:开源就是分享,让更多的人受益的同时自己也在提高。经常看到很多朋友都在做监控平台、运维工具。事实上功能都是惊人的相似,大家都在做同样重复的工作,为什么不能其中一个人开源出来大家一起来使用、完善。对整个行业来讲这块的投入成本都会降低,对个体来讲也是资源的整合。如果形成良性的循环,行业的生态环境将有很大程度的改善。本人热衷于开源技术,同样也愿意为开源贡献自己一分微薄之力,希望更多的人能支持开源、参考开源。

      51CTO:天涯社区在过去数年间逐渐从Windows平台全面转移到开源架构,很多朋友对天涯的这个转型过程很感兴趣,网上现在也有不少相关的资料。对于这个过程,您有哪些觉得特别好的资料想推荐给大家的吗?您自己在这个过程中有哪些心得?
      刘天斯:这个过程是漫长的,是一个快速发展壮大的互联网公司的必经之路。转型之前需考虑资源的投入、人才的储备。下一步便是相关技术及经验的积累,这方面的资源互联网上已经很丰富了。个人建议从前端应用、负载均衡、缓存层开始着手,理由是不仅不会给应用逻辑产生很大的干扰,同时还会给整个平台带来高可用性,保证在转型过程中平稳过渡。

      51CTO:作为《2010年度十大杰出IT博客》之一,能否简单介绍一下您开博的经历?一直坚持记录博客,是有什么动力在驱动自己吗?
      刘天斯:开始写博客的目的只是单纯当成笔记本来用,后来慢慢变成交流沟通的平台,收到很多网友的评论、邮件。当中有很多是非常好的建议,比如文章“LAMP+logzilla2.9.9+syslog-ng实现集中日志管理(第二版)”,共收到5位网友提供后续问题案例,自己也从中得到学习。因分享而快乐,因快乐所以坚持。

      51CTO:您现在最关注哪方面的技术?您自己是如何学习并掌握新技术的?
      刘天斯:我现在关注的技术是云计算,思考如何构建一个高效的私有云。学习方法大家都会有自己的一套,工作期间每天安排出2个小时的学习时间就很不错了。掌握一门新技术是很不容易的,“边学边练”的方法在每个阶段都是适用的。当然,除了兴趣以外还需要有一定的毅力。

      51CTO:最后,您认为在未来两年内,大型网站的系统管理员(或想成为大型网站系统管理员的同行们)最需要关注哪些方向?
      刘天斯:是云计算,它除了给我们降低运营成本,还提供了更加弹性的资源分配,可伸缩的处理能力,满足大量的数据存储与计算,最终提高企业竟争力,这些都是未来几年我们所需要的。

51CTO报道地址
天涯社区运维刘天斯:因分享而快乐 因快乐所以坚持
http://os.51cto.com/art/201103/251458.htm

51CTO电子杂志《Linux运维趋势》第7期发布-【人物】
http://os.51cto.com/os/linuxops/pdf/51CTO_linuxops_issue7.pdf

如大家有什么疑问或感兴趣的话题可以通过weibo与我交流:http://t.qq.com/yorkoliu
分页: 1/1 第一页 1 最后页 [ 显示模式: 摘要 | 列表 ]