信息传输/软件/信息技术服务
运行
维护
服务
运行维护服务


Stylesheet css/basic.css not found, using css/basic.less instead. Please contact developer of "starter" template.
Stylesheet ../dokuwiki/css/_search.css not found, using ../dokuwiki/css/_search.less instead. Please contact developer of "starter" template.
Stylesheet ../dokuwiki/css/_admin.css not found, using ../dokuwiki/css/_admin.less instead. Please contact developer of "starter" template.
Stylesheet css/structure.css not found, using css/structure.less instead. Please contact developer of "starter" template.
Stylesheet css/design.css not found, using css/design.less instead. Please contact developer of "starter" template.
Stylesheet css/content.css not found, using css/content.less instead. Please contact developer of "starter" template.
Stylesheet css/includes.css not found, using css/includes.less instead. Please contact developer of "starter" template.
Stylesheet css/title.css not found, using css/title.less instead. Please contact developer of "starter" template.
Stylesheet css/list.css not found, using css/list.less instead. Please contact developer of "starter" template.
Stylesheet css/auth.css not found, using css/auth.less instead. Please contact developer of "starter" template.
Stylesheet css/mobile.css not found, using css/mobile.less instead. Please contact developer of "starter" template.
Stylesheet css/print.css not found, using css/print.less instead. Please contact developer of "starter" template.

简介

运行维护服务(多数情况下简称为「运维服务」)指的是信息技术从业人员通过监控、调试、阅读日志等手段使计算机服务按照规划保持长期稳定运行的状态的服务。

评判标准

一般来说,能让服务正常运行即为达到目标,没有特定标准。没做好运维的例子就是你现在正在访问的这个网站无法正常访问,无法正常提供服务。 从个人工作的角度看:互联网运维项目是保证为客户提供长期稳定的运营维护服务,可以包括但不限于:开发改修、数据整理、客户要求整改、客户服务、安全保障、障害处理、系统监视、应急处理等等,保障系统的稳定运作和对客户应答要求的处理。

种类

Linux

我们一般采用Ubuntu/ Redhat/CentOS/ SUSE等稳定且不太激进的(尤其是Redhat)发行版为运行系统 不大推荐使用Arch系列,Fedora等激进更新的系统,这样会造成许多问题

对于网页

一般使用Apache,Nginx等作为底层,当然也可以用JSP/ ASP,甚至Node.JS ; 但是为了能够达到可持续在线,我们一般会添加前置代理来处理大部分流量,一般使用Nginx来做这个事情。最后,一般会使用CDN来分担静态资源的负担。示例:NodeBB的Nginx反向代理

对于数据库

现在分为两大阵营:结构与非结构性数据库,结构性代表:MySQL,非结构性代表:Redis/ MongoDB 。 为了能够可持续访问,我们一般选择结构嵌套非结构,例如用MySQL做底层进行长期数据存取,用Redis做服务响应,但是这需要一个中间件。示例:酷安(底层好像不是用的MySQL,但是确实是用Redis来做响应)

Windows

Windows Server操作系统由微软公司提供技术支持。 Windows Server最新版本是Windows Server 2019。

工作流程

服务器操作系统通常使用Linux或Windows server 操作系统。在工业环境中,Linux占据了极大部分市场。 运行维护服务工程师需要保证所提供的服务、服务器数据保持畅通快速完整。通常使用冗余备份与集群相关技术。

产品的整个生命周期里运维的职责重要而广泛,但运维工程师们的职责不仅限于这部分工作,还需要总结工作中遇到的问题,抽取出相关的技术方向、研发相关的工具和平台以支持/优化业务的发展并提高运维的效率,相关技术工作主要包括:

  • 服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障
  • 服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性
  • 服务容量管理:测量服务的容量,规划服务的机房建设,扩容、迁移等工作
  • 服务性能优化:从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验
  • 服务全局流量调度:接入服务的流量,根据容量和服务状态在各个机房间分配流量
  • 服务任务调度:服务的各种定时/非定时任务的调度触发及状态监控
  • 服务安全保障:包括服务的访问安全、防攻击、权限控制等
  • 数据传输技术:包括p2p等各类传输技术的研发应用,也远距离大数据传输等问题的解决
  • 服务自动发布部署:部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务
  • 服务集群管理:包括服务的服务器管理、大规模集群管理等
  • 服务成本优化:尽可能降低服务运行使用的资源,降低服务运行成本
  • 数据库管理(DBA):通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理。
  • 平台化的开发:类docker和google borg平台的开发管理,及服务接入技术
  • 分布式存储平台的开发优化:类google gfs等分布式存储平台的研发及服务接入

凡是关系到服务质量、效率、成本、安全等方面的工作,及涉及到的技术、组件、工具、平台都在运维的技术范畴里。做好每一个技术方向、完成相应的组件、工具、平台研发都能对履行运维职责起到积极的作用,对业务的发展发挥关键影响。 我们一般通过两种大途径保持服务的可持续性,在这里我们一般考虑Linux系统,并且我们不考虑人工监控

组织结构

部门分工

人员分工

经营设计

需求分析

目标界定

总体结构设计

详细结构设计

参数设计

设计实施

工具

一,内部保持

1,使用专为程序所写的守护进程

原理:守护程序作为一个独立的进程实时监控主程序的存活状态,一旦查询到主程序状态异常,则执行特定操作如重启主程序等 参考示例:NodeBB

2,系统层面的计划任务或者服务

原理:

二,外部监控

1,手动运维监控操作

原理:一般适用于网页等,通过定期访问指定页面来判定服务存活状态,一旦出现异常则通知用户 参考示例:PingZo

2, 建设监控平台自动化监控

通常市面上主流为Zabbix,Promethues+grafana,等等

三,平台工具

运维工程师使用的运维平台和工具包括:

  • Web服务器:apache、tomcat、nginx、lighttpd
  • 监控:nagios、ganglia、cacti、zabbix
  • 自动部署:ansible、sshpt、salt
  • 配置管理:puppet、cfengine
  • 负载均衡:lvs、haproxy、nginx
  • 传输工具:scribe、flume
  • 备份工具:rsync、wget
  • 数据库:mysql、oracle、sqlserver、InnerSystem cache
  • 分布式平台:hdfs、mapreduce、spark、storm、hive
  • 分布式数据库:hbase、cassandra、redis、MongoDB
  • 容器:lxc、docker
  • 虚拟化:openstack、xen、kvm
  • 安全:kerberos、selinux、acl、iptables
  • 问题追查:netstat、top、tcpdump、last

广义上所有开源的软件都是运维工程师会使用到的平台和工具,同时也包括运维各个技术方向上自行研发的各类平台。

设计和规划

位置与环境

投资与评估

规模与功能

风格与形式

成本

运维维护服务重点在于服务,主要成本体现在人工方面、设备替换方面。对于大型IDC、多业务系统等需要专业的运维管理系统,方便工程师对基础环境、系统运行状态进行监控。

税费

金融成本

原材料成本

房租成本

能耗成本

人工成本

一般运维维护由系统建设商提供为期1年的基础维护,对于需驻场人员的需另行核算。

设备折旧

收益管理

消费曲线

时间分布

空间分布

目标群体

容量控制

风险控制

行业

国内市场

产量

消费量

国际市场

产量

消费量

主要公司

标准

这里存放条目相关的国家标准

文档

这里存放于条目相关的其他文档

编辑成员
12 人

GlennZ, 不酸的Lemon, 宇不点, FrancisDrakeK, 木又, roc, bendi, 葛根雷雷, 笨笨伟, 会飞的小羊, Aloento, THE

评论(4)

你需要登录发表评论。
oliuzhiyuo 2019-11-27 18:57:55
种类有些不对啊
20190520_yunwei. 2019-05-19 21:45:39
看样子占到地板了哈!
刚刚注册就来评论了。因为有网优转运维的想法,比较关注相关的内容,个人目前的优势就是对电脑和网络相关的方面有一定了解,但也只在个人用户能够接触到的方面,因为之前只是爱好。没什么编程基础,会用简单的vbs和bat代码....
如果有大佬看到希望能给点建议和方向。谢谢了!!....
Lucifer 2019-05-10 15:14:36
说得也对,没有实例。
bendi 2019-05-07 21:06:10
“没做好运维的例子就是你现在正在访问的这个网站” is a joke !
bendi 2019-05-07 21:06:10
“没做好运维的例子就是你现在正在访问的这个网站” is a joke !
1
回形针手册-icons