When it comes to minimizing IT outages, the human factor is often underestimated. Both man and machine represent risks.
主题

人为因素是 IT 质量的关键

People

Human error ranks alongside technical defects as a chief cause of IT downtime – what can be done to mitigate the risk that emanates from people?

  • Increase awareness of quality issues
  • Develop staff expertise and skills
  • Establish four-eye-principle
  • Ensure active involvement of senior management

人为错误的严重性通常会被低估

很多企业的 IT 环境变得越来越复杂,而且难于管理。Statista 最新发布的数据表明,2014 年的 IT 故障停机事件有 43.5% 是因为人为因素导致的。因此,缓解这一风险是保证 IT 高可用性的关键一环。
IT 人员会在不经意间以很多方式影响业务连续性。其根本原因往往就是资源不足 — 很少有人会管理并维护 IT 环境。在其它案例中,响应能力较弱,小问题会升级为大问题,需要耗费巨大的努力和费用才能得到解决。在这种背景条件下,不仅需要具备合格的资源,在企业的所有层面就质量和主动风险管理达成共识也很重要。

持续培训必不可少

当然,也要考虑其他方面。IT 团队技能方面的差距也是 IT 故障停机的进一步原因。在很多情况下,个人不具备掌握最新的 IT 解决方案或适当应对技术问题所需的知识。IT 专业人士需要持续参加培训并定期接受考核,以确保其掌握快速发展的软件和硬件方面的最新发展动态。
但是,这并不能完全消除人为错误。专家也难免会犯错。四眼原则在保障可靠 ICT 质量方面的重要意义就在于此。在实施变革时,IT 组织通常将成败托付在少数的几个人手中,可能会给整个业务带来灾难性后果。例如,如果连接新软件的交换机发生故障,很可能会引发数据丢失,并造成财务影响。为此,双重控制机制至关重要。
我们的质量承诺
Quality at T-Systems
T-Systems’ Zero Outage philosophy creates a zero outage culture focused on keeping systems up and running at all times – delivering the best-possible ICT service quality for your business.

了解更多

有必要让管理层参与进来

但这不仅仅是涉及运营人员。高管的角色对于质量至关重要。在很多情况下,他们没有切实意识到基层面临的挑战。一旦发生危机,IT 专业人员往往依赖于自身设备。但是快速解决重大问题,消除根本原因,并且在 IT 专业知识以外承担更多责任;高管层全天候支持也非常重要。高管层必须积极参与事件管理,以确保快速决策,并授予 IT 员工采取有效措施所需的权力。
总之,在保证 ICT 服务质量方面,人为因素通常会被忽略。人都会犯错,但是 CIO 有责任尽量降低风险,并确保 IT 专业人员为可能发生的事件做好充分准备。