• 阿里巴巴DevOps实践指南(二十)|业务系统安全工程

    系统的安全稳定已经成为企业安全的重要命门之一。各种故障、以及众多潜在的系统威胁,也让企业管理者极度缺乏安全感。解决方案实践系统故障的诱因复杂,这导致单点的控制很难解决问题,需要一个系统化的解决方案。...
    文章 2021-07-06 191浏览量
  • 《中国人工智能学会通讯》——10.18 研究进展

    当时主要以电力控制系统为研究对象,考虑由控制系统内部故障导致的“坏数据”对系统安全的影响,通过状态估计和分析方法对“坏数据”进行检测或进行必要的容错控制设计,以此保证系统的安全运行。到本世纪初,随着...
    文章 2017-09-04 1710浏览量
  • [数据恢复答疑]RAID真的安全吗?

    RAID的控制器在ONLINE状态下(无离线盘)工作是最稳定的,相对而言,当部分硬盘损坏(可能是逻辑故障)后离线,控制器便会工作在一个比较吃力的状态,这也是好多中低端的RAID控制器在一块盘离线后读写性能急速下降的原因...
    文章 2017-11-22 1233浏览量
  • Windows操作系统常见故障解决方法

    其表现形式层出不穷,由于篇幅原因就介绍到此,在此需要一并提出的是,倘若因为病毒损坏了一些系统文件,导致系统工作不稳定,我们可以在安全模式下用系统文件检查器对系统文件予以修复。2、由于某些元件热稳定性...
    文章 2012-10-19 1454浏览量
  • Windows操作系统常见故障

    其表现形式层出不穷,由于篇幅原因就介绍到此,在此需要一并提出的是,倘若因为病毒损坏了一些系统文件,导致系统工作不稳定,我们可以在安全模式下用系统文件检查器对系统文件予以修复。2、由于某些元件热稳定性...
    文章 2017-11-14 926浏览量
  • Windows操作系统常见故障

    其表现形式层出不穷,由于篇幅原因就介绍到此,在此需要一并提出的是,倘若因为病毒损坏了一些系统文件,导致系统工作不稳定,我们可以在安全模式下用系统文件检查器对系统文件予以修复。2、由于某些元件热稳定性...
    文章 2017-11-14 670浏览量
  • ECS运维:操作系统有异常?诊断日志来帮忙!

    为了分析根本原因而避免问题反复发生,运维人员通常依靠查看系统日志来做分析诊断,然而此时也许实例已经无法正常SSH远程连接,让定位故障原因的过程变得非常困难。现在阿里云提供了一键查看系统日志和屏幕截屏的...
    文章 2018-07-23 6776浏览量
  • 数据中心供电系统可用性问题分析

    用户们当然是希望消除并控制自己的电源系统故障。5、UPS对供电系统的谐波干扰问题 UPS在整个系统内部就相当于一个谐波干扰器。无功和谐波电流对供电系统的影响是多方面的,因此是我们不得不的问题之一。6、用户...
    文章 2017-07-03 971浏览量
  • 运维监控系统建设|学习笔记

    对运维监控系统的设计目标l?对系统、服务或平台的运行状态实行实时不间断监控l?不间断实时反应系统、服务或平台的运行状态信息l?提前预知可能存在的故障风险l?实现故障预警报警功能通过监控数据快速定位故障原因...
    文章 2021-09-13 1浏览量
  • 什么是 Help Desk?

    科技如何帮助公司发展,关键就在于保证IT系统的安全稳定运行。我们都知道要保证系统100%可用非常难实现,那么如何在系统故障时减少处置时间?一个有效的办法就是帮助台(Help Desk)。那么什么是帮助台?它又是如何...
    文章 2016-01-24 855浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    由于以上原因,华佗就承担了飞天平台自动化故障处理系统的任务,提升集群故障发现、处理的效率和准确性,解放运维人员,提高飞天稳定性和可靠性。实现 如何能又快又好地发现和解决线上故障呢?我们进行了很长时间的...
    文章 2016-12-18 4655浏览量
  • IT部门的服务工作方式、工作内容有了彻底的改变——...

    当监测到系统故障时,快速定位故障的主要原因。故障处理流程通过整合OA系统来实现。简单操作的系统管理配置,方便地配置所监控服务器的信息,应用数据自动获取。系统将根据服务级别协议(SLA),为客户方便地定义符合...
    文章 2017-11-16 1443浏览量
  • 超全总结|阿里如何应对电商故障?神秘演练细节曝光

    今天的分享,主要还是回归故障发生的本质,故障原因角度切入。看是否有一些方法论和通用性的手段可以沉淀出来。希望可以对大家有所帮助。今天演讲的主要包括两个部分:第一部分会从分布式系统经典依赖故障出发,剖析...
    文章 2017-06-19 3656浏览量
  • 云服务器和vps有什么不同

    以类似的方式,存储和控制服务器的冗余意味着单个硬件故障不会停止云计算,并保证虚拟机的数据安全。使用云服务器的好处在运行操作系统时都是透明的,但也为用户提供了对硬件故障的抵抗的附加特性,从而避免了长时间...
    文章 2019-05-08 7757浏览量
  • 中小型企业运维之路

    监控是要多维度的,一个故障的发生原因,可能是多方面的,有可能来自是云平台的故障,有可能是某个区域的网络问题,有可能是应用代码的逻辑故障,也有可能是某个SQL语句的性能导致,也有可能是安全攻击导致的业务...
    文章 2019-09-12 1143浏览量
  • 天梭M13为何具有大型机水平的高可用性

    SFDP对于不同层次、不同部件执行的检测强度是不同的,对内存等核心部件检测强度最高,因为内存错误和内存故障是引起系统停机的主要原因之一,目前通用服务器的内存错误主要依靠ECC内存技术来处理(Error?Checking?...
    文章 2017-08-02 1406浏览量
  • 优化冷却系统中的自控系统(下)

    如果单个单元出现故障,在冗余冷却单元处于“待机”状态下,控制系统在冷却单元出现故障时将“唤醒”。或者如果所有单元都在启动,包括冗余单元,则CRAH或CRAC风扇将自动启动以提供更多的冷却能力,请注意,如果单元...
    文章 2017-07-03 1542浏览量
  • 无人化运维离我们有多远?阿里智能化运帷平台深度揭秘

    我个人认为AIOps可以在两方面来帮助运维:一、稳定性:运维的本质就是维护系统稳定性,如何能让系统平稳的运行,变更更加稳定故障全面治理是首要考量的,所以稳定性方面的智能运维技术演进大致是:异常检测...
    文章 2017-10-27 4257浏览量
  • 根本原因分析 关键事件关联 IT运维有序发展——中国...

    当监测到系统故障时,快速定位故障的主要原因,估算系统事件对业务的影响及其严重程度,并触发相应的故障处理流程。简单操作的系统管理配置,方便地配置所监控服务器的信息,应用数据自动获取。通过门户系统可以进行...
    文章 2017-11-09 1522浏览量
  • 如何防范Fintech创新中的人工智能、大数据、区块链、...

    端、软件配置、负荷管理等进行实时监控和安全测试,及时发现系统故障及受感染恶意控制的情况,一旦出现问题立 即报警。不能过度依赖人工智能 基于深度学习的人工智能将会创造更多价值是发展趋势,它能为人类服务甚至...
    文章 2017-08-22 1349浏览量
  • 如何防范Fintech创新中的人工智能、大数据、区块链、...

    需要采取必要的验证和升级措施,出台相关评价方案对人工智能软、硬件环境进行严格评价,同时对服务器、客户 端、软件配置、负荷管理等进行实时监控和安全测试,及时发现系统故障及受感染恶意控制的情况,一旦出现...
    文章 2017-10-31 948浏览量
  • 构建可靠系统的原则与实践

    回到我们的工作中,前不久我们碰到了一起系统故障,其过程有一定典型的意义,为了描述方面,这里隐去一些具体细节,简单说一下故障的过程。开始的时候,由于某些原因导致缓存命中率有所下降,而缓存命中率下降导致了...
    文章 2019-04-24 12591浏览量
  • 谁动了我的实例&磁盘-ECS主动运维历史事件查询

    由于宿主机软硬件故障原因触发宕机迁移或重启的非预期系统事件 因实例错误实例重启 由于操作系统内部错误导致系统崩溃引发实例重启的非预期系统事件 其中因系统维护实例重启这种类型,就是您在待处理页面所看到的...
    文章 2018-05-25 9375浏览量
  • 《云安全原理与实践》——2.2 云计算面临的管理风险

    1)技术故障:技术故障主要由于以下两个原因造成:①由于云计算数据中心的硬件故障、云计算平台的软件故障、通信链路故障等,可能导致服务计划外中断。②由于数据中心未进行有效的安全保护、监控、定期维护、没有...
    文章 2017-09-04 1603浏览量
  • 如何做到全年配送 0 故障?盒马揭秘 12个关键技术

    DB依赖主要分析依赖DB的稳定性,首先,DB有没有慢SQL,盒马早期大多数故障原因是慢sql导致,后来对DB的集中治理才使得这块不稳定因素被逐步瓦解,但是慢SQL治理是长期的事情,不管是上新业务的sql事前分析,还是流量...
    文章 2020-02-18 602浏览量
  • 带你读《工业物联网安全》之一:一个前所未有的机会

    当一个控制系统暴露在异常状态下,包括有意和无意的错误、恶意攻击和干扰时,它能够保持状态感知和良好的稳定状态等级,意味着它具有弹性(RIE-GERT)。Barry Boehm等人将safety与security区分如下:safety指系统...
    文章 2019-11-05 1116浏览量
  • 3+1保障:高可用系统稳定性是如何炼成的?

    有分布式处理能力后,需要考虑单个服务器故障后自动探活摘除、服务器增删能不停服自动同步给依赖方等问题,这里就需引入一些分布式中枢控制系统,如服务注册发现系统、配置变更系统等,例如zookeeper是一个经典应用...
    文章 2021-01-27 8323浏览量
  • 硬盘故障巧维修

    再次进入windows 98,你会发现盘符错位的现象已经没有了,我们可以顺利访问两个硬盘,使用其中的资源,当然笔者认为最好的办法还是使用windows 2000系统,让它来自动管理双硬盘,即省心又安全。5.ultra ata/66硬盘...
    文章 2017-11-12 954浏览量
  • 容器服务Kubernetes(ACK)及相关云环境几次故障和问题...

    错误原因:?? 因为有状态副本或者 Deployment集部署删除,存在级联删除 Service 情况,开发和运维人员使用重建方式修改自己配置的时候,导致 service 级联相应 SLB 被删除,导致故障,需要紧急重建 SLB 并多方增加...
    文章 2019-10-10 663浏览量
  • 大批量API的管理技巧

    API带来便利的同时,也带来了风险,需要对API进行相应的用户认证、权限控制、限流流量控制等手段来保证服务的安全,防止数据泄漏。而对于攻击,需要做好相应的防护机制,如流量清晰、流量识别、使用高防IP等等,来...
    文章 2016-12-11 2034浏览量
1 2 3 4 ... 18 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com