• 2017QCon分享:从淘宝到云端的高可用架构演进

  比如在设计技术方案的时候,在最后一章单独有一个容灾设计,这个节点里任何服务挂掉的时候,你要保持什么样的方式保持这个服务是可用的。在容灾设计时有几点必须考虑,比如我引了一个新jar包或者调了一个新的RPC的...
  文章 2017-10-25 2944浏览量
 • 为什么需要消息队列,及使用消息队列的好处?

  但是很可惜,十年前开始流行的C10K说法就是在讲:并发量上来之后,会造成chain reaction,大量的并发不会直接挂掉你的mysql节点,但是会拖慢速度,降低吞吐量,一个玩家的请求由于处理时间太长,导致玩家放弃重试,...
  文章 2018-07-05 7582浏览量
 • 3+1保障:高可用系统稳定性是如何炼成的?

  做到每个环节使用相互独立的多台服务器进行分布式处理,要针对不同稳定性要求级别和成本能力做到不同服务器规模分布式,这样就避免单个服务器挂掉引发单点故障后进而导致服务整体挂掉的风险。可能涉及的环节有端动态...
  文章 2021-01-27 8323浏览量
 • 纯干货|从淘宝到云端的高可用架构演进

  比如在设计技术方案的时候,在最后一章单独有一个容灾设计,这个节点里任何服务挂掉的时候,你要保持什么样的方式保持这个服务是可用的。在容灾设计时有几点必须考虑,比如我引了一个新jar包或者调了一个新的RPC的...
  文章 2017-06-19 2143浏览量
 • ETCD系列之一:简介

  挂掉的节点再次当选主节点,它将缺失部分已提交的日志。在这样场景下,按Raft协议,它将自己日志复制给其他节点,会将集群已经提交的日志给覆盖掉。这显然是不可接受的。其他协议解决这个问题的办法是,新当选的主...
  文章 2016-03-27 71258浏览量
 • iOS开发中 关于阿里云服务器的使用与安全策略 韩俊强...

  但是今年以来网站一直挂掉,就算来几个人也走了,狠下心来对腾讯云和阿里云作了个小比较,觉得还是阿里云比较划算,比较稳定。于是,选择购买了一个低配置1G内存,1G CPU,1M带宽,还添加了一个云盘20G(为什么要买...
  文章 2017-02-15 1201浏览量
 • ...head><meta http-equiv="Cont

  但是今年以来网站一直挂掉,就算来几个人也走了,狠下心来对腾讯云和阿里云作了个小比较,觉得还是阿里云比较划算,比较稳定。于是,选择购买了一个低配置1G内存,1G CPU,1M带宽,还添加了一个云盘20G(为什么要买...
  文章 1970-01-01 539浏览量
 • 高可用互联网系统稳定性建设实践指南

  这样就避免单个服务器挂掉引发单点故障后进而导致服务整体挂掉的风险。可能涉及的环节有端动态获取资源服务(html&js&小程序包等)、域名解析、多服务商多区域多机房IP入口、静态资源服务、接入路由层、服务...
  文章 2021-09-01 47浏览量
 • K8s 实践|如何解决多租户集群的安全隔离问题?

  该场景下集群的所有用户均来自企业内部,这也是当前很多 K8s 集群客户的使用模式,因为服务使用者身份的可控性,相对来说这种业务形态的安全风险是相对可控的,毕竟老板可以直接裁不怀好意的员工:)根据企业内部...
  文章 2020-01-10 1490浏览量
 • 常见消息队列基础知识

  大量的并发不会直接挂掉你的mysql节点&xff0c;但是会拖慢速度&xff0c;降低吞吐量&xff0c;一个玩家的请求由于处理时间太长&xff0c;导致玩家放弃重试&xff0c;但是对于后端来说&xff0c;对该玩家之前的处理过程消耗的资源就...
  文章 2021-09-10 38浏览量
 • Apache三种多路处理模块(prework、worker、event模式...

  原因主要是需要考虑稳定性,如果一个线程异常了,会导致父进程连同其他正常的子线程都了(它们都是同一个进程下的)。为了防止这场异常场景出现,就不能全部使用线程,使用多个进程再加多线程,如果某个线程出现...
  文章 2017-11-08 1010浏览量
 • 一文读懂架构整洁之道(附知识脉络图)

  任何一个软件模块,都应该有且只有一个被修改的原因,“被修改的原因“指系统的用户或所有者,翻译一下就是,任何模块只对一个用户的价值负责。该原则指导我们如何拆分组件。举个例子,CTO 和 COO 都要统计员工的...
  文章 2019-06-11 17254浏览量
 • 架构整洁之道,看这一篇就够了!

  任何一个软件模块,都应该有且只有一个被修改的原因,“被修改的原因“指系统的用户或所有者,翻译一下就是,任何模块只对一个用户的价值负责。该原则指导我们如何拆分组件。举个例子,CTO 和 COO 都要统计员工的...
  文章 2019-05-14 15094浏览量
 • 分布式锁在存储系统中的技术实践

  单机环境下,内核具备“上帝视角”,能够知道进程的存活,当进程挂掉的时候可以将该进程持有的锁资源释放,但发展到分布式环境,这就变成了一个挑战,为了应对各种机器故障、宕机等,就需要给锁提供了一个新的特性:...
  文章 2020-09-01 942浏览量
 • 如何做到全年配送 0 故障?盒马揭秘 12个关键技术

  简单的一致性问题比如DB和缓存,db更新成功后可多增加几个通道保证db执行成功后发出消息,缓存做好幂等,考虑系统挂了的情况可以依赖db变更的精卫消息或者binlog消息做数据对账。我们遇到的一致性问题比较隐蔽,某个...
  文章 2020-02-18 602浏览量
 • 重新定义数据库的时刻,阿里云数据库专家带你了解...

  但是,时间上,多个交换机全部挂掉的几率非常小,相反,几台机器出问题的概率非常大,所以应该着重于解决常见问题,之后使得C和A无限逼近。下面介绍客户发生的变化,如下图所示。客户对数据库的需求正不断演变,首先...
  文章 2018-05-23 3134浏览量
 • 老司机的双11手记:这么牛的阿里云数据库,你造怎么用...

  当主机房出现较大的负载压力、断网、断电等极端情况,RDS可将商家的后台系统在30分钟内切换至灾备机房继续运行,以保障总体可靠性,进一步确保平台大型品牌商家双11期间后台系统安全稳定。未来,走出去传承最佳...
  文章 2016-11-19 5150浏览量
 • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

  这么想,是因为没有看到稳定性的前瞻性和价值,如果你走在系统的后面,你能看到的就只有系统的屁股,也只能做擦屁股的工作,如果你走到了系统的前面,你就能看到系统的方向,做的也就是探索性的工作。所以,要让稳定...
  文章 2020-10-26 3797浏览量
 • 超全总结|阿里如何应对电商故障?...

  系统改造验收:对于分布式系统,至少应该做到运行态中不会因为我依赖的系统出现故障,而引起当前应用出现可用性的问题,比如进程挂掉,频繁FullGC,负载飙高等,何时何地都具备快速止血的能力。限流降级参考:对于弱...
  文章 2017-06-19 3656浏览量
 • 【双11背后的技术】AliCloudDB——双11商家后台数据库...

  当主机房出现较大的负载压力、断网、断电等极端情况,RDS可将商家的后台系统在30分钟内切换至灾备机房继续运行,以保障总体可靠性,进一步确保平台大型品牌商家双11期间后台系统安全稳定。7.未来,走出去传承最佳...
  文章 2017-01-12 3592浏览量
 • 高可用的本质

  假设单点的可靠性假设是99.99%,它要提升到99.999%是非常困难的,但是如果无单点而是依赖2个(1个挂掉没有关系,只要不同时挂就行),那整体可靠性就是99.999999%会有质的提升。单点故障会导致无法快速止血,拉长...
  文章 2021-02-22 947浏览量
 • Greenplum在企业生产中的最佳实践(上)

  这样的话,假如说当第一个机柜的一台服务器挂掉之后,在这边会有两台服务器完成原来有一台机器的工作,对整个集群的性能下降不会造成很大的影响,同时也兼顾了高可用性。目前在一些大的银行里面,尤其是当集群规模...
  文章 2017-07-29 4679浏览量
 • 微服务转型,雪崩效应是绕不过的一道坎

  如果某个业务系统挂掉了,如何按需做自动伸缩分布式方案方案也需要考虑。问题定位:单体应用的日志集中在一起,出现问题定位很方便,而分布式环境的问题定界定位,日志分析都较为困难。雪崩问题:分布式系统都存在...
  文章 2017-09-04 2191浏览量
 • 阿里云MVP傅奎|聊聊区块链和加密货币相关的安全问题

  无论是企业还是个人都应抽空关注一下区块链和加密货币相关的安全问题,毕竟控制风险是首要任务。否则,忙着挖矿,炒币,抄底,一不小心后院着火,那可是要被人“抄家”的。你辛辛苦苦赚来的都将被人收割,甚至...
  文章 2018-03-07 2754浏览量
 • 蹭热点,聊聊区块链和加密货币相关的安全问题

  无论是企业还是个人都应抽空关注一下区块链和加密货币相关的安全问题,毕竟控制风险是首要任务。否则,忙着挖矿,炒币,抄底,一不小心后院着火,那可是要被人“抄家”的。你辛辛苦苦赚来的都将被人收割,甚至...
  文章 2018-03-04 6956浏览量
 • 阿里研究员:线下环境为何不稳定?怎么破

  其中的一些问题也是有可能造成生产环境的稳定性和资金安全风险的。过多的笼统使用“环境问题”这个说法的另一个坏处是:会造成在大家的意识里“环境问题”是必然存在的、是无法避免的,导致大家一听到“环境问题”第...
  文章 2021-02-09 3487浏览量
 • 系列文章:Kubernetes中日志的正确输出姿势

  在动态的环境下实现日志的长期存储只能通过中心化的日志存储来实现,通过实时的日志采集方式,将各个节点、各个容器的日志在秒级内采集到日志中心系统上,即使节点/容器挂掉也能够通过日志还原当时的现场。...
  文章 2020-02-10 3556浏览量
 • 阿里百万级服务器自动化运维系统StarAgent揭秘

  双11期间,阿里巴巴百万量级主机管理能安全稳定、高效,如丝般顺滑是如何做到的?阿里巴巴运维中台技术专家宋意,首次直播揭秘阿里IT运维的基础设施StarAgent,详细分析StarAgent是如何支持百万级规模服务器管控?...
  文章 2017-12-01 12088浏览量
 • 做到这几点,你也能成为 BAT 的抢手人才(下)

  能够对移动端自动化工具栈、监控工具栈(如友盟、Bugly、Newrelic 等)、内存泄露检测、卡顿检测、耗电量、弱网、流量、埋点、灰度、版本控制、兼容性、用户体验、安全等等的质量保障方案有通盘搞定能力。...
  文章 2020-07-19 314浏览量
 • 高并发Web服务的演变——节约系统内存和CPU

  如果全部采用多线程,某个线程挂掉,就导致整个Apache服务“全军覆没”。而目前的工作模式,受影响的只是Apache的一部分服务,而不是整个服务。线程共享父进程的内存空间,减少了内存的占用,却又引起了新的问题。...
  文章 2017-05-02 1167浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com