平稳应对I/O栈故障,浪潮云海InCloud Rail V8.0持续追求系统性能与稳定性最优解

互联网
2025
05/28
09:48
分享
评论

面对副本强一致性带来的故障处理性能挑战,InCloud Rail V8.0在分布式存储组件dSAN最新架构中引入“故障预诊与实时感知”、“数据副本降级写入”、“动态智能同步”组合方案,在充分保证数据安全性的前提下,实现副本故障I/O不中断,故障中性能下降<20%,完美解决副本故障与慢盘故障难题。

image.png

在超融合实际应用场景中,数据库、redis队列、PaaS服务等高I/O敏感型业务对I/O质量有较高需求,超融合分布式存储的I/O质量直接决定了业务连续性与可用性,真实场景下I/O质量问题带来的业务连续性故障屡见不鲜。实际经验告诉我们,用户注重I/O数量的同时,需要高度关注I/O质量,I/O质量越来越成为不可忽视的问题,是业务连续性的重要决定因素。

在故障场景下,InCloud Rail V8.0超融合分布式存储设计以数据安全为根本出发点,实现了多种数据安全策略和方法的创新应用。为了保障数据的安全性,InCloud Rail V8.0采取强一致性分布式存储同步方案:即请求I/O的多个副本全部完成后请求才能完成,这种机制有效地保证了业务数据的安全、可靠、可用。

但是这种副本强一致性架构也面临挑战:一旦副本所在服务器或磁盘发生故障或出现慢盘,造成某副本无法及时完成读写操作,分布式存储系统为了保证数据的一致性,I/O请求需等待数据同步后再进行下一步操作,造成业务级I/O中断,且分布式存储系统受数据同步的影响导致大量I/O返回时延增加,呈现为分布式存储之上虚拟机承载业务出现I/O中断或应用访问延迟,故障后相当长一段时间内业务持续受到影响无法恢复,最终使业务不可用。

InCloud Rail V8.0通过故障预诊与实时感知,降低I/O中断时间,并按照副本写降级和智能动态恢复的方式,降低故障带来的数据同步影响,保证强一致性模型的前提下,降低I/O下降时间和对整体集群性能的影响。

故障预诊与实时感知:通过对集群异常的提前诊断与实时感知,做到故障时I/O不中断,保障I/O的连续性以降低跌零可能性与时长。

副本降级写:通过写入健康副本和降级副本加降级图谱,解除I/O与数据同步的强依赖关系,保障降级后数据副本容错能力、I/O性能和数据一致性。

动态智能同步:通过对数据同步策略的动态精准调控,降低数据同步对性能的影响,做到数据同步与业务I/O性能的均衡,最大程度降低对应用性能的影响。

InCloud Rail V8.0通过多维度智能组合策略,最大限度保障故障场景下I/O连续性,多维度保证超融合系统I/O质量,以实现超融合系统“持续可用”,InCloud Rail V8.0在追求更高I/O输出能力的基础上,更加注重I/O质量的输出,以更加稳健的产品定位,支撑更多客户核心关键业务连续运行。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3