AI算力下一站:青云QingCloud智算平台与算力云

互联网
2024
02/05
15:01
分享
评论

《中国综合算力指数(2023年)》的最新数据显示,截至2023年6月底,我国算力总规模已经达到了197EFLOPS,全国在用数据中心机架总规模超过760万标准机架,位列世界第二。我国算力总规模近五年年均增速近30%。

“对于青云来说,AI时代将是一个全新的机遇,它将会带来长达10年、比过去10年更大的市场需求和机会。”青云科技CEO林源如是说。而在AI大模型这一轮技术进步中,支撑人工智能所需的算力自然也成为关注的焦点。基于对AI算力需求的洞察。

一大批重大工程项目,也进一步推动了算力产业的快速发展。其中,超算中心和智算中心的建设是重要举措之一。自2009年以来,科技部批准了14所国家超级计算中心,分布于天津、济南、无锡、昆山、深圳等地。同时,各地也积极投入智算中心的建设之中。据公开报道,截至今年8月15日,全国至少有30座城市已经建成或正在建设智算中心,这还不包括企业自主建设的智算中心。

林源认为,AI和大模型是重大生产力的变革,在这场技术推动的市场变革中,客户需求、算力需求、应用需求和底层架构都在发生变化。在过去十年,无论是面向C端的移动互联网还是面向B端的数字化,主要基于CPU进行应用革新。然而,随着AI的普及,几乎所有应用都需要拥抱AI技术或被AI改造,使得GPU的需求量增加。

据悉,青云AI智算平台正在根据多种芯片支持、全生命周期管理、多种AIGC模型一站式交付、多元计算能力等进行优化与研发,为算力中心提供更好地支持和服务。

苗慧透露,青云AI智算平台具备九大关键能力,分别为多区域多业务资源整合、混合组网、容器推理服务平台、分布式调度与管理、算法开发支持、模型仓库(MaaS)、AI训练平台、灵活调度、高速并行存储。

在智算中心建设和运营过程中,其设计合规化如何考量,超算、智算、通算等多元算力如何做到统一调度,传统应用、云原生应用、AI应用如何同时兼顾,如何支持异构CPU/GPU,如何提供高效网络与存储,如何实现高效地运维与运营等,都是需要考虑的问题。可以说,智算中心建设后的运营成为关键挑战。

如何充分应对这些挑战?在笔者看来,未来算力将像水、电一样成为公共资源,随着算力规模的扩大,算力调度和交易将会被用于解决算力的供需问题。

基于自身经验与实践,青云科技也给出相应的答案——AI智算平台,并为行业提供了一份可参考的范式。青云科技产品经理苗慧表示:“AI智算平台作为算力中心建设运营的新模式,目的是像管理本地资源一样,管理AI基础设施,提供多元算力调度,提供智能化的算力调度,保证算力能快速建立起来。”

林源介绍:“AI算力云是以青云为主,以生态联合的方式,对外运营的AI算力服务。”青云发布的AI算力云为何要借助生态的力量?又是如何运营AI算力云的?这是有一定的原因的。

传统模式下,大厂喜欢从底层IDC到软件、PaaS都进行自建、自投和自营,但这种模式会导致研发成本高昂,压力增大。而在AI时代,每一层的成本都比过去更高,例如大模型的研发需要大量人力、算力和时间,同时还需要成熟的智算平台和IDC建设。因此,虽然一个大厂可以选择从上到下都自己干,但这样做会非常吃力和费劲,并且成本也会更高。

青云认为,未来AI时代,企业一定是通过算力服务、算法和模型、高价值的数据来实现智能化,这也是AI生态体系的价值所在。青云AI算力云服务主要围绕AI算力基础设施的生态共享、AI算力大模型的资源整合以及AI数据资源的生态整合。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3