有分析人士判断,AI市场将会迎来一波长达十年以上的热潮,AIGC在企业IT中的占比投入一定会越来越高,AI对于需求的刺激将是之前10年的10倍-100倍,算力需求也将随之出现等量的增长。而“多”恰恰是能够满足需求的保障,因为不同的算力需求其背后所调用的超算中心硬件资源也并不相同,正所谓“更多选择,更多欢笑”,已经实现盈利的国家超算济南中心就是一个很好的案例。
以目前常见的几类AI用例需求而言,很多高校进行的传统科学计算类应用就需要HPC,才能完成如仿真、模拟、洋流预测、基因检测等工作;对于传统的政务云业务、传统CRM/ERP企业数字化应用则属于传统云计算需求,就需要调用CPU类资源;目前大热的涉及道路识别、车牌识别这样的智慧城市类应用则需要调用GPU的能力。业务的多元需求恰恰决定了对于多元算力的需求。
据悉,仅在三年前国家超算济南中心就已经拥有1000P算力与300PB以上的存储,是当时全亚洲最大的算力中心之一,包括了HPC超算、以CPU为主的传统云计算,以GPU为主的智算,其中智算兼顾了国产化需求,引入了一部分国产GPU,进而成为了一个既拥有多元算力,又具备异构算力能力的超算中心。
“投资建设一个平台后产生的效益取决于平台能力,因为平台能力越强,能支撑客户的业务种类就越多。客户越多,盈利模式越清晰。”三年前参与服务国家超算济南中心的青云科技总裁林源向媒体解释了缘何需要异构计算与多元算力。
“我们已经在国家超算济南中心的实践成功,证明青云平台具备能力、干过,也干成了。”林源专门表达了对于该产品的信心。青云AI算力服务平台作为计算中心运营者的关键工具,可以建立从建设到运营的闭环,在国家超算济南中心的案例中,不仅三年前就成功进行了实践,还助力其不仅运营得好,还实现了盈利。
青云AI服务平台可实现对于GPU算力、HPC算力、多存储系统、模型资源、数据资源的多元资源统一平台管理,实现算力平台自动资源。还可根据不同的行业需求,通过平台进行资源分发,具备分布式调度与管理能力,自动分配和管理算力资源,大幅缩短任务执行时间,提高工作效率,让客户专注于业务创新和应用开发。
平台的管理操作也易如反掌,通过统一运营和运维管理平台,实现多种服务场景的运营化服务的后时,规范化高效运维,帮助用户实现精细化运营。青云会为平台管理员交付一个可视化的大屏管理界面,可轻松浏览全国的上千台算力资源与存储。以国家超算济南中心为例,后端其实只需要10-20人的团队,就能实现对于软件的运维,并解决客户的各类问题。