AI算力“双轮驱动”，青云科技备战下一个十年

互联网

2023

12/07

17:04

当下*火热的技术莫过于AI，随着ChatGPT成功带来的新一代AI浪潮，引发了全球科技巨头在AI大模型层面的“军备竞赛”。作为AI大模型的发展基石，AI算力的需求也得到大幅提升——无论是基于通用大模型微调的行业应用，还是垂直行业的大模型训练，都需要大量的AI算力进行支撑，其规模还在随着大模型的成熟落地而不断攀升。

而在AI大模型热潮涌现之前，AI作为一种新的生产力工具已经在各行业场景中发挥作用。伴随AI技术的迅速发展，算力基础设施由通用算力为主，向通算、智算、超算一体化演进，市场对AI算力乃至多元算力的需求愈加强烈。

一个明显的变化是，在国家政策的大力倡导下，全国各地都在积极打造大型智算中心，以推动国家新一代人工智能公共算力开放创新平台的建设。同时，“东数西算”工程也推动着各地包括智算中心、超算中心在内的算力中心建设，以提升国家整体算力水平。

作为中国*早一批推出公有云服务的云服务商，青云科技在算力的调度、运维、运营等方面，已历经了十多年的大规模市场验证。2020年在洞察到国家“新基建”政策背后的算力中心和多元算力的需求后，青云科技提前三年就开始布局算力领域，从而具备了服务算力中心建设三要素(架构/能耗管理、多元算力操作系统以及多算力集群运营)的能力。

据青云科技产品经理苗慧介绍，青云AI算力服务平台具备九大关键能力——多区多业务资源整合、高速并行存储、混合组网、分布式调度与管理、灵活调度、容器推理服务平台、算法开发支持、模型仓库(MaaS)、AI训练平台。

例如，在资源调度上，青云科技在多个方面进行了优化：为了适应AI行业特点，实现了立即调度扩容数万卡资源;在通信链路上，所有的节点、服务器、存储都打上了路径标签，可计算调度*短链路，让数据不绕路;支持异构平台，加速国产GPU芯片替代;使用“K8s+Slurm”对作业感知的管理，实现*大系统利用率;广泛的调度选项、动态灵活的资源调度可配置，使得运营管理员可以通过排队、调度、手动调度等方式，解决AI系统中*具挑战性的优先事项。

在混合组网上，青云科技也基于传统的云计算领域，增加了高速网络，在多区域(AZ)构建了统一服务计算平台，能够支持跨区域高速网络互联、不同类型资源池互联、独立计算和存储IB网、专属访问存储高速网络、业务网络互连下发任务等。用户在申请资源时，无论是按卡还是按节点申请，都能保证数据的安全隔离。

在AI训练平台上，青云科技集成了常用的训练模型框架，并提供GPU服务器在线申请、自动调度的集群，使得AI训练的所有网络和环境都可以一键生成。

整体而言，青云科技在AI算力领域的成功并非偶然，而是在AI算力调度和运营方面下了“狠功夫”的必然结果。目前，除了国家超算济南中心，青云AI算力服务平台还应用在清华天津电子院智算科研教学平台、上海科发SciPlus科研云等算力融合创新场景中，成为各类算力中心运营者的关键工具，助力算力中心建立从建设到运营的闭环。

在AI算力云服务方面，青云科技基于公有云能力打造了全面的算力基础设施，与生态同盟一起通力合作，为企业提供多样化的算力服务支撑，承担起AI算力云服务商的责任。

在青云科技总裁林源看来，AI算力未来一定会成为青云科技主营的业务模式，这是由市场决定的，“不管是互联网客户，还是传统行业客户，大家都在转向AI，所以我们的生意模式也是这么驱动的”。

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

AI算力“双轮驱动”，青云科技备战下一个十年

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们