作为全国首个以 “双高” 为基础的本科职业学校,深圳职业技术大学在 AI 高层次技术技能人才培养中,正面临一道关键难题:学生实训要足量 GPU 算力支撑,教师科研需灵活适配 IT 环境,可传统 IT 架构下,资源不够用、管理太繁琐、运维压得慌,如何打破这层束缚?深圳职业技术大学为职业本科 AI 育人提供了可落地的参考样本。
深圳职业技术大学是一所公办本科层次职业院校。建校以来,学校以立德树人为根本任务,坚定职教本色,坚持深圳特色,深入对接国家所向、深圳所需,秉持“德业并进、自强不息”的校训精神,不断创新办学体制机制、教育教学理念、人才培养模式,创造了中国高职教育的多个第一,综合实力稳居全国同类院校前列。
在 AI 发展大潮下, 学校以人工智能技术应用落地为研究导向,积极开展学科建设,推动科研向教学的转化,培养高层次技术技能人才。既要让学生在课堂上接触真实的 AI 模型训练与推理场景,又要支持教师开展面向产业需求的 AI 应用科研项目,深圳职业技术大学原有 IT 架构逐渐难以支撑新增需求,主要面临以下阻碍:
GPU 资源利用低,实训需求难满足
AI 教学中的模型实验、教学实训均高度依赖 GPU 算力,但学校面临双重困境:一方面,GPU 资源有限,高峰期多个班级需排队使用,实训课程的时段安排分散,影响教学进度;另一方面,传统管理方式下,GPU 资源利用率低,非上课时段设备常有闲置,需要动态调配机制,缓解资源紧张问题。
教学环境要求有差异,准备复杂并且管理难
不同课程对 IT 环境的需求差异显著,为支持不同计算任务可能花费大量时间配置物理机,同时需要配置不同的 AI 框架,学习环境的切换与就绪都耗时耗力。与此同时,实验代码、训练模型、数据集缺乏统一存储管理,一旦出现本地设备故障等问题,可能导致数据丢失或者结果出错。
依赖教师的人工管理,运维压力大
从 GPU 资源申请、环境配置到实验任务提交,均需依赖老师手动操作,挤占了备课与教学时间。如果面对 100+ 学生同时申请资源,不仅效率低下,还容易出现资源分配不均、权限设置错误等问题,进一步增加运维负担。
资源池化切分 + 动态调度:实现供需平衡与高效利用
通过青云 AI 智算平台,深圳职业技术大学将 GPU 资源整合为统一资源池,以精细化的算力切分及智能动态调度破解智算资源难题。
精细化算力切分:
同时支持独占 GPU 和 vGPU 申请。通过 vGPU 将单张 GPU 卡切分为多个独立算力单元,每个单元可满足 1 名学生的实训需求,在不增加硬件投入的情况下,将 GPU 资源承载能力提升 3-5 倍。
智能动态调度:
依托调度算法实现 “教学实训优先 + 科研错峰利用”,上课高峰期自动将闲置科研算力单元调配至教学场景,非上课时段则释放算力单元供科研使用,资源不足时自动开启排队机制,实现资源价值最大化。
分钟级交付:环境切换与框架启动零门槛
为解决教学环境适配难,深圳职业技术大学通过软硬件一体化交付的方案,实现教学实训 “开箱即用”。
分钟级环境交付:
学生通过统一平台提交环境需求,从申请到环境就绪仅需 1 分钟,相比传统手动配置效率大幅提升,满足多课程连续实训的快速切换需求。
一键启动常用框架与模型:
预集成 PyTorch、MindSpore 等主流 AI 框架,以及 30 + 通用模型,学生无需手动下载配置,点击即可启动使用,同时支持自定义模型上传,兼顾基础教学与进阶实训。
全流程自助 + 可视化监控:学生更便捷、教师更省心
借助青云 AI 智算平台,深圳职业技术大学实现学生自主操作与教师智能管控的双向优化,减轻师生的使用负担,进一步提升管理效率。
全流程自助:
学生可自主完成 GPU 资源申请(选择算力规格、使用时长)、环境配置与任务提交,一旦任务完成,资源则自动释放,同时也支持师生的远程访问,以及多任务并发。
可视化监控与自动隔离:
教师通过平台可以查看 GPU 使用率、内存占用、任务进度等。当出现设备故障、资源超配等问题时,系统自动触发告警;当出现异常任务时,能够自动隔离,不影响其他学生的实验进程。
深圳职业技术大学以高效、低成本的智算支撑,解决了 GPU 资源紧张的难题,实现了实训环境的分钟级交付,获得了更便捷的管理运维,加速了科研向教学的转化,为培养高层次技术技能人才筑牢根基。青云科技将持续探索高校在 AI 时代的深层需求,不断创新应用场景,以更贴合教育实际的智算解决方案,助力 AI 教学、科研与人才培养。