2024年12月23日,OpenHarmony城市技术论坛(以下简称“技术论坛”)第12期——合肥站于中国科学技术大学高新校区圆满举办。本次技术论坛聚焦于“智能时代基础软件与数据管理”的主题,深入研讨OpenHarmony十大技术挑战、智能数据底座、列存储格式、键值存储系统等技术领域最新进展。
嘉宾合照
本次技术论坛由OpenHarmony项目群技术指导委员会(以下简称“OpenHarmony TSC”)主办,中国科学技术大学承办,OpenHarmony智能数据管理TSG协办。中国科学技术大学计算机学院特任教授李永坤担任本次技术论坛的出品人,中国科学技术大学计算机学院特任教授李永坤与上海交通大学软件学院副院长王肇国共同担任主持人,邀请到了产学研界的多位专家学者出席论坛并进行技术报告,包括OpenHarmony项目群技术指导委员会主席、上海交通大学特聘教授陈海波,香港中文大学OpenHarmony技术俱乐部主任、香港中文大学Choh-Ming Li 讲席教授、ACM和IEEE FellowJohn C.S. Lui,OpenHarmony项目群技术指导委员会委员、华为OS内核实验室主任贾宁,华为嵌入式数据库首席专家周敏奇,华为终端BG软件部技术专家李有福,清华大学交叉信息研究院助理教授张焕晨,安徽大学副教授、安徽大学先进计算机系统研究所所长孙辉,中国人民大学讲师谢旻晖等专家学者。本次技术论坛现场与会师生超过200人,线上直播观看人数累计超过4万。
论坛现场
OpenHarmony项目群技术指导委员会主席陈海波开场致词,他强调OpenHarmony的技术能力经过持续的发展,已日臻成熟。大家致力于面向万物智联的未来,构建一个分布式全场景协同的开源操作系统基座与生态系统。在这个过程中,数据管理的重要性愈发凸显,特别是在万物智联的场景下,数据管理既迎来了前所未有的机遇,也面临着全新的挑战。陈海波指出,目前基于OpenHarmony的研究成果已在系统、数据库、软件工程等多个领域的学术会议上频繁亮相,这充分展示了新时代产学研协同的巨大价值。相较于传统的产学研协同模式,通过开源社区进行协同能够迅速见效,从源于开源到回馈开源的过程,其效果十分显著。研究人员能够快速将技术成果应用于OpenHarmony,并迅速覆盖至数亿级设备和人群。他强调,这无疑是一种极具潜力和前景的新模式,值得大家深入探索与实践。最后,陈海波希望借此次论坛的机会,各位专家能够积极探讨,共同推动OpenHarmony取得更大的进步。
陈海波致辞
香港中文大学OpenHarmony技术俱乐部主任、香港中文大学Choh-Ming Li 讲席教授、ACM和IEEE Fellow John C.S. Lui出席活动并做《OpenHarmony: Opportunities and Responsibilities》技术报告。报告全面覆盖了OpenHarmony的概况、核心技术要点,以及它在教育与研究领域所带来的机遇。John C.S. Lui教授强调,OpenHarmony作为一个开放源代码的项目,诚邀全球开发者携手参与其建设与发展进程,共同在全球市场中赢得更为显著的竞争优势。他还特别指出,OpenHarmony为本科生以及研究生提供了诸多潜在的项目机会,这些项目聚焦于物联网、人工智能等前沿领域。通过参与这些项目,学生们不仅能够显著增强自身的实践能力和团队协作精神,同时也将为OpenHarmony生态系统注入源源不断的创新活力与新鲜血液。
John C.S. Lui做技术报告
OpenHarmony项目群技术指导委员会主席、上海交通大学特聘教授陈海波带来《产学研协同的操作系统研究与OpenHarmony实践》技术报告,剖析了前瞻性和影响深远的操作系统研究路径,以及构建卓越系统架构的有效策略与方法。他首先分享了操作系统研究中的几个核心关注点:系统架构设计、性能深度优化以及安全强化措施,这些均是推动操作系统进步的关键要素。他随后简要追溯了操作系统的发展轨迹,强调了操作系统作为计算机系统的基石,为应用程序提供必要的运行平台与基础服务,对计算机科技的进步具有不可替代的推动作用。此外,他还从技术革新、产业发展到市场布局等多个维度综合介绍了国内操作系统的现状,并指出尽管国内操作系统研究已取得初步成果,但仍面临着技术瓶颈、产业生态构建及市场竞争等多重挑战。
陈海波做技术报告
OpenHarmony项目群技术指导委员会委员,华为OS内核实验室主任贾宁带来《OpenHarmony技术挑战及代表性开源项目》技术报告。该报告深入探讨了OpenHarmony——面向万物智联时代的开源终端操作系统的技术挑战与代表性项目。OpenHarmony致力于为用户提供极致流畅的操作体验、纯净安全的系统环境、全场景智能互联的生态基座,迎来前所未有的发展机遇。但这一进程中,OpenHarmony也面临着诸多挑战、包括如何构建以用户为中心的App形态、多元化操控的自然交互体验、场景化的资源管理策略、全生命周期的数据安全等。近年来,得益于各领域社区成员的参与和努力,OpenHarmony针对以上挑战已有一些技术突破,并形成相应的开源项目,不仅彰显了OpenHarmony在创新方面的实力,也进一步推动了其生态建设。同时也欢迎社区成员通过高校俱乐部、技术专家组、年度课题揭榜等形式,参与到OpenHarmony技术挑战攻坚克难中。
贾宁做技术报告
华为嵌入式数据库首席专家周敏奇出席活动并做《鸿蒙智能数据底座(ArkData/GaussPD)的机遇与挑战》技术报告。周敏奇指出在Agentic AI时代,智能设备如AI Phone和AI PC等,为了提供高度个性化的服务,不仅需要具备理解世界的能力(依赖于LLM,即大型语言模型,以及VLM,即视觉语言模型),还必须深刻理解用户(这依赖于ArkData与GaussPD等先进技术)。然而,在设备性能、功耗及散热等物理限制条件下,实现超过95%的用户覆盖率以及用户信息理解覆盖度,成为了极具挑战性的任务。
周敏奇做技术报告
华为终端BG软件部技术专家李有福带来《鸿蒙智慧数据底座介绍及难题讨论》技术报告。李有福指出针对日益多样化的智能终端设备,鸿蒙智慧数据底座作为一项创新性的技术框架,其核心使命在于提供具有高度融合性与多模态统一性的数据服务。这一数据底座不仅仅是一个数据处理平台,更是连接用户与智能设备之间的一座桥梁,它旨在通过关键数据管理和人工智能技术,构建一个能够理解用户心智的数据系统。这样的系统不仅能够根据用户的偏好、行为模式提供个性化的服务,还能在不断的学习和优化中,更加贴近用户的真实需求,提升用户体验。
李有福做技术报告
清华大学交叉信息研究院助理教授张焕晨带来《Toward Next-Generation Columnar Storage Formats》技术报告,深入探讨了列存储格式的发展现状与未来趋势。报告中指出,自Apache Parquet和Apache ORC等列存储格式诞生以来,它们便凭借高效的数据压缩能力、出色的查询性能以及对大数据处理框架的卓越支持,迅速在数据分析系统中占据了核心地位。然而,这些格式的设计均源于十多年前,当时它们主要应对的是海量数据存储、快速查询响应以及资源有效利用等大数据处理领域的挑战。自那时起,无论是硬件技术还是工作负载环境都发生了显著的变化。在硬件方面,我们见证了CPU核心数的快速增长、内存容量的不断扩大以及存储技术的持续革新,这些都极大地提升了数据处理的速度和效率。而在工作负载环境方面,数据分析任务也变得更加复杂多样,从简单的批量处理到实时的流处理,再到复杂的机器学习模型训练,这些都对存储格式提出了更加严格和多样化的要求。
张焕晨做技术报告
上海交通大学长聘副教授、上海交通大学软件学院副院长王肇国出席活动并做《从云到端:从应用角度看数据管理问题》技术报告。王肇国在从实际应用的角度出发,深入剖析数据管理领域所面临的潜在挑战与最新研究进展,尤其聚焦于云端与终端数据管理系统的构建与优化。在云端层面,直面用户访问模式多样化的严峻挑战,创新性地提出了自动挖掘并应用SQL访问优化规则的方法。该方法能够智能识别并分析用户的SQL查询行为,自动生成并应用针对性的优化策略,从而显著提升云端数据管理的效率与响应速度。而在终端层面,则以OpenHarmony数据管理系统为实例,生动展示了如何为多模态数据设计并实施一个高效且可靠的终端数据管理系统架构。该架构不仅能够有效整合并处理来自不同源头、不同格式的多模态数据,还能够在资源受限的终端设备上实现数据的高效存储与快速访问。
王肇国做技术报告
安徽大学副教授、安徽大学先进计算机系统研究所所长孙辉带来《近数据计算---加速键值存储系统新架构》技术报告,基于LSM-tree的键值存储系统常用于非结构化数据管理,但常受写放大问题困扰,这主要受限于传统的计算中心模式。近数据计算作为一种以数据为中心的方法,通过将compaction任务迁移到数据存储位置,有效降低了compaction的代价,进而提升了系统性能。然而,随着键值存储系统规模的不断扩大,尽管近数据计算能够缓解部分压力,但单个存储盘的计算能力有限,难以完全满足大规模数据处理的需求。为解决这一问题,我们提出了一种利用多盘并行近数据计算来优化compaction操作。为了实现这一系统,我们将深入研究高效的数据组织与分布策略,以充分利用多盘并行计算的优势;设计适用于近数据计算系统的索引结构,以提高数据检索效率;以及资源预测与均衡策略,以确保系统资源的合理分配和高效利用。
孙辉做技术报告
中国人民大学讲师谢旻晖带来了《面向推荐大模型的参数存储系统研究》技术报告,谢旻晖指出,推荐模型作为深度学习领域的重要支柱,广泛应用于互联网核心商业场景。与计算密集型的传统稠密大模型(如GPT)形成鲜明对比的是,大规模推荐模型因涉及万亿级别的稀疏参数频繁随机访问,存储瓶颈成为制约其性能提升的关键因素。传统深度学习框架在设计之初主要聚焦于稠密模型,因此难以满足推荐模型在高效训练与精准预测方面的严苛需求。针对这一挑战,谢旻晖全面剖析利用多层次内存体系(涵盖GPU显存、持久性内存、SSD等)构建推荐模型参数存储系统所面临的复杂挑战,并详细介绍通过创新技术加速访存以显著提升推理性能的方法。同时,谢旻晖还展示了集成系统RecStore,该系统旨在为现有深度学习框架提供功能完备、访问高效且成本优化的参数存储解决方案。
谢旻晖做技术报告
中国科学技术大学计算机学院特任教授李永坤带来了《存储系统I/O优化与Benchmark构建》技术报告,李永坤指出存储系统性能一直是制约计算机系统性能提升的关键因素,特别是在当前数据密集型计算需求快速增长的情境下,数据访存过程中的大规模数据迁移频繁引发I/O性能瓶颈。李永坤分享了在存储系统I/O性能优化领域的最新研究成果与实践经验,并提出了一个面向移动智能终端设备构建性能基准测试(Benchmark)的创新构想与具体实施方案。该方案将详细探讨Benchmark的工作负载特性、关键性能指标的选择与设定,以及接口设计等多个核心方面,旨在为移动智能终端存储系统的性能评估与优化提供科学、全面的支持,推动存储系统技术的进一步发展。
李永坤做技术报告
OpenHarmony城市技术论坛旨在从“终端操作系统十大技术挑战方向”出发,依托OpenHarmony技术俱乐部、联合TSG等社区专家,以城市为活动单元,邀请本地高校、共建单位以及地区企业,聚焦当前OpenHarmony相关技术所面临的难点问题,打造多元素对话交流平台,促进产学研用生态闭环。截至目前,上海、武汉、长沙、北京、张掖、大连、厦门等城市举办了技术论坛活动,进一步推动了产学研深度协同,促进OpenHarmony技术和人才生态的繁荣发展。