地方高校人工智能算力保障机制创新研究——以河南工业大学为例
发布部门: 智慧教学 发布时间: 2025-10-16 浏览次数: 1038

谢日行 河南工业大学 信息化办公室主任

杨鹏元 河南工业大学 信息化办公室用户服务部科长

一、引言

“数字中国”战略与教育数字化战略行动的双重推动下,全国高校将逐步建成数字化、智能化的教育新生态,而算力资源作为这一转型的基础支撑,为高校开展人工智能研究、大数据分析和智慧教育实践提供基础条件,其重要性日益凸显。

然而,与“双一流”高校相比,地方高校在算力资源配置方面面临着更为严峻的挑战。根据中国高等教育学会2024年的调研数据,大部分地方高校存在算力资源不足的问题,同时现有的算力资源利用率普遍较低,形成了典型的“资源紧张与闲置并存”的矛盾局面。河南工业大学作为一所具有鲜明行业特色的地方高校,在粮油食品、土木建筑等学科领域具有较强实力,但在数字化转型过程中同样面临着算力资源分散、供给不足、利用效率低下等共性问题。

本文基于河南工业大学的实践探索,系统总结了地方高校在算力保障机制建设方面的创新做法,为同类院校提供了可复制的经验参考。

二、地方高校算力保障的现实困境

1.资源分散与统筹缺失

地方高校的算力资源配置普遍呈现“碎片化”特征,算力资源主要依托学院实验室自建服务器或购置GPU节点,缺乏统一规划与管理。各学院自成体系,资源使用率不高,却难以跨部门共享,形成“闲与缺并存”的局面。以河南工业大学为例,原有23个分散的计算节点,分布在8个不同学院和实验室。这些资源由各建设单位自主管理,缺乏统一的技术标准和接口规范,导致跨部门共享存在严重障碍。调研数据显示,这些分散资源的平均利用率仅为35.2%,而在科研高峰期,教师普遍反映“算力申请困难”。造成这一现象的主要原因包括:

1)管理体制分割:传统的高校管理体制下,各学院拥有较大的自主权,信息化建设往往呈现“条块分割”特征。

2)标准不统一:不同时期、不同项目购置的设备在架构、配置和软件环境上差异较大。

3)共享机制缺失:缺乏有效的资源共享激励机制和平台支持。

2.供给不足与需求激增的矛盾

随着人工智能技术的普及,高校对算力的需求呈现指数级增长。一个典型的深度学习模型训练任务可能需要数十张GPU卡连续运行数天。在科研需求不断增长的背景下,GPU、CPU、存储等资源长期供不应求,难以支撑深度学习、复杂模拟等高强度任务,科研人员普遍反映“算力不够用”。

3.调度低效与管理粗放

算力调度方式较为原始,以人工分配或预约排队为主,缺乏智能化管理。部分设备长期低负载运行,而科研高峰期又出现排队拥堵,无法实现资源的弹性调度与高效利用,主要问题有:

1)排队机制僵化:采用简单的先到先服务原则,无法区分任务优先级。

2)资源监控缺失:管理员难以及时掌握各节点的负载情况。

3)弹性分配困难:无法根据任务需求动态调整资源配给。

4.资金约束与可持续发展

地方高校的财政资源有限,难以持续投入大规模算力建设。以GPU服务器为例,一台配置8张A100显卡的服务器价格约150万元,加上配套的网络、存储和机房设施,建设一个中等规模的算力中心需要数千万元投入,这对地方高校来说是沉重的负担。

5.服务体系不健全

算力服务不仅仅是硬件提供,更需要配套的软件支持、技术培训和运维保障。当前多数地方高校仅关注硬件采购,缺少算力治理制度与服务机制,存在明显短板。例如,缺乏专业的用户支持团队,没有完善的用户权限管理、任务优先级策略、专门的用户培训队伍,导致资源分配公平性与可持续性不足。

三、河南工业大学算力保障机制的创新实践

1.统一规划与顶层设计

为适应教育数字化转型需求,信息化办公室不断推进数据中心建设从分散型的计算存储设备组合向集中型的智慧云平台转变,逐步改变垂直烟囱管理架构,不断加强硬件资源整合,实现软件数据融合。信息化办公室与财务处、国有资产管理办公室形成良好协调机制,总体按照“统一规划、协同建设、分步实施”的原则推进建设,由信息化办公室统一规划数据中心的整体技术框架和扩容方案,相关单位利用各类建设经费协调建设,信息化办公室负责集中运维。

2.建设校级算力中心

2024年,信息化办公室全面接管原隶属于人工智能与大数据学院的高性能计算平台,并在此基础上统筹整合分散在校内各学院的GPU服务器、HPC平台以及部分教学机房的计算资源,建立起由信息化办公室统一管理和调度的“校级高性能计算平台”。这一举措不仅解决了以往算力分布零散、利用率不足、管理标准不一等问题,而且为全校师生提供了更加集中、高效和可持续的算力保障。在建设过程中,信息化办公室积极探索虚拟化与容器化等先进技术手段,实现了跨学院、跨部门的算力资源统一调配和弹性共享,从而为科研创新、学科交叉和智慧教学提供了坚实的基础支撑,也标志着学校算力治理和数字化转型迈出了关键一步。

3.引入智能化调度平台

信息化办公室在校级高性能计算平台建设过程中,充分引入Kubernetes、Slurm等主流开源调度与管理平台,对分散的算力资源进行统一调度和弹性分配。通过该体系,可以根据不同的应用场景(如教学实验、科研项目、行政支撑等)灵活配置计算资源,并结合任务的优先级、时长及资源需求实现智能化排队和动态调度。这样既能够避免资源的长期闲置或局部拥堵,又能显著提升整体算力利用率和任务完成效率。同时,统一的调度机制还为全校师生提供了可预期、公平透明的算力服务环境,保证了重点科研任务的顺利推进和日常教学活动的持续开展,为学校科研创新与智慧教育提供了更加可靠的算力保障。

4.采用分层级算力保障策略

信息化办公室针对教学、科研和行政服务的不同需求,采用分层级保障策略。教学任务方面,采用实时优先策略,确保课堂实验、课程实训、智慧教学平台的算力请求得到快速响应,为师生提供稳定顺畅的学习体验;科研计算方面,通过批量队列调度,合理配置大规模科研仿真、人工智能训练、数据建模等任务的算力资源,保证科研项目的高效推进与成果产出;行政服务方面,实行错峰调度原则,将办公自动化、业务系统运行等常规需求安排在资源利用率低谷时段执行,有效降低成本并避免与教学科研产生资源冲突。通过上述架构与治理策略,不仅能够提升算力资源的整体利用率和公平性,还能在安全性、灵活性、成本可控性方面形成综合优势,为学校数字化转型和创新发展提供坚实的算力支撑。

5.建立“端—云”结合的算力调配机制

在算力基础设施建设方面,学校积极探索“本地计算(70%)+公有云灾备(30%)”的双层算力体系架构。具体而言,以校内自建的高性能计算节点作为主体,承担约70%的日常教学与科研算力需求,确保大多数应用场景能够在校内完成高效处理,从而实现低延迟、高可靠和成本可控的运行环境。同时,预留约30%的算力需求通过公有云灾备来保障,借助专线接入“郑—庆—哈”国家算力枢纽、郑州高新区算力中心以及联通算力平台等外部资源,实现校内与校外算力的无缝切换与动态调配。一旦遇到突发性算力需求增长或本地平台出现故障,公有云灾备体系即可快速接管任务,保障教学、科研和管理工作的业务连续性与数据安全。通过这一“双层算力”模式,学校不仅在成本与性能之间取得了平衡,还为未来跨区域协同创新与多层次应用提供了更为坚实的算力底座。

6.构建算力服务与培训体系

为进一步提升校级高性能计算平台的服务水平,信息化办公室专门成立了用户服务部,面向全校师生提供全流程、一站式的算力支持服务。该部门不仅负责受理算力资源的申请和分配,还为用户提供使用指导、任务调度优化、运行问题排查等技术支持,确保各类教学、科研和管理任务能够高效稳定地运行。同时,用户服务部还定期组织算力培训课程,涵盖基础操作、平台使用规范、任务优化方法以及先进工具的应用等内容,帮助师生全面提升算力平台的使用能力和效率。通过“服务+培训”的双轮驱动机制,学校逐步建立起一支懂平台、会使用、能优化的用户群体,进一步释放算力平台的潜能,推动科研成果产出和智慧教学应用的深入发展。

四、算力保障机制成效初显

在算力保障机制的支撑下,河南工业大学构建了“教学—科研—服务”三位一体的智能教育生态系统。

    1.在教学领域,通过部署多模态教育大模型与生成式AI技术,深度融合PPT自动生成、智能学伴系统、数字人课程制作等创新应用,形成线上线下协同的智慧教学模式。同时建立由AI助教、督导系统、领导评价组成的多元化质量评估机制,形成教学诊断、过程优化、成效反馈的闭环生态。

    2.在科研领域,依托高性能计算平台和知识图谱技术,为科研人员提供高效的数据整合、可视化分析和智能推理服务。通过引入大模型辅助的科研数据挖掘工具,显著提升科研效率与成果产出质量。同时,算力保障还支撑跨学科协同创新与前沿研究探索,推动形成多学科交叉融合的科研新范式。建立“算力+数据”双轮驱动的治理模式,通过数据分级存储、版本管理、隐私保护机制,提升科研数据与算力结合的效率。

    3.在服务维度,着力打造“学业—生活—职业”贯通的智能支持体系。通过情感计算、个性化推荐、智能问答等技术手段,能够为学生在学习指导、心理关怀、职业规划等方面提供精准帮扶,提升服务的个性化与智能化水平。依托AI助手与数据驱动的管理平台,学校可实现对学生全生命周期的动态支持与精准服务,进一步增强校园治理的科学化和人性化。

五、结语

算力已成为地方高校数字化转型的关键基础设施。然而,算力分散、资源紧张、利用效率低下等问题制约了其发展。地方高校应从顶层设计、校级整合、智能调度、分级保障、“端—云”结合和服务体系建设等方面,探索符合自身实际的算力保障机制。在有限的资源条件下,通过科学统筹和制度创新,也能实现“算力可用、算力高效、算力可持续”的目标,从而支撑学校教学科研和管理智能化的高质量发展。(文章摘自河南教育信息化)