面向教育应用的数字人视频制作平台评测——基于17个代表性平台的评测分析
发布部门: 智慧教学   发布时间: 2026-01-22   浏览次数: 962

摘要:当今,数字人技术在教育场景的应用日益深入,但相关研究多聚焦技术特性,而缺乏对数字人视频制作平台作为教学工具的适配性评测。基于此,文章首先依托IPO理论模型,构建了包含平台支持和数字人特性两个维度、由9个一级指标和36个二级指标组成的数字人视频制作平台评测指标体系,并采用熵权法确定了各级指标的权重。之后,文章从教育场景应用出发,选取剪映、腾讯智影、讯飞智作等17个具有代表性的数字人视频制作平台,应用此评测指标体系对这些平台进行了评测分析,结果表明:当前数字人视频制作平台呈现出显著的多样化特征,平台支持维度的表现整体优于数字人特性维度,其中数字人特性维度的字幕、形象两个指标成为平台进行教育应用的关键瓶颈,而平台支持维度的经济性指标与性能效率指标之间矛盾突出,使平台的教育应用陷入了两难选择。基于此结论,文章从技术攻关、分层应用、生态建设三个角度提出数字人教育应用的优化建议。文章的研究可为教师选型、开发者优化、行业建设提供实证依据,助推数字人技术更精准、稳定地服务于教学实践。

关键词:数字人;视频制作;平台支持;数字人特性;教育数字化转型

随着元宇宙概念的深化和人工智能技术的突破,数字人正逐步从技术探索转向教育场景的规模化应用,其情感化、泛在化和多模态交互的特征为教育模式创新提供了新的可能[1]。《中国数字人发展报告(2024)》指出,数字人作为教育数字化转型的载体,正在重构教学主体关系与学习环境[2]。然而,当前研究多聚焦数字人的技术特性与应用框架构建[3],对数字人视频制作平台作为教学工具的功能评测及其视频质量的系统性分析存在不足,尤其缺乏以教师使用需求为核心、能为开发者提供改进方向的实证研究,加上教育数字化转型面临资源低效集成、技术应用与教学需求脱节等实践困境[4],因此有必要从教育应用的视角对数字人视频制作平台进行评测。基于此,本研究拟以主流数字人视频制作平台为对象,从“微课制作”这一典型场景切入,构建涵盖平台支持与数字人特性双维度的数字人视频制作平台评测指标体系,并通过对17个代表性平台的实证评测与数据分析,系统揭示当前平台在教育适配性上的核心瓶颈,为破解技术供给与教学需求的结构性错配问题提供实证依据。

相关研究

1 数字人评价研究

梳理相关研究成果,可知目前针对数字人评价的研究多从技术效能、用户感知、社会价值等角度切入:①在技术效能角度,朱奕帆等[5]依托用户感知理论,提出涵盖感知技术性、感知功能性、感知交互性、感知情感性和感知社会性的多维测评模型,发现用户对功能型数字人的期待更高,超写实技术和卡通技术都受到了用户的喜爱;刘颖等[6]指出,语音驱动数字人的评价需融合客观技术参数和主观感知,来反映技术成熟度并验证技术落地效果。②在用户感知角度,张紫琼等[7]将数字人的特征归纳为内在特征和外在特征两个方面,其中外在特征主要包括数字人的拟人化设计、身份信息和语言特征,内在特征则体现为其可控性、高效性和专业性;王袁欣等[8]借助仿真度量表、恐怖谷效应量表和用户接受度量表,验证了仿真度与用户接受度之间存在正相关关系。③在社会价值角度,朱奕帆等[9]发现用户更看好功能性数字人的社会价值;王春辉[10]指出,从医疗保健、教育培训到垂直领域口播视频、智能客服,到政务服务、新闻播报,再到城市治理、安全领域,数字人的应用场景越来越广泛。

综合来看,现有的数字人评价虽然在评价维度上具有较强的普适性,但也存在教育针对性弱、技术导向的评价逻辑未能与教育理论深度融合、社会价值评价忽视教育公平性和成本可控性等问题。对此,本研究提出教育场景中的数字人评价需实现三重转型:从通用技术指标转向教育功能适配指标,从单向用户感知转向教学双主体互动效能,从商业化价值评估转向教育生态可持续性分析。

2 工具类平台评价研究

从本质上来说,数字人视频制作平台属于为特定任务提供数字化解决方案的工具类平台。因此,其他类型的工具类平台评价研究对本研究具有重要的借鉴意义。梳理相关研究成果,可以发现工具类平台评价研究已形成了较为成熟的方法论体系。例如,禹建湘[11]针对网络文学网站社会效益评价,构建了包含目标层、要素层和指标层的三级评价体系,并采用层次分析法和德尔菲法确定了指标权重。此研究通过五级评判标准设定和等级映射机制,将社会效益转化为可比较的分值,验证了分层指标结构对复杂系统评价的适应性;同时,此研究在权重分配中引入专家经验与数据校验的双重机制,通过评价指标权重排序揭示关键影响因素,可为工具类平台的功能性评价提供参考。而刘羽歆等[12]基于用户体验建立了面向专业性购物网站的评价体系,并采用网络分析法(Analytic Network Process,ANP)确立了评价体系的权重,同时引入相对熵优化的逼近理想解排序法(Technique for Order Preference by Similarity to Ideal Solution,TOPSIS)对网站的评价结果数据进行排序,其案例分析结果验证了此评价体系考虑全面,数据处理方法稳定,有助于明晰专业性购物网站设计和改进中需要优先考虑的问题,为工具类平台的用户体验评价提供了思路。

梳理现有的研究成果,可知工具类平台评价在方法论层面已达成了以下共识:①指标体系需通过层级分解,实现评价维度的结构化呈现;②权重分配需平衡专家经验与数据驱动,采用网络分析法、熵权法等复合方法减少主观偏差;③效果验证需整合算法计算与人工评估,通过多源数据交叉验证提升结果的稳健性。这些共识,为数字人视频制作平台评测指标体系的构建提供了方法论支撑。

3 数字人技术标准研究

当前,国内外已针对数字人应用系统、视频制作平台、字幕译制等制定了多项数字人相关的技术标准。例如,我国工业和信息化部发布的《虚拟数字人指标要求和评估方法第1部分:参考框架》提出了涵盖形象、语音、动画、交互处理、多模态输入、多模态输出六大模块的虚拟数字人指标体系,包含人物特性、语音韵律准确性、动作自然度等核心指标,并针对2D与3D数字人差异制定了分类评估规则[13];国际电信联盟电信标准化局发布的《数字人应用系统基础框架和评测指标》从图像、语音、动画等方面构建了全球通用型评估框架[14],并针对非交互式数字人发布了《非交互式2D真人形象类数字人应用系统的指标要求和评估方法》[15],细化了对语音合成实时率、画面流畅度和音视频同步精度的量化要求。此外,在标准研究方面,李青等[16]构建了涵盖体系框架标准、功能/技术标准、内容/数据标准、平台接口标准、管理标准、产品/服务质量标准、安全伦理与隐私标准的七大类标准体系,明确了教育场景分类与建设原则。

综合来看,现行的数字人技术标准研究已涵盖从基础框架、交互逻辑到具体应用场景的方方面面,形成了分级分类的技术标准,并与视频制作、字幕译制等方面的相关标准实现了对接[17][18]。这些标准不仅为数字人视频制作平台的研发与评测提供了理论指导,也为跨平台、多模态技术的协同优化提供了规范参考。

用什么评测?

1 理论基础

数字人视频制作平台是教育数字化转型的重要技术载体,其评测需要突破传统工具类平台以功能罗列为主的单一视角,转而系统揭示技术供给与教学需求之间的适配逻辑。本研究引入输入-过程-输出(Input-Process-Output,IPO)模型,作为构建数字人视频制作平台评测指标体系的理论基础。


IPO模型起源于系统分析与设计领域,其核心价值在于通过完整覆盖系统运作的输入资源、处理机制与输出结果的动态关联,实现多维指标的有机整合。例如,刘文等[19]基于IPO模型构建了作战指挥软件界面可用性评价指标体系,通过兼顾信息支持(Input)、交互支持(Process)与任务支持(Output),拓展了该模型在技术工具评测中的应用场景。IPO模型在数字人视频制作平台的评测场景中具有独特的适配价值:输入维度对应教学内容素材,主要进行原始数据输入;过程维度聚焦平台技术处理,涵盖语音合成、动画渲染、字幕生成等具体操作;输出维度指向最终生成的视频质量,主要表现为视听呈现效果和教育教学成效。IPO模型中“输入标准化-过程可观测-输出教育化”的评测逻辑,既继承了传统工具评测对技术参数的量化分析传统,又强化了教育场景特性,使评测呈现出了显著的“教学-技术双驱动”特征。

基于此,本研究依托IPO模型构建数字人视频制作平台评测指标体系,以实现以下突破:①统一输入。通过使用同一教学文本并作为输入素材,有效排除素材本身对结果的干扰,确保评测得分更客观地反映平台的视频生成技术能力。②过程与输出联动。通过分析平台的视频制作环节与最终生成的视频质量之间的联系,挖掘影响视频质量的因素,为平台开发者提供精准的改进方向。③教育目标量化。将抽象的教学需求转化为可测量、可比较的具体指标,使评测结果能直接指导教师选择合适的平台、优化教学资源开发。

2 评测指标体系的初步构建

为系统评估数字人视频制作平台在教育场景中的应用效能,本研究依托IPO模型,同时参考前文所述的相关研究成果,初步构建了数字人视频制作平台评测指标体系。此体系以平台支持与数字人特性为双核维度,结合教育场景中知识传播、教学互动和资源生成的核心诉求,下设若干一级指标和二级指标。其中,平台支持维度着力考察工具本身的技术性能与教育适配能力,其对应于IPO模型的过程(Process)环节,聚焦平台在视频制作过程中的技术能力与服务支撑;数字人特性维度重点关注虚拟教师作为教学主体的媒介表现力,其对应于IPO模型中的输出(Output)环节,即平台最终生成的视频质量。两者共同构成衡量平台教育应用效能的完整闭环:“平台支持”是技术赋能的基础与过程保障,而“数字人特性”是技术赋能的结果与价值体现。

在设计此体系的一级指标和二级指标时,本研究综合考虑了多方面因素并对其进行了系统的教育场景适配性改造,主要包括:①工具类平台评价研究。参考此方面研究成果中相对成熟的评价框架,重点关注其中的功能性、用户体验等维度。②现行的数字人技术标准。例如,国内外多个标准中提及的形象、语音等指标,被转化为此体系中数字人特性维度下的具体指标,并强调教学语境下的表达要求,如将通用描述“语音语调”调整为“教学语言规范性”。③教育场景的核心诉求。所有指标的设计均服务于提升教学效果这一核心目标,将抽象的教学需求转化为可测量、可比较的具体指标。

为强化初步构建的数字人视频制作平台评测指标体系的科学性,本研究遵循客观原则,剔除行业标准中涉及主观感知的指标,以有效避免传统评价中主观偏差可能产生的负面影响,从而提升结果的可信度。例如,平台支持维度完全依赖客观记录,如渲染时长、系统异常频次等;而数字人特性维度剔除了用户情感偏好、音色偏好等主观维度。

3 评测指标体系的确定

为了进一步确保初步构建的数字人视频制作平台测评指标体系的科学性、客观性与实践指导价值,本研究采用德尔菲法,邀请数字人研究领域的10位专家对此体系进行了两轮专家意见征询,其中,有5位专家是来自高校和科研机构的数字人研究人员,他们从理论研究的视角提出修订意见;另有5位专家是来自科技公司的数字人开发人员,他们从数字人开发与维护的视角提出修订意见。

在两轮专家意见征询中,第一轮收回有效问卷10份,主要对一级指标进行修订;第二轮收回的有效问卷数量及其人员信息与第一轮基本一致,主要对二级指标进行修订。修订意见主要有:一级指标“功能性”更名为“功能完备性”,一级指标“形象”下新设“学科适配性”“学段适配性”两个二级指标等。之后,本研究采用专家权威系数Cr来评估专家意见的可靠性。经计算,本研究的Cr=0.94>0.7,说明专家意见较为可信。因此,本研究根据专家意见,对初步构建的数字人视频制作平台评测指标体系进行修订,确定了最终版的数字人视频制作平台评测指标体系(下文简称“评测指标体系”),如表1所示。

1 数字人视频制作平台评测指标体系

具体如何评测?

1 样本遴选

当前数字人视频制作平台数量众多且功能各异,这就需要遴选出能够反映行业现状与教育应用潜力的代表性平台来展开研究。依据教育场景对数字人技术的实际需求,本研究制定了以下平台遴选标准:①考察平台的行业权威性,即平台所属企业需在数字人领域具有公认的影响力且有志于服务教育行业,具体体现为平台需入选《中国数字人发展报告(2024)》推荐案例库、平台所属企业曾参与中国教育技术协会主办的官方行业活动(如“教育数字人大赛”);②强调功能的全面性,即平台需提供2D、3D数字人技术形态,同时支持卡通人、仿真人、真人分身等典型角色类型1,以满足差异化教学场景的需求;③限定教育的可用性,即排除仅面向政府或企业客户的专属平台,确保平台向个人用户开放基础功能,以保障教学实际操作的可行性。按照此标准对数字人视频制作平台进行遴选后,研究者以教师身份完成被选平台的注册与功能测试,重点考察了平台的系统稳定性、教学适配性和持续服务能力,最终将剪映、腾讯智影、讯飞智作等17个代表性平台作为样本展开研究。

2 评测实施

本研究依托数字人视频制作平台评测指标体系开展评测工作,核心环节包括样本准备、数据采集与数据预处理,以获得客观的平台数据,从而为后续评测分析提供可靠的实证依据。具体的评测实施过程如下:

1)样本准备

本环节重在实现变量控制,以确保输出结果的可比性。为此,本研究编制了一条约50字的标准化口播文稿作为文本输入源,并在17个代表性平台上统一采用默认的数字人形象与基础音色配置,同时启用平台预设的字幕生成功能。为最大限度地消除操作水平差异可能带来的干扰,本研究在开始实验之前先进行了三轮标准化操作演练,通过反复模拟平台的交互流程以统一研究者的操作熟练度。实验全程采用录屏软件同步记录操作路径与系统响应时间,最终获得17组完整的操作过程视频及其对应的成品视频样本2

2)数据采集

本环节严格依据评测指标体系的二级指标进行数据采集:①平台支持维度的数据直接来源于操作过程中研究者的观测记录,依据本维度的12个二级指标采集相关数据。②数字人特性维度的数据主要用于平台输出视频的质量评价。为保障客观性,本研究采用双盲评审机制,由教育视频制作专家和本研究团队采用李克特五点量表,依据本维度的24个二级指标独立对17个代表性平台进行评分。通过计算两组独立评分的算术均值,形成各平台在本维度的原始得分矩阵。

3)数据预处理

本环节是确保指标可比性与分析科学性的关键一环,主要操作包括:

①初始数据归一化,即对采集的各维度二级指标数据进行归一化处理。其中,平台支持维度的二级指标数据需先处理指标的异质性与极端值问题,如硅语、必剪Studio因提供无限期免费试用服务而导致数据趋近无穷大,无法进行归一化处理,故将其试用时长统一用样本库中的最高值——腾讯云智能数智人的60分钟免费试用时长来替换;海马云、硅语、趣丸趣影因采用虚拟货币计费模式而导致其实际年支出远超其他平台的年费上限,故其年费统一用样本库中的最高值——百度智能云曦灵的7999元年费来替换;必剪Studio平台因其免费使用而赋值为样本库中的最低值——魔珐有言的365元年费。完成极端值修正后,本研究采用TOPSIS算法对正向、负向指标值进行归一化处理。其中,“易用性”将操作时长作为评价依据、“收费标准”用于反映成本,两者均属于数值越小、相应表现越好的反向指标,因此本研究对这两类指标均进行逆向归一化处理,以确保所有指标的评价指向一致(即数值越大,代表相应表现越好)。数字人特性维度的二级指标数据直接以李克特五点量表理论上的最大值5为基准进行线性缩放,以实现归一化处理。

②一级数据汇总,即将归一化后的所有二级指标数据按其所属的一级指标分类进行汇总,得到一级数据,为后续的权重计算和综合得分整合奠定数据基础。

③确定一级数据权重,即采用熵权法,分别确定数字人特维度、平台支持维度各一级数据的权重。熵权法是依据指标数据的离散程度对信息熵的贡献度来确定权重,可以有效规避主观偏差。

④确定维度数据权重,考虑到研究的主要目的是评测平台的教学应用效能,故本研究采用平台支持维度占60%的权重、数字人特性维度占40%的权重来分配最终的综合得分。这一权重分配的依据主要是既需呼应教育数字化转型中技术工具优先的实践导向,又要兼顾数字人作为教学媒介的核心属性,但是数字人特性作为平台功能的输出表现,其评测需服务于平台技术能力的整体评估,这就需要凸显平台支持维度的主导作用,因此平台支持维度的权重占比稍高于数字人特性维度。

3 评测分析

1)综合评测分析

通过加权求和公式将维度数据进行整合,本研究得到17个代表性平台的综合得分(统一保留3位小数),如表2所示。进一步计算,可得各平台综合得分的均值约为0.535,标准差约为0.082,变异系数约为15.4%。这些数据表明,当前数字人视频制作平台的综合能力离散程度较高,各平台的功能差异显著。

2 17个代表性平台的综合得分

为进一步揭示各平台的综合表现差异,本研究以数字人特性得分为横轴、平台支持得分为纵轴构建二维坐标系,并以两者的均值点为原点,将17个代表性平台划分为四个特征象限,得到17个代表性平台的分布散点图,如图1所示。图1显示,17个代表性平台呈分散分布状态,与前述高变异系数结论相互印证。这种分布状态表明,当前数字人视频制作平台众多且各具特色,为用户提供了广阔的选择空间,用户选择的自由度很高;同时,第一象限与第二象限的聚集态势强于第三、四象限,说明平台支持维度的表现整体优于数字人特性维度,反映出开发者相对更注重技术工具的功能完善,但数字人特性作为教学媒介的核心属性,仍需将其作为未来优化的重点内容。


1 17个代表性平台的分布散点图

2)平台支持评测分析

平台支持维度同样通过描述性统计进行评测分析,结果如表3所示。表3显示,经济性指标的标准差(0.267)、变异系数(57.7%)均为各指标中的最高值,但平均值仅为0.463,表明不同平台的定价策略差异悬殊。功能完备性指标的变异系数达50.4%,反映出平台功能的覆盖面差异显著。例如,必剪Studio通过开源模式实现了低成本应用,但其性能效率指标得分仅为0.540,尤其是视频合成效率远落后于商汤如影、海马云等高价平台。这种普遍存在的成本-性能悖论,成为平台实现教育适配亟待解决的关键问题。

3 平台支持维度的描述性统计

针对平台支持的聚类分析结果进一步验证了上述成本-性能悖论的普遍存在:①类别1平台(包括闪剪、腾讯智影等)的教育兼容性、便捷性俱佳,但其经济性指标得分的最小值为0.042,是各指标中的最高值,说明其年费成本显著高于行业均值。此类平台虽然支持跨设备操作,但是高昂的订阅费用直接提高了教师群体的技术准入门槛。②类别2平台(包含必剪Studio、腾讯云智能数智人)的经济性指标表现突出,但性能效率指标与便捷性指标呈负相关,表明此类平台为降低操作复杂度而牺牲了底层渲染效能。这种“高成本-高性能”与“低成本-低性能”的怪圈,使平台的教育应用陷入了两难选择:选用高性能平台需承担高昂的采购成本,但选用低成本平台又难以保障大规模在线教学的技术稳定性。由此可见,数字人视频制作平台的技术研发逻辑仍以适应商业化通用场景为导向,与教育领域对工具轻量化、性能高稳定性和服务可持续的核心诉求存在错位。从教育公平的角度看,此技术研发逻辑可能会加剧区域之间教育资源分配的失衡,尤其是会阻碍数字人技术向农村或经济欠发达地区普及,从而使数字鸿沟继续扩大。

3)数字人特性评测分析

为细化解析数据分布的规律,本研究通过描述性统计量化数字人特性维度各指标的中心趋势与离散特征,结果如表4所示。表4显示,在数字人特性维度中,语音指标的表现最为突出(平均值为0.786,标准差为0.126),表明17个代表性平台在语音合成技术上的表现较为一致且整体水平较高。形象指标的表现最差(平均值仅为0.450,显著低于其他指标,且变异系数高达37.1%),由于评测采用各平台默认的数字人形象,故此结果说明多数平台的预设形象未针对教育场景进行专项设计。例如,魔珐有言的3D卡通形象虽然符合娱乐场景审美,但其夸张化外观与教师职业所需的庄重感存在冲突,导致课堂的严肃性受损。字幕指标的平均值虽然较高(0.674),但标准差为各指标中的最高值(0.241),表明不同平台的字幕质量两极分化明显,且部分平台存在严重缺陷,直接影响知识的严谨传递。

4 数字人特性维度的描述性统计

针对数字人特性的聚类分析进一步印证了上述结果:①第一类平台(包括奇妙元、趣丸趣影等)在字幕指标上表现中等,但动画、形象两个指标的表现较差。此类平台的教育兼容性较好且操作便捷,但虚拟形象的表现力不足,难以满足教学场景的严肃性要求。②第二类平台(包括百度智能云曦灵、必剪Studio)的语音指标均值高达0.96,但因字幕功能缺失或技术迭代导致字幕表现严重滞后。此类平台凭借语音合成技术的高成熟度提升了教学内容的表达效果,但字幕表现不足可能影响知识的精确传递。③第三类平台(包括硅语、商汤如影等)在形象、字幕两个指标上的表现优异,而动画、语音两个指标的表现处于中上水平。此类平台在核心指标上无明显短板,尤其是在虚拟形象的职业适配性和字幕规范性方面表现突出,更契合教育场景对知识传递严谨性的要求。综合来看,当前主流平台在数字人特性上呈现两极分化的趋势,仅少数平台能够兼顾教学严谨性与技术稳定性。相比之下,语音技术已较为成熟,而形象适配性与字幕规范性仍是亟待优化的重要内容。

结论与建议

1 研究结论

本研究通过对17个代表性数字人视频制作平台的系统评测,发现:当前数字人视频制作平台呈现出显著的多样化特征,各平台的功能差异显著,为用户提供了广阔的选择空间;平台支持维度的表现整体优于数字人特性维度,反映出开发者更加注重技术工具的功能完善。具体来说,在数字人特性维度,形象、字幕两个指标成为平台进行教育应用的关键瓶颈——多数平台的预设形象未能满足教学场景的严肃性要求,字幕质量两极分化明显,且部分平台存在严重缺陷,直接影响知识的严谨传递;而在平台支持维度,经济性指标与性能效率指标之间矛盾突出,表现为低成本平台普遍面临技术稳定性不足的问题,而高性能平台因采购成本高昂将阻碍教育的普惠化进程,由此使平台的教育应用陷入了两难选择,也深刻折射出了技术研发逻辑与教育核心诉求之间的错位。

2 数字人教育应用的优化建议

基于上述研究结论,结合当前数字人教育应用的现状,本研究针对不同责任主体,从技术攻关、分层应用、生态建设三个角度提出数字人教育应用的优化建议。

1)强化教育场景技术攻关

针对当前数字人视频制作平台普遍存在的技术研发逻辑商业化导向与教育场景对工具轻量化、性能高稳定性和服务可持续需求之间的错位问题,技术研发者可以尝试调整研发策略:①在不违背教育公平原则的前提下,积极探索教育这一垂直领域的特色盈利模式,为持续的技术优化提供必要的资源保障与核心驱动力。②可将研发资源重点投向本研究结论所揭示的形象、字幕这两个薄弱环节,包括强化数字人形象的教育适配性,优化其教师职业形象的自然度与学科、学段适配性,避免娱乐化设计对教学严肃性的干扰;集中攻关字幕生成的准确性与规范性,通过引入更先进的自然语言处理、深度学习等技术,提升字幕在知识传递中的精确度与可靠性。

此外,技术研发者需聚焦多模态协同优化,重点提高语音驱动的实时口型匹配算法精度,并引入情感计算模型来提升语音、语调的自然性与语义适配能力。相关技术实践表明,通过深度学习与多模态融合可以有效提升协同效率,如苏文吉等[20]基于Omniverse Audio2Face工具开发的语音驱动三维面部动画生成技术,显著提升了唇音准确度与情绪匹配度。同时,技术研发者需致力于推动动画引擎与教学场景的深度耦合,如通过知识点语义解析实现手势动作的智能生成,从而强化数字人在实验演示、跨学科教学等具身化交互场景中的表现力;张婷等[21]关于教育数字人视线交互特征的研究表明,数字人的视线一致性、视线自然度、视线反馈对用户使用意愿具有显著影响,因此也可通过优化反馈视线来有效提升学习者对关键知识点的注意力。

2)基于现实条件分层应用

教育主体的资源需求呈现出显著的异质性特征,这就需要建立基于技术适配度与经济可行性的分层应用体系。这一分层逻辑源于教育场景中不同主体在资源需求强度、数字素养水平和成本预算上的多维差异:一方面,高校教师与基础教育教师在微课制作的复杂度上存在需求分层,前者常需结合跨学科的知识点设计多模态交互内容,后者则更侧重基础教学内容的轻量化呈现;另一方面,区域间教育资源的分配不均衡导致技术应用成本承受能力差异显著,如经济发达地区的学校可承担高性能平台的采购费用,而大部分农村学校需优先考虑免费或低成本的轻量级工具。基于此,分层应用体系应遵循“需求导向、技术适配、成本可控”的原则,提供差异化的资源供给路径。

对于不同类型的学校来说,建议基于现实的技术水平和预算条件进行分层应用:①数字技术水平较高且经费相对充裕的高校可选用头部平台用于高精度微课制作,使其多模态编辑功能满足复杂教学资源开发的需求。例如,浙江农林大学基于天目云智慧教学平台开发了数字教师精品课体系,可依托大模型与知识图谱技术实现课程知识点的智能提取,通过自然语言处理技术实现数字人微课闭环教学,其AI学情分析模块还可为教学优化提供多项可视化支撑。②数字技术水平一般且经费较为有限的中小学校可依托垂直平台,以轻量化操作为核心优势,快速生成基础教学片段。例如,徐州市大龙湖小学借助文小言APP打造了“AI苏轼”教学数字人,可通过轻量化生产流水线融合地方文化基因,将诗词讲解转化为沉浸式文化体验,且其低成本、高适配性的应用模式成功将数字人技术转化为“行走的校本教材”。

对于一线教师而言,建议先明确数字人视频的辅助定位,优先利用已开发的标准化资源库进行学科重难点解析与虚拟实验演示,同时建立师生双向反馈机制以优化资源设计。值得注意的是,如果一线教师在授课过程中长时间使用数字人,易引发学生的视觉疲劳与情感疏离。对此,建议采用“真人教师讲授+数字人片段嵌入”的混合教学模式,使一线教师在提升知识传递效率的同时守护教育的人文温度。


3)多方协同优化生态建设

基于《中国数字人发展报告(2024)》提出的分类框架[22],建议突破媒介数字人的单一应用范式,着力打造服务数字人与行业数字人的协同应用生态:①服务数字人可作为个性化学习代理,通过接入学科知识图谱与认知诊断模型,实现作业智能批改、学情动态分析等功能的深度拓展,其关键是提升数字人的多模态指令理解能力,使数字人能够准确解析输入的文本、语音、手势等所表达的含义。②行业数字人需聚焦产教融合场景,如依托工业数字孪生技术打造虚拟实训工坊,模拟精密仪器操作流程与故障排查情境,使学生通过具身交互能熟练掌握实操技能。例如,华东师范大学开展了“大模型数字人赋能师范生实践教学能力提升”项目[23],不仅研发了面向师范生实践教学能力培养的教育元空间,还利用大模型开发了具有多种性格和认知特点的数字人角色,用于模拟真实的学生行为和复杂的课堂交互场景,可为学生提供一个真实多元、开放灵活、安全可控的融合实训空间。

值得注意的是,数字人教育应用的可持续发展需要多方协同共治:政府层面应加大政策的引导和支持力度,通过专项资金扶持与示范项目推广,加速教育数字人从工具性赋能向生态化重构的范式转型;学术界应深化数字人教育应用研究,尤其是要在具身认知、分布式学习等方面探索人机协同的教学模式创新;企业界应开放技术接口与教育资源库,通过产学研合作,降低数字人资源创作与共享的门槛;行业组织应牵头制定数字人教学资源质量标准,明确动画帧率、语音清晰度等核心参数阈值,并建立动态评测机制驱动技术迭代。当前,数字人的教育应用正从媒介传播向服务赋能与行业融合演进。未来需以技术突破为引擎,以标准建设为保障,以生态协同为路径,逐步构建覆盖“教学-服务-产业”的全链条数字人教育体系,从而为教育数字化转型提供可持续动能。(文章来源:周小旺,卢雨婷,魏顺平,等.面向教育应用的数字人视频制作平台评测——基于17个代表性平台的评测分析[J].现代教育技术,2025,(12):34-44.

参考文献

[1]陈卫东,郑巧芸,褚乐阳,等.智情双驱:数字人的教育价值与应用研究[J].远程教育杂志,2023,(3):42-54.

[2][22]中国互联网协会.中国数字人发展报告(2024)[R].北京:中国互联网协会,2024:30-31.

[3]娄方园,齐梦娜,王竹新,等.元宇宙场域下的教育数字人及其应用[J].图书馆论坛,2023,(3):101-108.

[4]杨晓哲,王若昕.困局与破局:教育数字化转型的下一步[J].华东师范大学学报(教育科学版),2023,(3):82-90.

[5][9]朱奕帆,许鑫,张昫频.勘破我相:“数字人”测评模型构建与应用[J].图书馆论坛,2023,(2):132-140.

[6]刘颖,李济廷,柴瑞坤,等.语音驱动说话数字人视频生成方法综述[J].电子科技大学学报,2024,(6):911-921.

[7]张紫琼,吴玉婵,叶强,等.数字人营销:理论框架、研究进展与未来方向[J].中国管理科学,2025,(1):259-272.

[8]王袁欣,韩卓言.仿真度强化互动体验:虚拟新闻主播仿真度与用户接受意愿关系研究[J].北京邮电大学学报(社会科学版),2023,(6):11-19、88.

[10]王春辉.数字人进场的语言生活[J].外语学刊,2024,(6):41-50.

[11]禹建湘.构建网络文学网站社会效益评价体系——基于25家网站数据分析[J].中国文学批评,2021,(3):141-149、160.

[12]刘羽歆,王玫,李佳.基于ANP和TOPSIS优化方法的专业性购物网站评价研究[J].包装工程,2019,(2):208-214.

[13]中华人民共和国工业和信息化部.YD/T 4393.1-2023 虚拟数字人指标要求和评估方法第1部分:参考框架[S].北京:人民邮电出版社,2023:2-7.

[14]ITU-T. ITU-T F. 748.15 Framework and metrics for digital human application systems[S]. Geneva: International Telecommunication Union, 2022:3-8.

[15]ITU-T. ITU-T F. 748.14 Requirements and evaluation methods of non-interactive 2D real-person digital human application systems[S]. Geneva: International Telecommunication Union, 2022:2-8.

[16]李青,刘勇.教育虚拟数字人标准体系设计及其路径规划[J].现代教育技术,2024,(7):70-80.

[17]中国国家标准化管理委员会.GB/T 25000.51-2016 系统与软件工程系统与软件质量要求和评价(SQuaRE)第51部分:就绪可用软件产品(RUSP)的质量要求和测试细则[S].北京:中国标准出版社,2016:9-13.

[18]国家广播电视总局.GY/T359-2022 广播电视和网络视听节目对外译制规范[S].北京:国家广播电视总局,2022:5-6.

[19]刘文,李琳琳,付光远.基于IPO模型的作战指挥软件界面可用性评价指标体系研究[J].中国电子科学研究院学报,2021,(10):1060-1066.

[20]苏文吉,鲁梦河.基于Omniverse Audio2Face的语音驱动数字人三维面部动画生成技术应用研究[J].现代电影技术,2025,(2):45-52.

[21]张婷,赖建都,管幸生.教育虚拟数字人视线交互特征对用户使用意愿的影响[J].现代教育技术,2025,(5):101-110.

[23]华东师范大学计算机科学与技术学院.“大模型数字人赋能师范生实践教学能力提升”入选“人工智能+高等教育”应用场景典型案例[OL]. http://www.cs.ecnu.edu.cn/03/74/c24535a656244/pagem.htm>