您好!欢迎进入中国教育装备行业协会官网。
装备研究
当前位置:首页 - 装备研究 - 研究成果 - 正文

人工智能在中考理化生实验操作考试中的应用浅析

来源:《中国教育装备行业蓝皮书(2021版)》发布日期:2022-01-21浏览人数:194

  黄进 刘小林 李美英

  2017年7月,国务院印发《新一代人工智能发展规划》,指出人工智能已经成为国际竞争的新焦点、经济发展的新引擎、社会建设的新机遇、不确定性发展的新挑战,明确提出人工智能发展按2020年、2025年、2030年分三步走的战略步骤及其战略目标。

  在人工智能时代发展的大背景下,人工智能教育新政层出不穷。2018年4月,教育部发布《教育信息化2.0行动计划》,强调充分利用人工智能等新技术,构建全方位、全过程、全天候的教育支撑体系,助力教育教学、管理和服务的改革发展,提高教育管理信息化水平,优化教育治理能力,推动人工智能在教学、管理等方面的全流程应用。2019年11月,《教育部关于加强和改进中小学实验教学的意见》(教基〔2019〕16号)发布,明确在2023年前要将实验操作纳入初中学业水平考试,考试成绩纳入高中阶段学校招生录取依据;在普通高中学业水平考试中,有条件的地区可将理化生实验操作纳入省级统一考试。2021年5月,中国教育装备行业协会发布中国教育装备行业团体标准《实验操作考评系统技术规范》(T/JYBZ 013—2021),明确将AI评分纳入实验操作考评技术体系,将AI评分的应用历程按探索期、试用期和实践期三阶段稳步推进。这些都为人工智能技术在理化生实验操作考试中的应用提供了政策依据和保障。

  本文将分析中考理化生实验操作考试的实施情况和面临问题,探讨人工智能应用于中考理化生实验操作考试的解决思路、难点痛点和关键技术,为实现基于人工智能的中考理化生实验操作考试、促进教育教学智慧化改革探索解决思路和实现路径。

  一、中考理化生实验操作考试

  (一)实施情况

  2019年11月,教育部发布《关于加强和改进中小学实验教学的意见》在此背景下,全国各省市陆续出台政策文件,大力推动中考理化生实验操作考试工作的组织实施。据不完全统计,2021年全国已有近20个省份或其地市出台了理化生实验操作考试实施细则,实施情况如表1所示,可以看出,有些是全省统一标准、统一组织实施,有些是省级出指导意见、地市组织实施;有些是理化生三科成绩分别计分,有些是成绩合并再处理后计分;有些是理化生三科择优计分,有些是不满足最低要求分数后倒扣分;大部分地市理化生三科分别按10分计分,单科计分最低是3分,最高达30分等。实施细则的多样性体现了各省市对理化生实验操作考试的高度重视和精心设计。

  表1 2021年全国部分省市中考理化生实验操作考试实施情况统计表

  (二)问题分析

  在全国各地中考理化生实验操作考试持续全面铺开的过程中,考评模式逐渐成为全社会关注的焦点。由于实验操作考试与传统笔试考试在评价方式、评价流程、评价内容、评价标准等方面截然不同,多年来既定的传统笔试的考评模式已经不能满足素质教育背景下实验操作考试透明、高效的基本要求,主要体现在以下四个方面。

  (1)监考师资需求量大。实验操作考试主要以考试过程为依据,一般采用1位监考教师同时监考2位考生的模式,监考教师与考生比为1∶2。此外,实验操作考试对监考教师的专业素质要求很高,一般不宜由非专业教师担任监考人员。这些因素都导致施行实验操作考试时会出现监考师资需求量大,难以均衡调配的问题。

  (2)操作过程复现性难。实验操作考试以操作过程为对象、以现场评价为手段,难以实现离线阅卷和成绩审核;操作过程一般没有记录,实验结果难以复现。目前,正在陆续推出以电子视频为载体的方式留存操作过程并复现实验结果,以支持成绩评审、异议复核等保障措施,但实现基于评分标准的精准智能视频采集、分割、存储、查询、分析、检测和识别仍是亟待解决的问题。

  (3)评价结果主观性强。实验操作考试重在评价学生操作细节的正确性和操作流程的规范性,具有过程性、主观性、随机性等特点,评价结果受考官主观因素影响较大,难以确保客观公正。

  (4)数据基座创新度高。实验操作考试的基础数据除包含少量考试报告、考务管理等纸质数据外,主要包含业务处理、统计分析和大量操作过程、实验结果等数字数据,数字数据的类型以图片、声音、视频等非结构化数据为主,形成了真正意义上的海量教育基础大数据,是教育信息化和智慧化的数据基座,其构建和应用涉及人工智能、大数据、云计算等新一代关键核心技术的攻关和突破,对创新能力要求极高,不仅是系统研发和工程应用问题,更是科学研究和技术创新问题。

  二、人工智能应用于实验操作考试

  (一)解决思路

  面对实验操作考试在评价方式、评价流程、评价内容、评价标准等方面存在的问题,全国各省市相继出台中考理化生实验操作考试的指导意见,不约而同地提出采用创新技术手段确保实验操作考试高效组织和客观评价的重要性,人工智能成为解决实验操作考试痛点、破局实验教学改革困境的创新路径。

  人工智能(Artificial Intelligence,AI)简单来说就是研究具有人类智能的人工系统的学科。具体来说,AI就是采用人工系统模拟人类行为过程和思维过程的学科。行为过程包括走、跑、跳等运动行为,视觉、听觉、味觉、嗅觉、触觉等感官行为,喜、怒、哀、乐等情绪行为,聚会、联欢、结伴等社群行为等。思维过程包括学习、总结、思考、规划、推理等。人类行为学和人类思维学本身就是两门学科,内涵非常丰富,这也深刻反映出AI技术应用的复杂性和挑战性。

  采用AI解决实验操作考评问题的基本思路是通过安装在每位考生实验操作区域的摄像头,实时采集操作过程的视频数据,基于深度学习和机器视觉对视频数据进行处理和分析,实现操作过程的行为解译,进而评价行为步骤细节与评分标准要求的符合度和偏离度,并给出定量评价结果,同时现场出具考评报告,实现实验操作考试评价的准确性、实时性和智能性。这一过程需解决以下三个关键问题。

  (1)摄像头的配置。摄像头必须能够捕捉到考生实验操作过程中的每一个操作细节,有些需要俯视拍摄,有些需要侧视拍摄,有些需要水平拍摄,摄像头的位置、角度、数量等直接决定了拍摄视频的质量,另外,摄像头的帧率、分辨率、工作模式等也是视频数据有效性的重要因素。

  (2)视频数据的存贮。视频数据是实验操作考试的核心数据,具有数据量大、并发性高、安全性强等特点,需采用分布式存储以确保数据安全。按照中国教育装备行业协会团体标准《实验操作考评系统技术规范》(T/JYBZ 013—2021)的要求,实验操作考评系统采用三级物理架构,即考点级、地市级和省级,考点负责考务实施,地市负责组织管理,省级负责协调指导。考试评分可以在考点分散进行,也可以由地市统一组织开展。视频数据的存储位置可以是考生终端、考点服务器或地市服务器,存储方式可以是临时存储、周期存储或永久存储,传输方式可以是实时传输、定时传输或离线传输,需要支持数据灾备、断点续存、人工传输等功能。

  (3)算法模型的部署。算法模型的部署与视频数据的存储方式相关,直接决定实验操作考评系统的智算性能。算法可以部署在考生终端,采用端计算实现智能评分的实时性,此时需要配置带算力芯片的摄像头;算法模型可以部署在考点的边缘设备上,采用边缘计算实现智能评分的高效性,支持深度学习模型的动态训练和更新;算法模型可以部署在地市或省级的云环境上,采用云计算实现智能评分的规模性、可靠性和安全性。

  (二)难点痛点

  采用AI解决实验操作考评问题需要克服以下难点痛点。

  (1)评分标准不一。相同实验的评分标准,各地市存在差异,甚至较大差异,几乎没有两个地市的评分标准是完全相同的,要么评分项数量不一致,要么评分项考点不一致,要么考点分值不一致,等等。AI算法需实现基于不同地市、不同评分标准的通用性和可扩展性。

  (2)实验数量较多。据不完全统计,中学物理、化学、生物实验总共有200多个,其中比较重要的有50个左右,例如,测量小灯泡的电功率、高锰酸钾固体制取氧气、制作番茄果肉细胞临时装片等。AI算法需具有针对不同实验的普适性。

  (3)仪器类型多样。据不完全统计,中学物理、化学、生物实验涉及仪器1 000余种,如电流表、电压表、滑动变阻器、试管、烧杯、漏斗、显微镜、放大镜、玻片等。AI算法需实现针对不同仪器类型的准确识别。

  (4)仪器型号繁多。对于同一种仪器类型,不同生产厂家的产品形态几乎不会完全相同;即使是同一生产厂家,同一类型、不同型号仪器的产品形态绝大部分也不会相同。例如,物理实验中常用的电流表,按测量电流量分有微安表、毫安表、安培表,按工作原理分有磁电式、电磁式、电子数字式,按工作方式分有竖式、平式等。

  为了实现仪器的充分利旧,AI算法需要面向不同类型、不同型号的海量产品实现仪器的精准检测或测数的精准识别,需要建立海量样本库,工作量巨大,且很难保证样本库的完备性。

  (5)实验步骤严谨。中学物理、化学、生物实验的实验步骤要求严谨,步骤与步骤之间大部分具有强时序性和强关联性,操作不当轻则导致实验失败,重则可能导致人身伤害。例如,高锰酸钾固体制取氧气实验,导管移出水面操作和熄灭酒精灯操作的时序性就非常重要。需全面考虑AI算法针对不同实验步骤及其步骤组合的识别完备性和准确性。

  (6)操作细节精准。中学物理、化学、生物实验的操作细节要求精准,有些细节的精度要求达到毫米级。例如,使用量筒进行液体读数时,要求液体凹液面与量筒刻度线相切;使用漏斗进行液体引流时,要求玻璃棒靠触三层滤纸引流等。AI算法需要精准识别微观操作,如液面相切与否、滤纸厚薄是否正确等操作。

  (7)操作主观性强。中学物理、化学、生物实验的操作步骤存在较强的主观性。为了达到相同的实验目标,不同学生可能有不同的操作方法。例如,在探究电阻上的电流跟两端电压的关系实验中,电流表、电压表、定阻电阻、滑动变阻器、电池盒、开关等仪器的连接顺序存在多种可能组合,需要依据实验操作的灵活性实现AI算法针对不同实验仪器及其关联操作组合的识别完备性。

  (三)关键技术

  采用AI解决实验操作考评问题的核心是实现基于深度学习和机器视觉的实验操作过程行为解译,技术思路是通过对实验仪器、操作动作等样本图片的收集和处理,构建实验样本库;然后基于深度学习模型提取样本特征,构建样本特征库;随后面向实验操作过程视频数据,采用机器视觉技术实现仪器、动作及其关联行为的对象分割、目标检测、运动跟踪和行为识别,同时应用支持GPU集群和云计算环境的深度学习并行算法,最终实现操作过程的行为解译。主要包括以下关键技术。

  (1)实验样本库构建。面对实验操作考试存在实验数量较多、仪器类型多样、仪器型号繁多等问题,构建尽量完备的实验样本库是实现行为解译的基本前提。实验样本库由包含实验仪器及状态、操作动作及状态等的样本图片构成,可以来源于学校的现场采集,也可以来源于互联网搜索。样本除应包含真实实验仪器、操作动作等的正样本,还应包含相似(非真实)实验仪器、操作动作等的负样本。样本不足时应采用样本增广技术补充样本数量。样本标注除采用常用的人工标注方法外,还应研究和应用自动标注技术,以提高样本标注效率,减少工作量。实验样本库应尽量做到类型齐全、型号完备和覆盖全面。为尽量保证样本库的完备性,需要设计样本库动态更新机制。

  (2)样本特征库构建。样本特征库是基于实验样本库构建的、汇集各类样本特征的数据集合。样本特征库构建需要经过特征选型、特征提取、特征分析、特征选择、特征评估、特征优化等步骤,需要解决特征相关性分析及筛选、高低维特征空间的特征压缩、分类器设计及优化等问题。特征可以选择既有代表性特征,也可以设计自定义特征。自定义特征需要设计特征的信息粒及其粒化表示,设计适应深度学习模型的多层次粒化模型、粒化表示方法及特征表示方法。

  (3)深度学习模型。深度学习模型是构建样本特征库的关键技术。在研究面向实验操作大数据的深度学习模型的基础上,设计适应实验操作场景知识的有标签、无标签、多标签及其融合的数据训练方法,构建基于有监督、无监督、半监督学习的最优网络结构和训练模型,研究和设计模型参数优化方法和多目标优化函数,探索具有多模态、多任务处理能力的跨模态特征学习和跨模型集成学习方法。

  (4)机器视觉技术。机器视觉技术是实现实验操作过程行为解译的关键技术,包括对象分割、目标检测、运动跟踪、行为识别等。对象分割实现实验对象的图像分割,需要解决背景分离、遮挡区域建模、阴影、噪声消除等关键问题,需要研究和设计高效的语义分割和实例分割算法。目标检测实现检测目标的识别和定位,需要解决多尺度检测、关键点检测、包围框回归等关键问题,需要考虑基于深度学习的目标检测方法与经典目标检测方法的结合。运动跟踪实现操作动作等运动对象的轨迹检测和位置预测,需要解决运动对象的遮挡、形变、杂斑等关键问题,需要研究和设计基于多摄像头的多目标跟踪方法。行为识别实现操作动作的行为理解,受场景状况、行为对象、时空序列等因素影响很大,需要解决行为建模、行为分析、行为推理等关键问题,具有较大的复杂性和挑战性。

  (5)并行算法。实验操作考试数据是教育基础大数据,具有大数据的大量(Volume)、多样(Variety)、高速(Velocity)、价值(Value)、真实(Veracity)的典型特点,同时,深度学习模型严重依赖算力资源,因此,并行算法是实验操作考试数据智算的重要保障。需要针对GPU及其集群并行处理的机理和特点,分析和计算通信开销,配置和优化资源负载,协调和统筹资源调度;需要针对深度网络结构中多层次、多粒度信息融合的特点,解决多层次粒化知识转换、多粒度时空信息抽取、深度模型参数交换等关键问题,研究和设计支持同步和异步并行模式的深度学习并行处理方法及其优化策略;需要针对云计算环境下大数据处理的特点,设计和开发支持多模态、多任务大数据处理的新型深度学习并行处理关键技术;同时,需要开展大规模性能测试以确保算法的有效性。

  三、结语

  人工智能被誉为第四次工业革命的技术皇冠,政府、社会、产业、行业对AI的共同认知和发展意志推动着千行百业开始或准备开始走上AI发展之路。当前,AI在实验操作考试中的应用尚处于起步阶段,全国还没有完全采用AI进行正式考试的案例,走在创新应用前沿的上海、深圳等地仍采用教师评分作为主要考评手段,AI评分仅作为辅助手段在小范围内开展试点。随着国家的大力推动、行业的迫切需求和技术的迭代优化,相信在不久的将来,人工智能将会成为中考理化生实验操作考试的主要手段,考务工作将实现工作人员少、效率高、成本低的智慧考务新模式,考试工作将呈现出无人化、智能化、实时化的智慧考试新场景。人工智能将为促进素质教育发展、完善教育教学改革开创出一条技术创新引领的教育智慧发展之路。

  (作者单位:黄进,西南交通大学;刘小林,成都西交智汇大数据科技有限公司;李美英,广东天智实业有限公司)