人工智能时代学生数据隐私保护的动因与策略
侯浩翔
(华东师范大学 教育学部,上海 200062)
摘要:人工智能时代的到来在为教育变革提供诸多机遇的同时,也对学生数据隐私保护产生了新的威胁。文章从学生数据隐私的理解和相关研究入手,对学生隐私保护的动因进行了分析,提出学生数据隐私面临着智能技术与数据分析僭越隐私边界、互联网平台垄断风险骤增、传统“知情同意”数据保护架构不再适应等困境。随后,文章总结欧美国家的应对策略,具体包括设计隐私权及限制识别技术嵌入教育智能设备开发、社会组织协同设置教育行业自律条例、学生隐私制度建构辅以机构设立等。最后,文章提出学生数据隐私保护措施。文章的研究结论对于理清人工智能背景下学生数据隐私保护的潜在风险,并为我国建立系统可操作的学生隐私保护规制提供思路。
关键词:人工智能;大数据;学生隐私;法律保护
引言
人工智能汇聚了超级计算、大数据、脑科学、云计算等新兴技术与理论成果,成为新一代产业变革的核心技术。借助智能分析的语音识别、机器视觉和自然语言处理,人工智能能够实现教育信息的智能筛选与情景再现、系统识别应答模糊学习任务与神经网络模拟人脑运作机理,辅助教育教学决策,是促使智能学习和交互学习方式发生系统性变革的重要驱动。人工智能技术的关键体现在数据、算法的集成上,其中数据是智能学习分析与高性能计算过程的基础。在智能处理技术快速发展的背景下,隐私侵犯和数据泄露风险给学生带来严重威胁,尚且不论学生隐私数据“二次开发或利用”所造成的个人信息暴露,隐私信息贩卖招致的电信、网络诈骗已足以酿造社会悲剧。智能技术及迭代数据处理的无序使用、隐私保护制度的滞后、网络平台技术垄断倾向等问题日益凸显,使得人工智能背景下学生隐私保护问题亟待解决。
一 学生数据隐私的理解与相关研究
在智能处理技术渐进发展、海量数据激增的背景下,智能系统对学生用户的辨别功能逐步增强,个人信息隐私的安全边界愈加模糊。隐私可以简单地理解为个人不愿意被他人干涉与侵入,或者只能在有限范围内被分享的私密信息。结合智能技术、数据挖掘与学习分析技术的发展现状来看,学生数据隐私涉及在线学习过程中所遗留的数据信息,包括网络浏览痕迹、下载记录、所处地理位置等数据,这些数据经过智能化采集与分析处理之后,能够揭示学生个体的学习信息、行为偏好乃至人格特征,成为学生隐私安全的重要组成部分。
学生学习行为信息在智能分析技术的作用下,基本处于“半透明”状态,个人隐私保护成为政策制定和学术研究的关注热点。欧洲最早确立了“被遗忘权”的概念,并在2018年重新修订了极其严厉的《一般数据保护条例》(General Data Protection Regulation),重申在特定情况下,数据主体有权要求数据控制者擦除其个人隐私数据[1]。赵慧琼等[2]从技术角度出发,提出在数据收集、数据处理、数据应用各个阶段设置隐私保护框架,增强学习者数据使用的安全性。王正青[3]列举了美国教育隐私保护条例的立法和治理体系,包括隐私保护机构的成立及有效运作机制。在人工智能日益融入教育领域的背景下,有必要对发达国家较为完善的教育隐私保护体系进行梳理,找出符合我国国情的教育隐私保护法规条例、机构运作方式,为学生隐私保护提供借鉴。
(2)冷凝管中水流方向是“低进高出”,则③是进水口;冷凝管上连接的干燥管的作用有二:一是吸收逸出的Cl2、SO2,防止污染空气;二是防止空气中的水蒸气进入反应装置而使SOCl2水解。
二 建立学生数据隐私保护体系的动因
学生数据隐私保护体系的建构肇始于智能化设备及大数据分析技术的无序发展,技术的颠覆必然导致信息主体与信息控制者之间关系的失衡,信息主体在复杂技术面前“缄默不语”,互联网平台则相比以往拥有了更大的话语权和技术操控权,进而诱发传统的学生隐私保护架构的不适应。技术失序、关系失衡、制度失灵成为建构学生数据隐私保护体系的主要动因。
1 智能设备与数据系统追踪学生轨迹,技术应用僭越隐私规范
以数据和算法为技术支撑的人工智能,凭借其高性能计算系统、逻辑推理及自主决策能力,深度学习能够在较短时间内生成认知结果,使学习系统与学习者展开情境交互,并利用机器学习算法进行问题诊断、精准反馈。但区别于传统的机器学习,深度学习因其所具有的自主决策和自适应特征,甚至可能做出超乎学习者认知范畴的损害性行为。智能数据系统在“静默”中全方位收集学习者数据,在市场趋利模式的支配下侵犯用户隐私,进一步给教育用户造成精神压迫和财产损失。Piazza Technology是美国一家专门为师生提供免费协作式问答的网络公司,能够有效整合众多学习管理系统并提供多种移动终端服务,其用户遍布美国各大名校[4]。尽管获得了巨大的市场份额,该公司却没有提供明确的隐私保护声明,致使用户在不知情的情况下将个人信息泄露给公司的另一种在线产品,并把学习者的个人数据出售给招聘公司,招致师生的强烈反对,在积极公关并修改条款声明的基础上才挽回了损失。智能系统和数据分析技术的应用,必须以维护学习者的合法权益为前提,以法律法规和道德规范为设计准则。
2 学生隐私安全边界愈加模糊,智能网络平台信息垄断风险骤增
世界经济合作与发展组织最初提出设计隐私权(Privacy by Design)的技术手段,该技术与人工智能支持的教育设备隐私设计方式相契合。具体而言,在阐述学生隐私保护的前提下,总结出在教育产品设计之前,就应该有明确的隐私保护技术原理与程序,使隐私保护自动嵌入教育互联网产品架构和应用操作中,学生隐私保护应当成为商品设计的核心问题[7]。美国的大型教育互联网公司在设计产品的过程中,就将隐私保护的要求嵌入其中。另外一种是限制识别技术,即对互联网应用的数据访问和信息输出进行隐匿化的技术处理,使供应商不能根据学生网络痕迹和遗留数据判断出具体可识别的自然人。欧盟在《一般数据保护条例》(General Data Protection Regulation)中提出一系列数据保护的技术手段。就教育智能设备而言,在不采用附加信息的情况下,采用匿名化处理方式使学生数据不可归类为特定的个体;并且规定数据控制者应该采用适当的技术和组织措施,确保学生资料不会受到其他自然人的干预。
3 “知情同意”信息保护架构背离设计初衷,适时性监管形同虚设
2)废弃。由于现代化交通网络的建设,使得森林古道失去了原有的通行功能,植被生长茂盛,杂草丛生。另外有些森林古道虽未被植被所侵染,但鲜有人走,古道入口辨识度较低,其通行功能也大不如前。
本文评价体系的因子及其权重取值是通过专业词汇词频占比计算得出,专业词汇词频的高低影响到指标的权重值,数据具有一定的客观性。这种方法得出的数据较客观,能够验证以往评价因子取值的正确性,同时,也能发现一些随着时间发展热度逐渐提升的评价因子。
三 欧美应对智能环境下学生隐私侵犯的核心策略
在所有实验组中,除2.5 mmol/L的D-Leu组的生物膜总生物量与阴性对照组相比无统计学差异(P>0.05)外,其余各组的生物膜总生物量均明显低于阴性对照组(P<0.05)(图1)。
1 借助设计隐私权及限制识别技术,嵌入教育产品与软件开发
就智能网络平台控制者而言,教育用户的数据信息以聚合的存储特征分布于各大互联网公司的平台,如Coursera、Udacity、EdX等慕课学习网站,需要警惕的是这些集技术与资本优势的互联网企业更有可能实现数据信息垄断。由于个人数据信息的挖掘处理与关联性分析成为创造学习价值的重要形式,网络平台往往以限制用户转移通用数据格式或结构的途径,达到占有用户信息资源的目的。这些企业聚拢的学习者相关信息在深层次加工后,超出了最初的数据收集形态,用于无法预知的盈利需要乃至其它非法目的。Edmodo是一家为学校和教师提供交流、协作学习与课程辅导的教育技术公司。截止到2017年7月,Edmodo声称该公司在全球已有超过7800万用户,被PC Magazine列入“教师顶级应用”榜单[5]。同年5月,该平台内置的Double-click广告服务被发现能够智能跟踪用户数据流,包括浏览的网络页面、停留时间、IP地址与电子邮箱,这些信息经过排列组合足以识别用户个人的详细信息。由此可见,信息垄断不仅降低了数据共享的价值,造成数据壁垒与鸿沟,还严重削弱了学生对个人隐私及自身数据的控制权。
完善的制度供给是教育技术应用的基本保障,我们必须探究人工智能背景下学生隐私保护的适应性规制与规范要素。在传统的信息社会,“告知与许可”系统是确保信息拥有者自主决定隐私信息任谁处理、如何处理的有效规章。以欧盟《数据保护指令》为代表的“知情同意”架构(Notice-and-consent Framework),是指系统开发者在设计应用软件时,主动将隐私声明内嵌于应用系统之中,告知用户将要收集用户哪些数据、数据将用于何种目的,用户在此前提下决定是否授权个人信息[6]。但在智能技术的冲击下,该架构面临的问题日益凸显。首先表现在教育用户权利被剥夺,在多数情况下,用户不得不选择同意才可以使用相应软件,明显是架空了用户的选择权。如前所述,在多途径、全方位收集学生数据的教育网络生态环境中,用户对于个人数据是否被收集的情况并不知晓,勿论对数据被再次开发使用的监督。另外,“知情同意”的网络架构给学生带来沉重的时间负担,为了保证法律上的合法性,软件设计方通常列举出冗长晦涩的隐私声明,学生在节约时间成本的考量下,多数情况下忽略隐私声明的详细条文而直接点击同意,背离了“知情同意”架构的设计初衷。
隐私技术设计成为保护学生数据隐私的首要之举,辅助以社会组织、市场主体的自律机制,政府制度统筹、学生数据隐私机构设置,成为欧美等发达国家适应智能背景下学生数据隐私保护的核心策略。
2 社会组织协同设置教育行业自律条例,提出学生隐私保护“安全港”计划
被遗忘权源自“谷歌诉冈萨雷斯案”,欧盟法院根据《欧洲数据保护指令》,认定谷歌公司作为数据控制者,对公民发布的带有个人数据的信息负有法律责任,有义务对不适的、无关联的、过分的信息进行删除。与欧洲不同,美国出台的类似于被遗忘权法案局限于个别州。2013年,加利福尼亚州颁布了“橡皮擦法案”,特别提出为保护未成年人的正当权益,应当允许未成年人删除Facebook、Twitter等社交网站上的网络痕迹,避免未成年人在日后要面对这些信息被泄露时所遭受的困扰。《学生数字隐私和家长权利法》(Student Digital Privacy and Parents Rights Act)进一步明确了学生个人信息免受网站侵犯的具体条例[10],规定运营商需要在网站上公布收集学生数据的具体范围,并通过电话、邮件等方式,及时向学生父母告知使用数据的情况,给予父母修改学生信息的权力,保证学生不会受到网上历史搜索痕迹等不良记录的影响。
3 隐私制度供给辅以机构设立,细分学生数据保护法规条例
(1)“被遗忘权法案”与“橡皮擦法案”主导下的学生隐私制度
教育行业自律机制是在国家法律规制之外,由社会组织团体协同设置教育行业发展的自律条例,进而规范自身行为。统一的国家信息保护法律法规借助于强制手段维护公民隐私权益,但执行起来往往缺乏针对性和灵活性,过于严格的教育互联网信息保护立法可能会削弱人工智能技术的正常发展;教育行业自律机制则是在多方社会群体利益协商后,达成对学生信息保护的共识。在整合政策立法和行业自律规范的基础上,美国联邦贸易委员会提出学生数据隐私保护的安全港计划,“行业组织团体可以提出约束自身行为的规范准则,该准则经过委员会批准就可以称之为用户隐私保护的安全港,组织团体要在安全港规定范围内开展商业活动”[8]。萨米特公立学校集团(Summit Public Schools)联合了加利福尼亚和华盛顿等州的近100所学校,组成庞大的宪章管理和学校合作组织。该组织提供了清晰的学生数据收集清单,仿照学生数据隐私联盟(Student Data Privacy Consortium)的合同条框增加隐私补充协议(Data Privacy Addendum)[9]。协议要求供应商提高运营的透明度,包括Web托管、软件工程及其它服务设施,主动公开智能设备信息收集的透明度,规定学生个人信息只可用于教学目的,学生和家长可以随时要求学校删除他们的信息,平台也绝对不能以营利为目的出售学生数据,持续评估学校组织政策与运行方式,提高智能系统的安全性能。
欧盟在《一般数据保护条例》(General Data Protection Regulation)明确提出建立数据保护专员组成机构[11],指出数据保护专员应当具备专业的数据保护素养与法律知识,对履行本条例的数据控制者提供数据保护条款、监督事项及相关政策咨询;对于侵犯个人信息安全的违法行为进行及时调查,介入法律诉讼案件保证权力的正常实施。英国政府则成立了“未成年人网络安全委员会”(UK Council for Child Internet Safety,UKCCIS),负责未成年人网络安全政策的制定。美国非营利性组织“数据质量行动”(Data Quality Campaign),积极倡导各州学区、学校、运营商等部门建立数据隐私保护机构。联邦教育部于2011年建立首席隐私保护官(Chief Privacy Officer,CPO)制度,下属部门隐私技术援助中心(Privacy Technical Assistance Center)为各州提供学生隐私保护的数据安全、信息保密的技术手段及服务咨询,协助各级各类教育主管部门的人员分辨应用程序的保密程度,避免与存在侵犯学生隐私风险的供应商展开合作[12]。
(2)欧洲、美国分别设立数据隐私保护机构及专员制度
四 欧美设计学生数据隐私保护体系的启示
就我国学生数据隐私保护的现状而言,教育相关群体的数据隐私意识必须得到进一步提升,并且具体可操作的隐私保护规制、教育行业互联网自律机制、隐私保护技术及标准制定都应成为人工智能时代教育领域亟需执行的应变措施。
1 提升教育领域各主体伦理道德意识,以循因式思维替代直觉意念
制度伦理设计既包括保证公民正当权益实现的正式规则、程序与准则等制度安排,也包括为制度的正常运行所提供的道德辩护与伦理支援。根据Rawls[13]所提出的“正义是社会制度的首要价值”的观点,学生数据隐私保护制度伦理尤其需要关注制度本身的正当性、正义性。因此,人工智能背景下教育相关群体的隐私保护必须坚守伦理规则和道德底线,将价值标准和伦理规范嵌套在智能软件系统的设计之中,具体包括:①有必要在行政部门主导下并协同社会群体设立学生隐私数据使用的制度伦理,及时加强相关行政从业人员的数据伦理道德意识;智能互联网企业则需要培养鉴别学生隐私数据、公共数据和适合公开数据的认知能力。②学生数据与教育教学实践的演绎推理和归纳总结,将会在智能化设备的影响下发展为依托数据的溯因式思维模式。在智能技术操作门槛逐步提高的背景下,明确智能技术开发人员的行为规范和道德准则、构造相关人员的伦理道德多层次判断结构及人机协作的伦理框架、围绕学生数据加工处理中可能出现的危害加以风险评估、建立学生数据隐私事故问责和追溯制度显得尤为重要。
2 建立系统可操作的学生隐私保护规制,设置事前、事中、事后监督措施
目前,我国已出台一系列涉及学生隐私保护的法律法规,如总揽网络信息安全的《中华人民共和国网络安全法》、针对互联网APP规范管理的《移动互联网应用程序信息服务管理规定》,更有直接针对学生隐私保护的《未成年人保护法》和《未成年人网络保护条例》。法律条文虽多,但绝大多数缺乏可操作执行的具体细则,亟需制定相关的信息安全利用、组织机构设置与监督机制等法规制度。首先,我国应该依托教育数据智能共享平台,设立类似于美国联邦教育部的首席隐私保护官(CPO)制度或英国的未成年人网络安全委员会(UKCCIS)等机构,专权负责学生隐私保护政策的制定,遵循分层管理、授权使用的数据保护原则,整体优化横向和纵向的学生数据保护网络。其次,应当在学生隐私保护法规条例中设置事前、事中、事后的整体监督管理机制。事前监督是指在设计教学系统之前,智能互联网公司应当遵守政府机构制定的数据服务市场准入规则,包括学生线上数据收集类型、采集方式、使用意图、风险规避措施等,严格按照隐私条款协议设计产品;政府部门也可以积极发挥第三方认证组织的机动灵活特征,在对认证组织充分审查的前提下,赋予其教育科技类公司产品设计的权力,必要时向监管部门或教育行政部门备案,避免出现智能系统侵犯师生隐私的状况。事中监督是指要建立常态化的系统性风险评估机制,应当由政府监管部门对在线教育供应商的合理、合规性加以监测,设置日常监管备案制度,建立数据泄露防范措施和约束机制,加强人工智能技术团队的资格审定与定期培训。事后监督则指当智能设备出现侵犯师生等相关利益群体的问题时,政府部门需及时采取惩处措施,追究相关责任人是否存在暗箱操作、窃取学生隐私等违法行为。
按照国务院对地理国情监测工作总体部署和测绘地理信息事业转型发展需要,从2016年起地理国情信息获取进入常态化监测阶段。本文通过对在地理国情监测生产中频发性、关键性问题的分析,总结归纳了基础性地理国情监测成果质量控制的方法。
3 参照网络隐私认证制度,推动建立智能教育系统自律机制
教育智能平台出于逐利的目的,频繁出现买卖、盗窃学生隐私数据的案情,同时,人工智能技术实施的法律法规尚不规范,安全性评测、应用安全评测、监测预警和风险评估机制尚未建立。相比法律强制措施,借助于隐私保护技术手段、市场参与主体、内在竞争和行业自律,能够更加高效地保护学生隐私数据[14]。因此学生隐私保护技术的前沿开发者是市场,实际践行者也是市场,用户隐私保护和市场的健康运行需要成立市场联盟,并提出约束行业发展的自律机制。我国应当积极借鉴网络隐私认证制度,由市场主体设计网络隐私保护的自律机制,借助于网络审查者颁发的标识,显示相关从业者保护学生隐私的资质。经过隐私认证的教育互联网企业,必须遵守学生在线信息收集准则,在外部监督管理的前提下开展营业活动。此外,利用可搜索审计跟踪(Searchable Audit Trail),使所有的学习评估工作在中央储存器中都是可见的,提供对教育系统内部、外部审计的论证性材料;在调查报告、争议处理、隐私反馈等方面都形成系统的隐私指导。智能教育平台应当在风险规避思维的引导下进行数据收集与产品设计,在研发过程中采取技术规避措施,坚持事先预防而非事后补救,明确从技术研发到教育产品应用、教育数据采集及分析处理进程中的科学伦理、社会道义。在技术民主的思维逻辑指引下,推动教育群体的广泛参与及信息的透明公开[15]。
4 引导组织团体参与研发学生数据隐私保护技术与标准制定
随着我国学生隐私数据泄露的形势日益严峻,数据主体对于个人信息的自我保护意识和维权能力的缺乏问题尤应引起重视。原因在于数据科普知识的缺乏,数据主体没有认识到个体碎片化信息足以勾勒出完整的日常状态;同时,相关隐私信息保护的法律规章依旧缺乏,维权渠道和诉讼成本过高。因此,应引导数据主体积极参与智能化隐私保护技术研发、行业标准制定及数据使用的日常监督,给予相应的政策引导、资金支持来增进社会组织的技术水准,积极借鉴国外学生隐私保护模式,推广智能防范预警机制,定期发布网络平台数据使用及安全防范现状,促使行业内及时更新学生隐私保护的技术手段。例如,美国高等教育政策研究所(Institute for Higher Education Policy)于2015年成立了数据基础设施质量改进工作组,在《美国高等教育数据系统中的信息安全和隐私》中提出学生数据保护的两种系统架构,一种是学生单位记录数据系统(Student Unit Record Data System),由政府或私立机构单独运营,对数据集系统加以隐私安全保护;另外一种是多点系统(Multip Ledestination System),是由多个州的纵向数据系统联网查询学生数据,解决多个系统之间的数据匹配和信息安全的完备性[16]。具体而言,一方面亟需提升数据主体的数据保护意识与能力,加大相关科普知识的宣传力度,逐步提升与人工智能背景相适应的隐私保护意识;另一方面需要引导受教育者及社会组织参与隐私数据治理,加强数据保护法规细则的制定与完善,畅通受害者的法律诉讼和维权渠道。
参考文献
[1]GDPR. An overview of the main changes under GDPR and how they differ from the previous directive[OL].<https://www.eugdpr.org/the-regulation.html>
[2]赵慧琼,姜强,赵蔚.大数据学习分析的安全与隐私保护研究[J].现代教育技术,2016,(3):5-11.
[3]王正青.大数据时代美国学生数据隐私保护立法与治理体系[J].比较教育研究,2016,(11):28-33.
[4]Piazza Company. Privacy policy[OL].<https://piazza.com/legal/privacy>
[5]Thongmak M. Social network system in classroom: Antecedents of edmodo© adoption[J].Journal of e-Learning and Higher Education, 2013, (1): 1-15.
[6]Cate F H, Mayer-Schönberger V. Notice and consent in a world of big data [J]. International Data Privacy Law, 2013, (2): 67-73.
[7]Langheinrich M. Privacy by design——principles of privacy-aware ubiquitous systems [A].International conference on Ubiquitous Computing[C]. Berlin: Springer, 2001:273-291.
[8]Federal Trade Commission. What does the FTC do with your personal information?[OL]. <https://www.ftc.gov/site-information/privacy-policy>
[9]Summit Public Schools. Privacy is our top priority[OL].<https://summitps.org/legal-resources/privacy-center/>
[10]Har Carmel Y. Regulating ‘big data education’ in Europe: Lessons learned from the US [J]. Internet Policy Review, 2016, (1):1-17.
[11]GDPR: Data protection 0fficer[OL].<https://gdpr-info.eu/issues/data-protection-officer/>
[12]Data Quality Campaign. DQC comments on ESSA proposed regulations on accountability, state plans, and data reporting[OL].<https://dataqualitycampaign.org/resource/dqc-comments-essa-proposed-regulations-accountability-state-plans-data-reporting/>
[13](美)约翰·罗尔斯(Rawls,J.)著,何怀宏等译.正义论[M].北京:中国社会科学出版社,1988:3.
[14]张民安.公开他人私人事务的隐私侵权—公开他人的医疗信息、基因信息、雇员信息、航空乘客信息及网络的隐私侵权[M].广州:中山大学出版社,2012:527、51.
[15]刘铁光.风险社会中技术规制基础的范式转换[J].现代法学,2011,(4):68-78.
[16]陈强.美国高等教育数据系统中的信息安全和隐私(一)[J].中国教育网络,2016,(11):28-30.
Motivation and Strategy of Student Data Privacy Protection in the Era of Artificial Intelligence
HOU Hao-xiang
(Faculty of Education, East China Normal University, Shanghai, China 200062)
Abstract: The advent of the era of artificial intelligence provides many opportunities for educational reform, but at the same time, it also poses a new threat to the protection of students’ data privacy. Starting from the understanding of students' data privacy and related research, this paper analyzed the reasons for students' privacy protection, and pointed out that students' data privacy was facing the dilemma of intelligent technology oversteppingprivacy boundary, the increasing monopoly risk of Internet platform, and the inappropriateness of traditional "informed consent" data protection framework. This paper summarized the strategies of European and American countries, including the design of privacy and the restriction of identification technology embedded in the development of educational intelligent devices, the collaboration of social organizations and self-discipline regulations in the education industry, and the construction of student privacy system supplemented by the establishment of institutions. Drawing lessons from relevant experience, we need to enhance the privacy protection and ethical and moral awareness of all subjects, replacing intuitive ideas with rational thinking; establish a system of operable privacy protection regulations and set up pre-event, in-event and post-event monitoring measures; promote the establishment of education intelligent platform self-discipline mechanism by referring to the network privacy authentication system; guide organizational groups to participate in the development of student privacy protection technology.
Keywords: artificial intelligence; big data; student privacy; legal protection
【中图分类号】G40-057
【文献标识码】A
【论文编号】1009—8097(2019)06—0012—07
【DOI】10.3969/j.issn.1009-8097.2019.06.002
作者简介:侯浩翔,在读博士,研究方向为教育政策学、高校教育管理等,邮箱为1296910644@qq.com。
收稿日期:2018年11月6日
编辑:小西
标签:人工智能论文; 大数据论文; 学生隐私论文; 法律保护论文; 华东师范大学教育学部论文;