重视数据产权制度设计 加快建设数字中国******
作者:唐树源(上海杉达学院法学系教师、数字商务研究中心副主任)
党的二十大报告指出,要加快建设网络强国、数字中国。数据作为新型生产要素,对于数字中国的建设具有基础性价值。2022年12月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《意见》),对数据产权、数据要素流通和交易制度、数据要素收益分配制度及数据要素治理制度作出部署。数据作为新型生产要素,对于整个数字经济的发展都有着关键性价值,厘清数据产权制度是构建数据基础制度的基础性工作。
数据产权制度的关键性问题
要素市场运行的前提是产权配置清晰,产权不清的数据资源必然会限制数据市场的流通和交易。有关数据产权问题,早在2017年,习近平总书记就强调“要制定数据资源确权、开放、流通、交易相关制度,完善数据产权保护制度”。有关数据产权的讨论,需要关注如下几点关键性问题:
第一,有关数据产权的立法规定散见于各地政策性文件中,国家层面尚无统一的立法规定。特别是在2021年之后,各地有关数据要素的政策性文件出台较多,而数据产权的内容主要分散在各类文件中,各地的规定也有所不同。主要存在各地政府“自我赋权”“模糊处理”“规定不全面”等问题,这也就促使此次《意见》的出台,明确了数据产权制度的重要性,对理论界和实务界都有着定分止争的作用。接下来从国家层面制定数据产权相关的统一性规定已经非常必要,尤其是在《意见》的指引下细化数据确权的制度性内容是当务之急。
第二,数据确权不应只有所有权的确立,而应当构建符合数据独特属性的权属体系。当前国内外研究数据产权主要局限在所有权的问题上,这将不利于数据要素的市场运营和交易。数据具有有限排他、可分割、动态调整和技术依赖的独特属性,不能等同于石油等自然资源的确权思路,更不应当停留在所有权的层面。因而此次《意见》提出的数据确权治理路径是“三权分置”的数据产权运行机制,充分考虑到了数据的独特价值,更好地平衡了数据权属与市场应用发展。
第三,构建数据分类分级确权授权使用机制。《意见》提出要“探索建立数据产权制度”,其中包括“建立公共数据、企业数据、个人数据的分类分级确权授权制度”,说明数据产权不能“一刀切”。从分类上看,数据可以分为公共数据、企业数据和个人数据,每一类数据相关联的主体和内容都是不同的。如公共数据的主体涉及面更广,不同阶段会有不同的参与主体,权属的确立就更难,但公共数据的开放又更为重要,所以平衡两者之间关系的难题就摆在了决策者面前。同时,各类数据的授权机制同样重要并有所不同,这无疑增加了数据产权制度的复杂性。平衡好数据各类权利保护并兼顾效率最大的结果是数据产权运营的重要追求。
构建“三权分置”的数据产权运行机制
《意见》提出“建立数据资源持有权、数据加工使用权、数据产品经营权‘三权分置’的数据产权制度框架”,这是接下来数据产权确立的核心内容。对于此项较新的治理机制,需要注意理解如下问题:
一方面,“数据资源持有权”是基于数据所有权特殊性的分离权利。所有权、持有权、经营权、使用权、占有权等都是产权体系中重要的构成,持有权不同于使用权和经营权,更加突出对数据资源的掌控,是脱离于所有权的分离权利。之所以设立“数据资源持有权”,本质上也是因为数据资源所有权的不确定性。
另一方面,数据“三权”的分工和定位是不同的。 “数据资源持有权”是对于数据资源的掌控权利,如个人对个人所有的数据持有权,公司对公司所有数据的持有权,公共管理部门对公共管理服务中产生数据的持有权。“数据加工使用权”是对于数据的加工处理活动的使用权利,持有并不代表着有权对数据进行加工处理,在数据授权加工中尤为明显,因而使用权所涉及到的主体就更为多元。“数据产品经营权”是对于数据产品的经营性权利,数据从一开始的资源形态,经过加工处理,最后形成为数据产品,可以经营并产生收益。随着数据交易市场的快速发展,未来各类数据产品会更加多样和丰富,这也容易引发市场竞争的垄断和不公平性,因而更加公平、开放的数据产权运行机制是十分必要的。
建立数据产权制度需要同步解决的问题
当数据不确权,就会限制数据的流通交易,而当数据产权机制确立后,随着数据广泛流通使用,势必会遇到其他方面的各类问题,如各方权益保护、安全、合规等方面的难点问题,需要重点对以下几个方面加以关注:
第一,健全数据要素权益保护制度。数据相关的权益保护主要包括数据财产权益和人格权益的保护。针对不同类型的数据保护内容是不一样的,如个人数据重点在于隐私保护与个人信息保护,企业数据的重点在于商业秘密与知识产权保护,公共数据较为复杂,可能同时包含个人数据和企业数据的内容。随着数据交易运营的快速发展,多方主体参与会使得各方权益保护更为重要。同时,数据也会经历动态发展的过程,针对不同时期的数据权益保护也不尽相同,实践中需要更加细化不同流程和阶段,并进行分类分级保护。
第二,重视数据全流程合规能够更好保护数据产权。数据产权制度的确立本质上就是从根源上划清各方主体的数据权益,确保数据运行的合规。此次《意见》指出要“建立合规高效、场内外结合的数据要素流通和交易制度”“完善数据全流程合规与监管规则体系”“ 统筹构建规范高效的数据交易场所”。当前,数据合规已经逐步被重视并引入企业实践中,此后的数据合规需要结合“三权分置”的数据产权运行机制全面梳理并总结,明确各方权利和责任。以数据合规为契机,全面开展数据产权保护工作是较好的切入点,有助于建立起公平、经济的数据要素流通和交易环境。
第三,安全是数据全流程的底线原则,数据产权制度也需要动态调整,适应数据市场的发展。此次《意见》指出要“统筹发展和安全,贯彻总体国家安全观,强化数据安全保障体系建设,把安全贯穿数据供给、流通、使用全过程,划定监管底线和红线。”数据产权制度本质上是根据数据独特产权属性而创立的,当数据要素市场需要更合适的产权制度的时候,当前的数据产权制度进行不断调整也是必然的。这当中首要保障的就是安全底线,安全体现在数据权属、内容、技术、载体等层面,也贯穿于数据交易、授权、加工、开放、共享等全过程。有了安全的保障,使得数据产权制度更加坚固,数据要素的市场活力方能够充分释放。
向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
(文图:赵筱尘 巫邓炎)