创造新看点
首页 >> 科技咖 >> 正文

上海观安信息技术有限公司创始人,所谓东数西算,西部地区有能源

日期:2020-07-14 08:21:46 来源:互联网 编辑:小狐 阅读人数:409

“我们原来一直讲数据是一种资产,其实我们希望让数据成为一种资本,更高于资产。”上海观安信息技术有限公司创始人、首席专家张照龙近日在2020世界人工智能安全高端对话上接受澎湃新闻专访时说道。

随着“数据”被纳入市场化配置改革的五大基础生产要素,与土地、劳动力、资本、技术等传统要素并列,张照龙认为,“东数西算”框架将在推动国内数据市场发展方面发挥重要作用。

所谓“东数西算”即东部地区有许多做大数据、人工智能的高信息化企业,像上海的“一网通办”也产生了大量政府数据,但算力基础设施资源紧张。与之相对应的是,西部地区有能源、有土地,算力资源丰富。

通过构建类似于能源领域“西气东输”的“东数西算”把东部的数据流动到西部存储、计算,能够改善东中西部数字新型基础设施不平衡的布局,有利于数据发挥资本化的价值。

不过,要让数据发挥其资本化要素的价值,必须要平衡其开放性与安全性。

在这方面,上海走在前列,政府与企业就数据共享与数据保障建立起互动机制,许多新的人工智能场景需求与应用随之发展。

数据开放:积极性与安全性

要让数据要素流动起来,源头首先得有“活水”即数据开放。

早2018年,《上海市公共数据和一网通办办法》沪府令9号)已经出台。2019年10月,《上海市公共数据开放暂行办法》沪府令21号)开始执行。在此之后,企业可以申请使用的公共开放数据已经非常广泛,包括税务、工商、金融、民政、交通、教育、卫生健康等领域。

就在6月底,张照龙作为上海市公共开放数据专家委员,参与了针对上海市公共开放数据的项目评审。提出申请的有金融机构,有事业单位,还有很多民营企业和中小微企业。

他表示:“我认为大家非常积极,数据开放没问题,政府也愿意把数据开放出来,但在里面我比较担心的一点是什么?就是企业在使用过程中怎么保护数据安全,也就是怎么合法合理地使用这些数据,怎么保证他们不会再给另外的第三方,或者被内部人员?”

张照龙注意到,参加项目评审的很多单位在安全这一块考虑得并不是特别充分,一些企业还是停留在方案上,或者说理论上。

他认为,在支持企业使用开放数据的同时,要在过程中进行安全指导、提出保障要求。“如果都没有数据,也就无从谈怎么保障。只有给一部分数据,让他们重视起来以后,才能把保障工作做得更好。”

AI+数据安全

人工智能产业的兴起,在一方面上深刻地影响了数据行业,另一方面更凸显了数据安全的重要性。

张照龙举了几个例子,说明AI与大数据的深度交织。

首先,是AI+挖矿。“山西过去挖矿定位矿源的数量和矿含量,都是靠人力进行探测。我们利用所有的历史探测数据和地理环境数据,做了一些数学模型,我们就能非常精确地判断特定区域的风险度有多少,价值有多高,值不值得开采。”他说道。

其次,是AI+脱贫,即人工智能通过家庭背景、地理环境、受教育程度、家里人口数量和年龄结构、所在区域的生活习惯,就能有效计算哪些扶贫数据是伪造的,和真实的偏离度有多少。

最后,是AI+办案。人工智能可以大大节省办案取证过程。“像蜘蛛网一样复杂的人际关系网、资金往来等,通过人工智能很容易就梳理清楚,用最快的时间定位出问题,完成电子取证。”

“这就是人工智能在技术领域、民生、社会稳定、工业制造上面带来的价值,案例有很多,但里面不可缺少的就是安全。”张照龙总结道。人工智能在本质上需要大量数据,因此,企业需要在三个层面上保证数据安全。

首先要保证原始数据的质量。一些“数据投毒”行为,将假数据混入正常数据当中,就会导致算出的结果有问题。

其次要保证数据使用过程安全。要是算法本身有缺陷,或是算法内嵌了一些有害程序,也会造成模型偏差。

最后,要保证计算出来的结果的安全性,防止敏感结果。有时候人工智能使用的原始数据安全风险并不高,但计算出来的却是一个隐私性结果。例如,单个人名不具备太多指向性,但与习惯去的地方、购买偏好结合起来,就可能指向单个单体,非常敏感。

数据治理互动

由赛博研究院和观安信息撰写的《人工智能数据安全治理报告》认为,随着人工智能在产业和技术上加快渡过“探索期”逐步进入“成长期”人工智能与数据安全更加深度交织。数据安全问题已然成为人工智能突破关键转轨期所必须解决的重要制约瓶颈。

在上海这片土地上,张照龙认为政府和企业之间已经建立起有关数据治理的互动机制。

“政府支持公共数据开放,而在企业方面,其实大家都在想怎么拿到数据、用好数据、保证数据的安全,以及怎么让数据输出的结果是有价值的,都是往数据资本化这个方面在考虑。”他说道。

“我相信这会产生很多的应用场景需求和使用,上海的人工智能行业也会有大发展。”张照龙说道。

本文相关词条概念解析:

数据

数据就是数值,也就是我们通过观察、实验或计算得出的结果。数据有很多种,最简单的就是数字。数据也可以是文字、图像、声音等。数据可以用于科学研究、设计、查证等。数据背景是接收者针对特定数据的信息准备,即当接收者了解物理符号序列的规律,并知道每个符号和符号组合的指向性目标或含义时,便可以获得一组数据所载荷的信息。数据作为信息的载体,当然要分析数据中包含的主要信息,及分析数据的主要特征。数据(Data)是载荷或记录信息的按一定规则排列组合的物理符号。

网友评论