□青岛日报/观海新闻记者 王世锋
“你有一个苹果,我有一个苹果,我们相互交换苹果,每人仍然只有一个苹果。你有一种思想,我有一种思想,我们彼此交换思想,那我们将同时拥有两种思想。”萧伯纳曾这样说。
在数字经济快速发展的今天,各单位的数据就像苹果一样是各自的“核心资产”,是自身训练人工智能模型的基础。可仅靠自家数据训练出来的人工智能模型往往“思想性”不够,存在精准性、适应性不高等“瓶颈”。要保障用户数据的安全性和隐私性,同时让人工智能模型有尽可能多的数据训练,联盟智能便成为解决问题的有效途径。它可以在各单位不交换“苹果”的情况下共享“思想”,训练出融合多种“思想”的人工智能模型,以更好地服务于生产、生活。
基于此,中国石油大学(华东)计算机科学与技术学院教授张卫山团队与相关企业开展了产学研用联合研发,提出联盟智能的大数据智能新范式,也就是在保护用户数据隐私的前提下,建立泛化应用程度更高的人工智能模型。目前,相关研究已在社区监控智能分析、设备故障分析预测、智慧电网安全管控、罕见疾病诊断等多个对于数据隐私要求较高的领域实现了应用,其中不少项目在青岛实现了产业化应用。
“联盟智能”打破“数据孤岛”壁垒
“人工智能技术发展迅速,应用越来越多,国内与国际主流水平仍有较大差距。在此情况下,我们需要加快建立自主可控可信的人工智能体系。”采访中,张卫山道出了自己从事人工智能研究的初衷。从现实需求看,随着数字经济的飞速发展,很多企业需要用自身积累的用户数据建模和训练,以提升决策的精准性,而这会涉及到用户数据隐私和安全的问题。
“为了保护用户隐私,各个企业的数据就像孤岛一样存放在各自的服务器里。一个人工智能项目可能涉及多个领域,需要融合各个公司、各个部门的数据。可现实中,要想将散落在各地、各机构的数据甚至是‘竞争对手’之间的数据进行整合几乎是不可能的,这就导致了人工智能模型的训练数据少。”张卫山说,同时,用某一企业、某一机构的数据样本训练出来的人工智能模型,泛化性即场景适应能力普遍较差。
既要训练泛化程度高的人工智能模型,又要保证用户数据安全,联盟智能应运而生。据张卫山介绍,2016年谷歌提出“联邦学习”的概念后,团队在此基础上改进了整套学习机制,结合区块链技术,建立了联盟智能学习体系。联盟智能是在不违反数据隐私法规的情况下,通过加密的模型参数交换机制,提供融合学习不同场景、不同单位数据的可能性,打破“数据孤岛”的限制,形成更通用、更精准、更加泛化的全局数据模型。“简单来说就是‘数据不动模型动’,数据所有权与使用权分离,最终实现共赢。”经过多年持续研究,团队逐个突破各种阻碍,取得了多项成果,团队研究成果获山东省科技进步二等奖、吴文俊人工智能科技进步三等奖及多项省部级奖励。
产业化应用助力数字青岛建设
“人工智能模型的建立与训练需要大量的数据,因此与实体经济融合,实现全面的产学研用联合研发才是团队发展的基础。”张卫山表示,团队在联盟智能技术研究之初就与青岛海尔空调电子有限公司、青岛文达通科技股份有限公司、青岛新奥能源有限公司等青岛企业建立了密切联系,成立了西海岸人工智能科技创新中心,助力了数字青岛的建设。
“家庭用户燃气安检时,巡检员时常会遇到家里无人的情况, 浪费了人力和时间,且存在无法及时排除安全隐患的风险。”张卫山介绍说,团队与新奥数字技术研究院、青岛新奥能源有限公司联合研究,提出了基于联盟智能技术的上门安检时间推荐方法,燃气安全巡检首次上门完成率可以提高10到15个百分点。目前,团队正跟新奥新智数字技术研究院和青岛文达通科技股份有限公司展开社区安全检测目标识别项目合作,推进联盟智能社区建设。相关技术在西海岸新区瑞源水岸、瑞源名嘉汇、凤凰城小区均有应用。项目应用后社区智能化程度显著提升,社区安全监测目标识别准确率从85%提升到了96%。
林太任是海尔智慧楼宇的维保经理,主要负责青岛海尔科创生态园空气生态创新中心的维保工作。以往他们都是在建筑内各个楼层出现故障时才会到现场。现如今,接入海尔智慧楼宇“大脑”的系统实现了AI智能巡检,林太任在电脑和手机上就能收到故障预警提示,提前介入,避免故障发生。而这主要得益于张卫山团队“基于联盟智能的故障推演分析方法”的应用,该技术通过对各区域用户使用习惯、运行数据的自主学习,形成稳定、成熟可靠的模型。模型能够对正在运行的系统实现精准预测,提前30分钟给出故障排除决策,让故障发生率降低了85%。
去年年底,中共中央、国务院发布了“数据二十条”,提出要推进实施公共数据确权授权机制,推进对各种公共数据的汇聚共享、互联互通,打破“数据孤岛”。“未来,团队将继续深耕联盟智能技术,推进联盟智能在更大范围、更多产业上应用,更好地助力数字青岛建设。”张卫山也期待着青岛能够出台更多政策,扶持、培育青岛本地的人工智能、大数据企业,让更多企业深深扎根在青岛。