Electrical Engineering and Automation June 2015, Volume 4, Issue 2, PP.18-23
An Optimized Identification Method of the Key Nodes Based on Industrial Control Network Yi Peng1, Feng Liu1,2,3#, Dongbo Pan1,2,3 1. School of Computer and Information Science, Southwest University, Chongqing 400715, China 2. Chongqing Engineering Research Center for Instrument and Control Equipment, Chongqing, 400715, China 3. Chongqing Industrial control system security technology supporting center, Chongqing, 400715, China #
Email: liuf@swu.edu.cn
Abstract To identify the key node is very important to improve the operation efficiency and computing capability in the industry control network, so it is important to strengthen the identification of key nodes. As a type of complex network, there exists many disadvantages in identification method of the key node in industrial control network, such as insensitive to the network size, unable to obtain the nodes weights and so on. In this paper we optimized the degree and betweenness, proposed the degree index and betweenness index, and got the weights of the nodes in the networks by these two synthesized indexes. Finally, through the ranking of nodes weights, digging out one or more the most important nodes, which are the key nodes of the network. The method can quantify the important extent of nodes and avoid sidedness of single evaluation method. Experiments showed that the method is feasible and efficient, computing ability get well improved. Keywords: Industrial Control Network; Key Nodes; Degree Exponent; Betweenness Exponent
基于工业控制网络的关键节点优化识别研究* 彭一 1,刘枫 1,2,3,潘东波 1,2,3 1. 西南大学 计算机与信息科学学院,重庆 400715 2. 重庆市智能仪表及控制装备工程技术研究中心,重庆 400715 3. 重庆市工业控制系统安全技术支持中心,重庆 400715 摘
要:在工业控制网络中确定出关键节点对提高整个网络的运行效率和计算能力十分重要,所以加强对关键节点的识
别就显得尤为重要。工业控制网络作为复杂网络的一种类型,其关键节点的识别方法存在对网络规模不敏感,无法得到 关键节点的权重值等问题,本文在此基础上优化了度和介数,提出了度指数和介数指数,并综合这两个指数得到网络中 节点的权重值,最后通过权重排序挖掘出最重要的一个或多个节点,即网络的关键节点。该方法避免了单一方法的评价 片面性缺点,同时能够量化节点重要程度值。实验分析表明该方法可行有效,可以获得理想的计算能力。 关键词:工业控制网络;关键节点;度指数;介数指数
引言 复杂网络是一类在网络结构、节点行为、影响因素等方面呈现出高度复杂性的新型网络,小世界和无 标度是其标志性特征。研究发现,诸如社会关系网、交通网、生态网等都存在小世界和无标度的复杂网络 特性,复杂网络理论也因此受到广泛的关注和重视 [1-4]。工业控制网络作为复杂网络的一种类型,其在提高 生产速度、管理生产过程、合理高效加工以及保证安全生产等工业控制及先进制造领域起到越来越关键的 *
基金资助:受国家“863”计划课题 (2012AA041101) 资助;中央高校基本科研业务费专项资金资助项目 (XDJK2013C119)支 持资助(基金号) 。 - 18 www.ivypub.org/eea
作用[5],挖掘出工业控制网络的关键节点,对其进行有效控制,从而提高整个网络的运行效率和计算能力十 分重要。识别关键节点主要通过节点重要性排序实现,节点重要性分析方法主要包括社会网络分析法和系 统科学分析法。度和介数是社会网络分析法中的两个指标。它们从不同角度描述了单个节点在网络中的重 要程度,但其各自评价时都具有很强的片面性。如度在一定程度上反映节点在网络中的重要程度,但度相 同的节点在网络中的重要程度未必相同,如与这些节点相连的节点都不重要,即使节点的度很大也不能说 明该节点重要。复杂网络是千变万化的,仅通过单一指标来衡量实际网络中节点的重要性是不准确的。例 如,文献[6]提出了一种基于多指标的非冲突等价类的节点重要性评价框架;文献[7]分析了多种中心性评价指 标并提出了基于 PageRank 的节点重要性排序方法;文献[8]也提出一种多指标的决策方案评价方法。这些方 法共同的缺点都是无法得出节点的重要性值即量化它在网络中的权重值,同时无法得出某一节点相比其他 节点的重要程度权重值;另外,随着网络规模的变化,评价方法和评价指标也不能很好地跟踪这种变化。 如在一个 10 个节点的网络中,A 节点比 B 节点多 5 个连接边,则 A 节点的重要性明显强于 B 节点;但在一 个有 100 个节点的网络中,A 节点比 B 节点多 5 个连接边,则其重要性并不是显著的。基于以上考虑,为弥 补以上两个缺点,本文提出了两个新指标度指数和介数指数。首先,利用两个节点间边和介数的相关关系 与网络全局的比值建立指数函数,从而分别确定节点在网络全局中的权值;然后同时考虑两个指数,得到 节点的重要性权值。该方法既能够避免单一方法的评价片面性缺点,更加全面的反应网络中节点的重要性, 使挖掘出的关键节点更加准确,又能够在不破坏网络的前提下,量化出节点在网络中的重要性权重值。实 验表明,该方法优化了计算方式,可行有效。
1
关键节点优化识别方法的提出 度虽然反映了节点与周围节点的直观联系,但是却忽略了节点本身的一些因素:例如一个节点的度很
大,但是与它直接相连的节点不重要,那么这个节点不一定很重要,同理,如果一个节点的度很小,而与 它相连的节点很重要,那么这个节点也可能很重要。比如,在社交网络中很多的娱乐明星微博,其内容不 一定有丰富多精彩,但是却在微博排行榜上排名很高,这势必跟他们的职业容易引起很多粉丝的关注有关, 并不能说明其真实水平。为此,本文提出了两种新的指标:度指数和介数指数,然后同时考虑两个指标综 合评价网络节点的重要性,提出一种新的关键节点识别方法。 定义 1 度指数:在 N 个节点的复杂网络中,节点 i 的度为 Ki (i 1、 2...N),网络中所有 N 个节点度的和 N
表示为 KQ Ki ,设节点 m 的度指数为 K em ,那么任意节点 i 的度指数 K ei 定义为: i 1
Kei Kem KQ
Ki K m KQ
在比较重要性权重值时, K em 为公共因子,对比较结果没有影响,因此计算时简化公式令 Kem 1 。任 意节点 i 的度指数 K ei 定义为: Kei KQ
Ki K m KQ
例如,图 1 所示为含有 5 个节点的无向网络。
图 1 无向网络拓扑结构图
- 19 www.ivypub.org/eea
由 拓 扑 结 构 易 知 , K1 1 , K2 3 , K3 2 , K4 3 , K5 1 , 则 该 网 络 中 所 有 节 点 度 的 和 N
KQ Ki 1 3 2 3 1 1,令 0 Ke1 Ke5 1 ,即节点 P1 和节点 P5 的度指数为 1,则由度指数的计算公 i 1
式可计算出节点 P2 、 P3 和 P4 的度指数分别为 K
31
21
31
10 1.58 , K 10 10 1.26 , K 10 1.58 。根 e 2 10 e3 e 4 10 据度指数定义可知,其表示为在此 5 个节点的无向网络中,如果节点 P1 和节点 P5 的重要权重值为 1,那么节
点 P2 、 P3 和 P4 在网络中的重要权重值分别为 1.58、1.26 和 1.58。显然,由度的值只能得出网络中节点的相 对重要排序,而由度指数的值,我们可以很清晰地量化出每一个节点的重要程度值,如可以直接量化为 P1 的重要程度为 1、 P2 的重要程度为 1.58、 P3 的重要程度为 1.26。 定义 2 介数指数:在 N 个节点的复杂网络中,节点 i 的介数为 Ti (i 1、 2...N ) , Ti 0 ,网络中所有 N 个 N
节点介数的和表示为 TQ Ti ,设节点 m 的介数指数为 Tem ,那么任意节点 i 的介数指数定义为: i 1
Tei Tem (TQ )
Ti Tm TQ
在比较重要性权重值时, Tem 为公共因子,对比较结果没有影响,因此计算时简化公式令 Tem 1 。任意 节点 i 的介数指数 Tei 定义为: Tei TQ
Ti Tm TQ
特别地,若 Ti 0 则其介数指数 Tei 0 。 同理,如图 1 所示含 5 个节点的无向网络中。 T1 0 , T2 0.5 , T3 0 , T4 0.5 , T5 0 ,则网络中 N
所有节点介数和 TQ Ti 0 0.5 0 0.5 0 1,容易知道,节点 P1 、 P3 和节点 P5 的介数指数也为 Te1 0 , i 1
Te3 0 , Te5 0 , Te 2 1 , Te 4 1 ,即节点 P2 和节点 P4 的介数指数为 1。该例中介数为 0 的点占网络中的
节点总数比例很多,虽然不能将节点 P1 、 P3 和 P5 的重要性通过介数指数区分开,但显然,我们仍然可以很 清晰地量化出每一个节点的重要程度值,如节点 P2 和节点 P4 的介数为 0.5 但不等同其重要程度为 0.5,但通 过计算介数指数,我们可以直接说节点 P2 和节点 P4 的重要程度相同,其重要性权重值为 1。实际复杂网络 中,介数为 0 的节点不会如此,一般在网络中只占很少比例,因此类似于度指数,介数指数同样可以量化网 络中不同节点的重要性权重值。 由以上定义可知,每一个节点的度指数和介数指数都用指数形式引入了所有节点的度数和介数值,因 此,该新指标的提出最重要的优势是考虑了节点在整个网络中的重要程度、量化了节点的重要程度权值和 节点相比其他节点的重要程度权值。 我们认为,评价网络节点重要程度时,度和介数的重要性相同,因此度指数和介数指数重要性相同, 综合考虑两种指标时权值均为 0.5。本文提出的方法主要包括以下四个步骤: (1) 计算网络每个节点的度与介数; (2) 根据度与介数的值,由定义 1 与定义 2 计算每个节点的度指数与介数指数; (3) 用加和为 1 的方法归一化处理度指数和介数指数; (4) 给度指数和介数指数分别赋 0.5 的权值,计算出节点综合评价后重要性权重值。
2
实验分析
2.1 实验结果 本文采用了 ARPA (Advanced Research Project Agency)网络拓扑进行实验(见图 2)。ARPA 是目前分析 网络节点重要性时使用最普遍的网络拓扑之一。该网络由 21 个节点和 23 条边组成,大部分节点的度为 2, 平均度为 2.48。 - 20 www.ivypub.org/eea
A3
A2
A4
A5
A18
A19
A6
A7
A8 A1
A17
A16
A20
A21
A15
A9
A14
A13
A12
A11
A10
图 2 ARPA 拓扑结构
由网络拓扑结构计算出网络的度与介数,按照前文所述步骤得结果如表 1 所示。通过比较综合权重值大 小即可对网络中节点的重要性进行排序,进而挖掘出关键节点。 表 1 节点的不同指标值和综合权值表 节点 A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20 A21
度 2 4 4 2 2 3 2 2 2 2 2 3 2 4 3 2 2 2 3 2 2
介数 0 0.149 0.316 0.179 0.157 0.201 0.107 0.069 0.072 0.107 0.156 0.271 0.159 0.175 0.046 0.012 0.047 0.120 0.215 0.097 0.072
度指数 1 1.164 1.164 1 1 1.079 1 1 1 1 1 1.079 1 1.164 1.079 1 1 1 1.079 1 1
介数指数 1 1.056 1.123 1.068 1.059 1.077 1.040 1.026 1.027 1.040 1.059 1.105 1.060 1.066 1.017 1.004 1.017 1.045 1.082 1.036 1.027
表 2 节点重要性排序表
综合权重值 0.0456 0.0507 0.0522 0.0472 0.0470 0.0492 0.0465 0.0462 0.0462 0.0465 0.0470 0.0500 0.0470 0.0509 0.0480 0.0457 0.0460 0.0466 0.0493 0.0464 0.0462
节点 A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20 A21
度 3 1 1 3 3 2 3 3 3 3 3 2 3 1 2 3 3 3 2 3 3
介数 21 10 1 5 8 4 12 18 15 12 9 2 7 6 19 20 17 11 3 14 15
Ref 13 21 13 1 5 6 4 12 17 18 11 7 2 9 8 19 20 16 10 3 14 15
Ref 14 21 5 1 13 14 3 9 11 10 8 7 4 17 2 12 20 19 18 6 15 16
本文 21 3 1 8 9 6 13 16 16 13 9 4 9 2 7 20 19 12 5 15 16
由表 1 可知,度指数和介数指数指标可以直接反映出网络中任意节点相对其他节点的重要程度。如节点 A1 的度为 2,节点 A2 的度为 4,很容易得到 A2 比 A1 重要,但是 A2 比 A1 重要多少却不知道。而度指数却可
以清晰地反映出这一点,节点 A1 的度指数为 1,节点 A2 的度指数为 1.164,其含义为在整个网络中,节点 A2 相对于节点 A1 的重要程度为 1.164。同理,介数指数也有此优点。另外,可以用度指数和介数指数的值
直接表示该节点在网络中的重要程度。如由表 1 可知 A2 的度为 4、介数为 0.149,这并不等价于节点 A2 在网 络中的重要程度就为 4 或者 0.149。但从度指数指标考虑时,可以量化出节点的重要程度,即若 A1 的重要程 度为 1 则 A2 的重要程度为 1.164 或者从介数指标考虑,若 A1 的重要程度为 1 则 A2 的重要程度为 1.056。
2.2 对比分析 由表 1 所得的综合权重值对节点重要性进行排序,同时我们将本文所提方法与单一用度、介数以及参考 文献[13][14]所用的方法进行对比,结果如表 2 所示。通过 Ref13,Ref14 和本文方法建立一个偏差值表,如 A2 节点的三种方法排序分别为 15,5,3,显然,5,3 更接近,我们认为该节点重要性排在 5,3 上是比较合理的, - 21 www.ivypub.org/eea
然后以中值作为比较基准,也就是 4,这样可以得到一个以合理中值为基准的线。根据表 2 中节点 A1、 A2、…A21,在 Ref13,Ref14 和本文三种方法得出的重要性排序数,可以画出三条三种方法的折线,结果 如图 3 所示。 分析图 3 可知,本文提出的方法结果图与比较基准线最接近,其次是 Ref13 提出的方法,而 Ref14 中的 方法得出的结果偏离比较基准线最远。但是三种方法得出的最重要的节点却是相似的,即虽然评价方法不 同,挖掘出的网络的关键节点却是相似的,本例中综合几种评价指标可以确定的关键节点有 A3、A6、A12、 A14、A19。ARPA 网络的度只有三个值,即 2、3、4。因此很显然,用单一的度来衡量网络中节点的重要 性是不够也不准确的。同理,用单一的介数指标评价节点重要性时也只能排出六个顺序。仅仅在 21 个节点 的网络中就很明显地看出单一方法的不足了,针对更多节点的大型网络,这种单一评价方法更不实用。同 时,运用单一评价指标评价网络中节点的重要程度也就只是从这一侧面描述了节点重要性,太过片面。而 本文同时考虑两种指标,比起单一方法更加全面准确。很明显,本文提出的综合方法相比单一使用度方法、 介数方法以及 Ref13 与 Ref14 中运用的方法都要全面准确。
图 3 不同方法节点排序折线图
3
结论与展望 本文首先在度与介数的基础上提出了度指数和介数指数的概念。通常,节点重要性可以通过比较度和
介数等指标来评价,但是度和介数的值并不等同于节点的重要程度值。本文提出的度指数和介数指数正好 克服了这一缺点,它们可以很好地量化节点相比其他节点的重要程度以及节点在整个网络中的重要程度。 同时,本文综合考虑两个指标(认为其对节点的影响程度相当)克服了单一指标的片面性,更加全面准确 地反映出了节点的重要程度,量化出一个全面的重要程度值。通过实验验证,该方法计算简单有效。另外, 综合计算节点权重时,还可以考虑更多的评价指标,如接近度、特征向量等,这也是本文考虑不够之处。 因此,该方法具有很好的可扩展性,为进一步研究奠定了基础。
REFERENCES [1]
Albert R, Barabasi A-L. Statistical mechanics of complex networks [J]. Reviews of Modem Physics, 2002, 74(1): 47-97. Choi, Mihwa. “Contesting Imaginaires in Death Rituals during the Northern Song Dynasty.” PhD diss., University of Chicago, 2008
[2]
Wu J S, Di Z R. See complex networks from statistical physics [J]. Progress in Physics, 2004, 24(1): 19-46
[3]
Zhou T, Bo W J, Wang B H, Liu Z J, Yan G. An Introduction of complex networks [J]. Physics, 2005, 34: 31-36
[4]
Boccaletti S, Latora V, Moreno Y, M, et al. Complex network: structure and dynamics [J]. Physics Reports, 2006, 424(1): 175-308 - 22 www.ivypub.org/eea
[5]
Ling Zhihao. Fieldbus and industrial Ethernet[M]. Beijing: Machinery Industry Press, 2006
[6]
He Nan, Li Deyi, et al. Summary of exploring the important nodes in complex networks [J]. Computer Science, 2008, 34(12): 1-5
[7]
M. Gneiser,J. Heidemann, M. Klier, A. Landherr,F. Probst. Valuation of Online Social Networks Taking into Account Users’ Interconnectedness. Infermation Systems and E-Business Management, 2010(11): 1-24
[8]
Yu HUI,Liu Zun,Li Yong-Jun. Key nodes in complex networks identified by multi-attribute decision-making method[J]. Acta Phys. Sin, 62, 2013, 020204
[9]
Wang Xiaofan, Li Xiang, Chen Guanrong. Complex network theory and application [M]. Tsinghua university press, 2006
[10] Wang Lin, Zhang Qianqian. Centralization of complex networks [J]. Complex systems and complexity science, 2006, 3(1): 13-20 [11] Freeman LC.Centrality in social networks, Conceptual Clarification. Social Networks, 1978(1): 215-239 [12] He Dareng, Liu Zonghua, Wang Binghong. Complex systems and complex networks [M], Beijing, Higher Education Press, 2009 [13] Bonanich P. Power and centrality: a family of measures. American Journal of Sociology, 1987(92): 1170-1182 [14] Wasserman S, Faust K. Social network analysis: methods and applications’. Cambridge University Press,1994
【作者简介】 1
彭一(1990-),女,汉,硕士,智能
2
刘枫(1957-),男,汉,硕士,教授,智能控制系统。
控制系统,西南大学 2012 级硕士研究
Email: liuf@swu.edu.cn
生。
3
Email: pengyiyi@swu.edu.cn
Email: pandb@swu.edu.cn
潘东波(1977-),男,汉,博士,副教授,系统可靠性。
- 23 www.ivypub.org/eea