推广 热搜: 公司  快速  上海  中国  未来    企业  政策  教师  系统 

共词知识网络的认知结构

   日期:2024-11-07     作者:caijiyuan    caijiyuan   评论:0    移动:http://keant.xrbh.cn/news/13860.html
核心提示:共词知识网络中的认知结构(I):理论与方法[*]滕立1、3 沈君2、3 高继平31. 郑州航空工业管理学院,郑州,河南,4500152. 山东
共词知识网络中的认知结构(I):理论与方法[*]

normal align=center>滕立13  沈君23  高继平3

共词知识网络的认知结构

normal align=center>1. 郑州航空工业管理学院,郑州,河南,450015

normal align=center>2. 山东大学(威海)商学院,威海,山东,264209

normal align=center>3. 大连理工大学WISE实验室,大连,辽宁,116024

  结合当前对文献关键词网络两种研究范式的优点,在既考虑词所处的语境又考虑词在网络中的位置特征基础上,以布鲁克斯的认知地图和知识计量学为基本理论,首次提出知识群内部的知识单元外部连接度的概念及其理论含义。理论分析表明知识群中具有最高外部连接度的知识单元在知识群形成的知识链中具有知识基因的功能,并以此为基础构建了共词网络认知结构的实现方法。文章指出该方法既可以分析知识创新的过程,也可用于从遗传与变异角度总结知识的变化与活动模式,并具有一定的预测功能。

关键词共词知识网络;认知结构;知识单元;知识基因

中图分类号:G353.1     文献标识码:A

 

Cognitive Structure in Co-word Knowledge Network(Part I): Theory and Method

normal align=center>Teng li1,3  Shen jun2,3  Gao ji-ping3

normal align=center>1. Management Colleges of Aircraft Industry of Zhengzhou, Zhengzhou, Henan, 450015

normal align=center>2.Business School of Shandong Uniuersity (Weihai), Weihai, Shandong, 264209

normal align=center>3. Dalian University of Technology WISELAB Laboratory, Dalian City, Liaoning Province,116024

Abstract: Combining the advantage of two approaches in study of co-word knowledge network and taking account of both the context and location feature of keywords in a network, the paper proposed firstly the concept of external linkness of knowledge units in a knowledge group and analysed its theoretical significance. It has been shown by theoretical analysis that knowledge unit with the higest external linkness in a knowledge group played the role of knowledge gene on the chain making by knowledge groups and can be specifically used to construct the cognitive structure of co-word netwrok.. Meanwhile, the method of construct cognitive structure can be not only used to analysing the process of knowledge innovation but also to summarizing the change and activity model of knowledge from inheritance and variation view and predicting its future development direction.

Keywords: Co-word knowledge network; Cognitive structure; Knowledge units; Knowledge gene

引言

共词网络是利用科学论文中关键词的共现关系构建的一种科学知识网络[1]。对共词网络的研究主要有两个方面:一是卡龙[2] [3]Callon M)等人1983年提出并于1986年完善的共词分析方法(Co-word analysis)。该方法的理论基础是拉图尔(Latour B)的行动者网络理论[4]Actor Network Theory),研究重点在关键词形成的聚类与层次结构,并在考虑时间因素的情况下分析聚类的演化过程,从而达到对某领域发展情况的认识与总结。二是随着网络研究的兴起,许多研究者试图从网络的角度对关键词构成的共词网络进行分析。其理论基础与方法主要来源于社会网络分析和复杂网络。该范式的主要研究内容侧重考察单个节点在网络中的位置,如节点的中心度与中介中心度[5, 6],以及网络的整体特征[7],如网络中的度分布、密度、区块识别与联接机制[8]等,从而达到对由关键词表征的科学知识发展变迁过程进行宏观把握。上述两种路径构成了共词网络研究的主流。

在卡龙的研究范式中,词被分配至相应的聚类,使其处于具体的语境中从而确定其意义,并通过战略坐标对聚类进行分层。但是这种方法对聚类间的关系以及聚类间知识上的联系较少顾及。网络视角下的相关研究又只关注单个词,对词所处的语境没有考虑,从而不容易分析知识间的逻辑联系。那么,如何在既考虑词所处的语境,又考虑其知识上的逻辑联系与变迁过程,就成为共词网络研究中一个值得关注的问题。具体地讲,就是哪些词在网络中起到沟通各研究主题知识上的联系?如何利用这种联系构建相应共词网络的认知结构?这种结构能对我们认识科学知识的产生与演化提供怎样的情报?本文试图通过认知地图、知识计量学等相关理论与概念,对上述问题进行研究与探讨,并通过案例进行实证分析。

1  认知地图

认知地图(Cognitive maps)就是知识在认知状态中的内在结构,这种结构形成人的知识框架和思维格局[9]。认知地图既是一种情报组织方法,也是一种知识表示方法[1]。该概念最早由英国情报学家布鲁克斯[10]Brookes BC)提出。在其发表的系列文献中,布鲁克斯[10]把认知地图看做是“对认识空间,对波普尔[11, 12]的客观知识世界(世界3)之结构预先调查”,并认为“如果我们发现了最好的方法,就有可能将选定的紧密相连的若干学科领域的固有联系表示成概念联结网络。每个这样的网络都是表示科学认知结构的一张地图。而每一片段情报都是位于这一网络的经脉之上。这种结构将成为推动科学发展的主观认知结构的副本或近似副本的东西。但这些地图是直观可见的即它也就是世界3最初的客观化。”

认知地图通过关系索引把文献网变成由知识单元直接联结的概念网,使知识体系从外部宏观结构变成内部微观结构。在认知地图上,每个知识单元就像一个结点或地址,处于创造它们的逻辑位置上,通过相应的关系与其他结点联结,形成一个有机整体。人们可以从“地图”上看到知识系统的动态结构,直观地观察到知识单元在系统中如何活化为情报。同时,人们还可以看到研究者们怎样在密切的学科领域中相互影响,接受情报,构成知识,创造新情报的动态过程。[9]

本质上,“认识地图”就是通过分析文献中的逻辑内容,按知识的逻辑结构找出人们思维的相互影响的连接点,像地图一样把它们直观标示出来,展现知识的有机结构,是对人类知识的分析与组织。

2  知识计量学及其基本概念 2.1  知识计量学

知识计量学(knowmetrics)的概念最早是刘则渊教授在1998年北京举办的“科研评价暨科学计量学与情报计量学国际研讨会”上提出的一个新学科设想。当时,在《赵红州与中国科学计量学》的发言中,讲到我国已故著名科学计量学家赵红州曾谈及科学计量学和经济计量学两门姊妹学科的关系,二者结合对于知识经济时代开展知识经济学研究具有特殊意义,指出:“看来很有必要将科学计量学拓展为‘知识计量学’,并与经济计量学结合起来,对知识生产和应用,知识投入和产出,知识存量和流量,知识分配与转移,知识价值和价格等,进行广泛的跨学科的计量研究。”[13]

随后,刘则渊[14]教授对知识计量学的涵义和应用做了进一步的探讨,并定义“知识计量学”是以整个人类知识体系为对象,运用定量分析和计算技术对社会的知识能力(生产、流通、消费、累积和增殖等)和知识的社会关系(组织形式、协作网络、社会建制等)进行综合研究的一门交叉学科,是正在形成的知识科学中的一门方法性的分支学科。”

2009年,刘则渊教授又以知识计量学研究计划和共同开展研究的初步成果为基础,特别是结合对知识可视化探索的成功实践,对知识计量学的概念进行了重新界定:知识计量学是以知识领域为研究对象,以知识单元为分析基础,用数学和电子计算机的手段与方法,从整体上对人类知识活动进行定量和可视分析的一门新兴学科。知识计量学以现有科学计量学、信息计量学、文献计量学和技术计量学等学科为基础,而不是取代这些学科;它力图克服学科术语巴比仑混乱,寻求知识单元分析上的共识。

2.2  知识计量学中的基本概念

1)知识单元

对知识单元的定义目前国内学界并没有统一的认识。赵红洲[15]指出,知识单元是暂时不能量化的科学概念,是科学知识中的最小单位。文庭孝[16]认为知识单元是指在知识管理中可以对关联知识进行独立、自由、有效识别、处理与组织的基本单元,并可以用科学文献中的主题词或关键词加以表达。刘则渊[17]教授则指出所谓知识单元(knowledge unit)是人类知识领域一般用以表征其特定内容的概念及陈述、语词及词组、术语及定律等可计量的基本单位。它是知识计量学的核心概念和基本计量单位。人类知识领域,作为知识计量学的研究对象,其涵盖非常广泛¾¾科学、技术、人文等不同学科门类的知识,著作、文章、专利等不同形态的知识,储存于文献、网络、信息等不同媒介中的知识,以及蕴涵在个人、组织、共同体等活动主体中的知识。这些知识领域在特定的范围内或特定的场合与条件下,会发生知识单元的分解和会聚、离散和重组、演进和升华、衍生和转化,形成一个从简单到复杂、从低级到高级、从浑沌到有序的自组织系统。在一定条件下,某个关键的知识单元可能扮演“知识基因”(knowledge gene)的角色,决定着特定领域知识的进化与突变。这样,基于知识单元的特定知识领域所构成的复杂自组织知识系统,就能够在可视化的知识图谱上展示知识的产生、传播和应用,知识的基础、中介和前沿,知识的结构、演化和重组,知识的涌现、断层和变革,等等。起到知识基因作用的知识单元具有以下四个特征[18]

1 稳定性。主要表现为科学的概念在知识体系中存在时间长,变化小。作为知识基因的概念大都为核心概念,是建立科学的基石。经过时间的考验,这些知识基因为科学共同体所接受或公认,并在相对稳定的认知水平上,由于其稳固性与持久性,成为某一门学科的基本概念框架。知识基因的稳定性、持久性特征是知识遗传的必要保证;

2)统摄性。一般地,概念都具有统摄性。知识基因则具有更强的统摄力:除了以稳定的外壳概括了大量的科学事实,统摄范围广阔,还隐含着决定科学发概念生成的动力因素。在这因素影响下,知识基因形成若干分支概念,进而生成相应的具体概念;

3)遗传与变异性。知识基因最本质的特征之一。遗传指已掌握的知识基因以文献形式或面授方式被传递给接受者,接受者则继承这些知识基因并在此基础上继续发展,并使其产生变异。变异指知识基因基本内容发生变化。此时原有的知识基因被扬弃或被同化, 或与知识变异体(预备知识基因) 共存。知识基因的变异体不能脱离原有的知识基因。无论知识内容和形式如何变化,总会看到原有知识基因的影子。知识基因的遗传性反映了知识形态之间的继承关系,变异性反映了知识形态之间的发展关系;

4)定向控制知识走向的能力。是知识基因特有的一个本质特征。知识作为一个宏大系统,其中一些基元概念成为学科的奠基石,并作为知识基因决定着这门学科进化的走向。科学史表明,学科的发展离不开其基元概念(知识基因) 所决定的框架。这就是知识基因定向控制知识走向的能力。知识基因定向控制知识走向还表现在其渗透力上。有些基元概念如信息、控制等知识基因具有强大的渗透力,它们与其他学科的知识基因相结合,往往导致新学科的创生并开创一个新的知识领域或研究方向。

3)知识群:知识单元的集合则构成了知识群。

4)知识链:知识单元之间知识上的联系与演化构成了知识单元的链条,或知识群的链条。形成知识链的关键节点上的知识单元,往往是知识转折点、构成知识群或知识网络的中介桥梁。

5)知识网络:知识单元之间的联系,形成了知识网络。网络中的节点代表了知识单元,节点间的连线表示了节点间的共现关系,连线的粗细则表征了知识联系的强度。

3  共词知识网络认知结构及其建构方法 3.1 共词知识网络的认知结构

虽然知识单元的定义并无共识,但是学界比较一致的观点则是文献中的关键词可以用来表征知识单元。本文的主旨并不在于寻求知识单元的完整定义,而在于分析关键词所表征的知识单元构成的知识结构。在本文中,我们把科学论文中的关键词视为某种形式的知识单元。由此,关键词形成的共现网络则可视为以知识单元为基础的知识网络,并可以在一定程度上表征布鲁克斯所谓的认知地图。对关键词共现网络结构的分析,就有助于我们直观地观察到知识单元如何活化为情报以及科学家是如何在密切的学科领域中相互影响,接受情报,创造知识与新情报的动态过程。

在关键词共现网络中,一个节点代表一个关键词,节点间的连线及粗细表示关键词间的共现关系与强度。同时,通过一定的聚类规则,网络中的关键词被划分到不同的聚类中,形成了知识群。这些知识群表征了某个研究领域的研究主题,并通过其内部成员与其他知识群产生知识上的联系。知识群间知识上的联系,则构成了共词网络中的知识链。知识链的形式与结构就反映了研究领域各主题间知识上的联系形式与过程,也即共词知识网络中的认知结构。

在网络的视域下,所谓关键词共现网络中的知识群就是整体网络的子网络。陈晓荣[19]等人对知识网络连接机制的仿真实验表明,两个网络中具有高中心性或高中介中心性的主体如果建立联系,将有助于网络间知识的流动。这表明两个相互间有联系的网络其知识流动更容易发生在双方的高中心度或高中介中心度的节点间。在卡龙[20]提出的共词分析范式中,网络中节点的连线被分成两个部分:内部连线与外部连线。前者决定了网络中知识群的密度,后者决定了其中心度,并共同决定了知识群在战略坐标中的位置。根据卡龙对知识群中心度的解释,这个指标描述的是知识群与其他知识群知识上的联系,并用其所有外部连线的权重和来计量。该值越高,表明某知识群与其他知识群知识上联系越紧密。斯莫尔[21](Small H)提出可以利用文献间的共被引关系或词之间的共现关系来构建任意研究主题或领域间的知识上的通道,类似于我们在互联网上利用超文本链接进行网页搜索。在确立这样的通道时可以人为附加相应的限制条件,常见的所谓优化通道[22]是指用最短路径遍历网络中的各个节点。在一个任意两点都有连接的网络中必然存在这样的一条通道。在上述研究成果表明,用知识群中的知识单元与其他知识群的连接强度和来表征知识群间的关系是合理的。

关键词共现网络是一种无向加权网络。知识单元间的连线不但反映了其共现关系,还反映了其共现强度。共现强度越大,两个知识单元间越容易发生知识流动,一个知识单元在网络中与其他知识单元的共现强度总和越大,知识越容易通过它进行流动。知识群中的成员与其他知识群成员的连接强度总和越大,表明该知识群越容易通过它与其他知识群产生知识上的关联。因此,可以构建如下指标来反映知识群间的关系:首先分别计算某个知识群中各成员与其他知识群的连接强度和,其次取其中外部连接强度总和最大值的那个点做为该知识群与其他知识群联系的主要节点。这个连接强度总和我们称之为外部连接度(external linkness),表征了知识群内部成员与外部的知识沟通能力。最大值的知识单元表明了该知识群与外部沟通的主要通道,即该知识群最容易通过这样的点与其他知识群产生联系。同时,它也是决定该知识群在整个网络中所处位置的重要因素。很明显,每个知识群都有一个这样的点。这些点之间的联系,则构成了各知识群知识交流的骨干网络。

3.2共词知识网络认知结构的构建方法与过程 1 数据的收集与去噪

随着计算机技术的普及与发展,使得大型结构化的科学论文数据库得以建立。如1965年加菲尔德建立的SCI数据库以及中国建立的CNKI数据库和万方数据库等。这些数据库收集了大量的科学论文,并提供包括论文标题、摘要和关键词等结构化信息。利用这些数据库,我们就可以通过检索得到相关学科或领域的某一时期的研究论文,并以结构化的形式通过计算机加以分析利用。在检索得到的论文中,首先要对数据进行去噪处理。对关键词而言,主要是合并同义词。如是英文,则还要根据名词的单复数进行合并。对专业词汇,则需要借助专家的指导。

2 关键词共现矩阵的提取与处理

一般而言,每篇科学论文中都包含3-5个关键词。这些关键词之间形成了所谓的共现关系。对给定的科学论文集合,我们就可以通过统计任意两个关键词之间的共现次数,从而得到关键词间的共现矩阵。该矩阵为一对称方阵,并规定关键词与自身共现的次数为0。这时得到的矩阵其中的数字表示了任意两个关键词在给定论文集合中共现的绝对次数。其次,统计矩阵中各关键词在给定集合中出现的次数,并利用余弦指数计算任意两个关键词间的共现强度,从而把关键词共现次数矩阵转化为共现关系矩阵。余弦指数的计算公式如下:

Cosine =                       1

其中FA)表示关键词A在给定文献集合中出现的次数;FB)表示关键词B给定文献集合中出现的次数;FAB)表示关键词AB共同出现的次数。该指数的取值范围在01之间,值越大,表明关键词间的共现强度越高。

3)利用共现关系矩阵生成关键词聚类[20]

1)从关键词关系矩阵中找到最大共现值的那对词,做为一个知识群的起始单元。这对词我们可以视其为相应聚类的研究主题。

2)找出与这对起始单元中的任一个有共现关系的关键词,并按余弦指数进行降序排列成表;

3)从这个表中依次选择关键词放入相应的知识群中,直到其中的成员达到10个为止。这里出于分析方便的考量,人为规定每个知识群最多10个关键词。另外,有些知识群中的关键词也可能会少于10个。

4)从矩阵中把这些已进入知识群的关键词删除。然后重复步骤(2)到(4),直到所有关键词都进入相应的知识群中为止。

4 提取各聚类中外部连接强度和最高的关键词

给定文献集合中任意关键词在共现关系矩阵中的外部连接强度和由下式计算:

                           (2)

其中,Si为关键词i的外部连接强度和;Cik为关键词i与其他关键词k的共现强度,n为关键词总数;Cij为关键词i与其所处同一聚类中的其他关键词j的共现强度,m10

取各聚类中Si值最高的关键词。

5 共词知识网络认知结构的建立

在斯莫尔[21]的方法中,首先要人为确定一个起点和终点做为路径的首尾两个端点,知识群内部的路径按最小生成树原则原定,外部的路径则以两个知识群间权重最大的那条边做为知识群间的联系通道。与斯莫尔不同的是,本文把路径的起始点规定为具有最高外部连接度的点,路径的范围也限定在所有知识群各自的最高外部连接度的点之间,不涉及知识群内部的路径选择。路径确立的方法则同为最小生成树法则。利用步骤4提取出的各聚类中的外部连接度最高的关键词间的共现关系,我们就可以构建连接各聚类的知识链路,也就是共词知识网络中的认识结构。其具体过程如下:

首先确定外部连接度最大的那个点,做为路径的起始点。与其连接强度最大的其他点做为第二个点,从网络中删除起始点,以第二个点做为起始点,再寻找与其连接强度最大值的点做为路径上的第三个点。依次重复这个步骤,直到所有点都进入路径为止。注意,因为不能保证取得的各知识群最高外部连接度的点相互间都有连接,所以路径在生成时有可能中断。如果出现这种情况,则把中断点与其有最高连接值的点相连,然后重复前述步骤。此时的路径将具有带分支的树形结构。

4         可能的应用

各知识群中最高外部连接度的成员在知识群中有两种位置:非聚类起始点与聚类起始点。聚类起始点在知识群内部具有最高的中心度,是相应知识群的“核”。一般情况下,生成知识群的起始词在整个网络中的词频与中心度都不高[23]。这个特点决定了知识群起始词一般不具有最高的外部连接度。反之,知识群中最高外部连接度的词由于与其他知识更容易建立联系,也就是说更容易整合其他知识,从而起着类似知识基因的作用:知识群以它们为基础生成,并主要通过它们与其他知识群产生知识联系。具有这样特征的知识单元一但成为知识群起始词并形成知识群,则往往意味着新领域或前沿的产生。

利用具有上述特征的知识单元间的共现关系,我们可以通过某种规则建立一条遍历各知识群且具有最大知识流动路径的知识链,也即供词网络认知结构的具体形式。知识群通过最高外部连接度的知识单元所形成的共词网络的认知结构,可以分成静态与动态两种形式。在静态结构中,可以通过赋予知识群以时间参数,从而可以确定知识群间知识的流动方向,就可以看到研究者们怎样在密切的学科领域中相互影响,接受情报,构成知识,创造新情报的过程;在动态结构中,通过考察不同时间段共词知识网络的认知结构,分析其知识连接方式的变动情况,就有可能从知识的遗传与变异角度总结知识的变化与活动模式,从而有助于对知识的利用。

normal align=left>当然,任何理论与方法的有效性都要接受实践的检验。这将在本文的第二部分通过案例加以验证。

normal align=center>参考文献

 [1] 王晓光. 科学知识网络的形成与演化(I):共词网络方法的提出[J]. 情报学报, 2009, 28(4): 599-605.

 [2] Callon M, Law J, Tuner W, et al. from translations to poblematic networks: an introduction to co-word analysis[J]. Social Science Infornation, 1983, 22: 191-235.

 [3] Callon M, Law J, Rip A. Mapping the dynamics of science and technology: sociology of science in the real world[M]. London: The Macmillan Press Ltd, 1986: 10.

 [4] He Q. Knowledge discovery through co-word analysis[J]. LIBRARY TRENDS, 1999, 48(1): 133-159.

 [5] 许振亮,刘则渊,侯海燕等. 中国技术创新理论研究前沿共词知识图谱分析[J]. 图书情报工作, 2009(6): 46-50.

 [6] 姜春林,杜维滨,李江波. 经济学研究热点领域知识图谱:共词分析视角[J]. 情报杂志, 2008(9): 78-80.

 [7] 王晓光. 科学知识网络的形成与演化():共词网络可视化与增长动力学[J]. 情报学报, 2010, 29(2): 314-322.

 [8] 马费成,刘向. 知识网络的演化 (III):连接机制[J]. 情报学报, 2011, 30(10): 1015-1021.

 [9] 赵蓉英,邱均平. 知识网络研究(I)—知识网络概念演进之探究[J]. 2007, 26(2): 198-209.

[10] Brookes B. C. 情报学的基础(四)[J]. 王崇德,邓亚桥,刘继刚译,王勇校. 情报科学, 1984, 5(1): 66-77.

[11] Popper Kr,纪树立编译. 科学知识进化论—波普尔科学哲学选集[M]. 北京: 生活·读书·新知三联书店, 1987: 197.

[12] Popper K R. Objective knowledge: an evolutionary approch[M]. 1972.

[13] 刘则渊. 赵红州与中国科学计量学[J]. 科学学研究, 1999, 04(17): 104-109.

[14] 刘则渊,刘凤朝. 关于知识计量学研究的方法论思考[J]. 科学学与科学技术管理, 2002, 23(8): 5-9.

[15] 赵红洲,蒋国华. 知识单元与指数规律[J]. 科学学与科学技术管理, 1984, 9: 39-41.

[16] 文庭孝. 知识单元的演变及其评价研究[J]. 图书情报工作, 2007, 51(10): 72-76.

[17] 刘则渊,侯海燕,陈超美等. 知识计量学及其可视化技术的应用研究[A]. 跨越学术分水岭:科学的科学、计量、哲学与政策研究[C]. 刘则渊. 北京: 人民出版社, 2012.

[18] 刘植惠. 知识基因探索()[J]. 情报理论与实践, 1998(01): 62-64.

[19] 陈晓荣,丁瑨,韩丽川. 知识网络连接机制对知识扩散的影响[J]. 中国管理科学, 2007, 15(专辑): 166-169.

[20] Callon M, Courtial J, Laville F. Co-word analysis as a tool for describing the network of interactions between basic and technological research: the case of polymer chemistry[J]. Scientornetrics, 1991, 22(1): 155-205.

[21] Small H. A passage through science: crossing disciplinary boundaries.[J]. Library trends, 1999, 48(1): 72-108.

[22] Simon H. The scirnces of the artificial[M]. Cambridge, MA: MIT Press, 1969.

[23] Cobo M J, López-Herrera A G, Herrera-Viedma E, et al. An approach for detecting, quantifying, and visualizing the evolution of a research field: a practical application to the fuzzy sets theory field[J]. Journal of Informetrics, 2011(5): 146-166.

 


基金项目:国家自然科学基金项目(批准号:70773015);项目名称:基于技术科学的前沿技术知识图谱及强国战略研究

  (1970-)男,汉族,四川内江人,郑州航空工业管理学院讲师,大连理工大学博士毕业,研究方向为科学计量学、科学学理论、情报分析、科研评价等。E-mail: tengli1970@163.com

本文地址:http://lianchengexpo.xrbh.cn/news/13860.html    迅博思语资讯 http://lianchengexpo.xrbh.cn/ , 查看更多
 
标签: 认知结构 网络
 
更多>同类行业资讯
0相关评论

新闻列表
企业新闻
推荐企业新闻
推荐图文
推荐行业资讯
点击排行