引文共现与分析软件Bibexcel
瑞典科学家佩尔松(persson)开发的文献计量学研究软件Bibexcel[7]用于帮助用户分析文献数据或者是文本类型格式的数据,实现引文分析。Bibexcel处理的数据来自集成在ISI Web of Knowledge平台上的数据库,包括Web of Science数据库、Derwent Innovation Index数据库和Medline数据库等。Bibexcel除了对来源于上述数据库中数据的相关知识单元(作者、关键词、参考文献等)做频次分析和排序外,还实现了知识单元的共现关系矩阵。将产生的共现数据存入excel表格中,借助Ucinet、Netdraw可视化软件,做进一步的可视化分析。Bibexcel界面如图1所示。
Bibexcel构建知识单元共现关系矩阵处理流程如下:
Step1:打开Bibexcel,出现上图所示的操作界面,在select file here这个框
口中选择数据源所在的文件夹,右边的窗口会显示出这个文件夹中的所有文件。选中合并后的文本文档,先点击“Edit doc file----Repalce line feed with carriage return”点击“Misc---convert to diologe format---convert from web of science”,会弹出一个对话框,点击“确定”,就会生成一个后缀名为.doc的文件;
Step2:选中.doc文件,点击View file按钮,The list窗口就会显示这个文件
的内容。根据你要分析的知识单元,在Old Tag中填写相应的标签代号。作者、关键词、机构、参考文献、被引期刊的标签依次为AU、DE、C1、CD、CD。输入相应的标签后,在Select field to be analysed下拉列表框中选择“Any ; separated field”;如果要分析被引期刊,在输入CD标签后,在Select field to be analysed下拉列表框中选择“JN-Journal”,然后点Prep按钮,在弹出的对话框中,点击
“确定”,生成后缀名为.out文件;
Step3:选中.out, 在Frequency distribution(频率分布)下拉列表框中选择相
应的分析对象,如果分析作者共现,选择“Author”;如果分析关键词共现,选择“whole string”;如果分析机构共现,选择“whole string”;如果分析参考文献共现,选中“Cited Reference”; 如果分析被引期刊共现,选择“whole string”;选择相应的分析单元后,在下面的复选框中选择“Sorted descending(降序排列)”,点击Start按钮,在弹出的窗口中,点击“确定”,生成后缀名为.cit文件;
Step4:选中.out文件,在Frequency distribution下面的复选框中选择“remove
duplicate(取消复制)”和“make new out-file(生成新的out文件)”,点击Start按钮,在弹出的窗口中,点击“确定”,生成后缀名为.oux文件;
Step5:选中.cit文件,点击“view file”, 在The List显示窗口中选择频次较
高的前多少位分析对象,然后点击“Analyze----co-occurrence----select units via listbox”,然后选中.oux文件, 点击“Analyze----co-occurrence----make pairs via listbox”,在弹出的窗口中,点击“否”,此时生成后缀名为.coc文件;
Step6:选中.cit文件,同样点击“view file”, 在The List显示窗口中选择频
次较高的前多少位分析对象,然后点击“Analyze----co-occurrence----select units via listbox”,然后选中.coc文件,点击“Analyze----make a matrix for MDS etc”, 在弹出的对话框中,按照提示,点“是”还是“否”,选择生成方阵还是下三角矩阵,生成的共现矩阵文件名为.ma2,将其打开,另存为后缀名为.xls文件。
一般用户都需要一个含有.coc文件中项目的正方形矩阵。为了把.coc文件中数据列表转换为矩阵,像从前那样选择同样的单词加亮它们:使用“analyse: coocurrance: select units via listbox”,然后选择你的.cit文件,操作“analyse: make a matrix”,生成一个.ma2结果矩阵文件,由于它仍然是纯文本文件,可以用于其他程序中。
将这些矩阵文件输入到UCINET等其他程序中的一个问题是,矩阵中只有每一列的顶部带有标签而侧面行则没有,解决问题的办法就是重新构建矩阵。这就需要先把.ma2文件转换并且保存为到excel文件。即打开该excel文件,先插入一个新的空列,再把顶部第一行拷贝下来,然后选择“edit(编辑): paste
special(选择性粘贴): transpose(转置)”,点击“确定”后就把标签加到每一行的前面了。这就生成了一个带有完整标签的正方共现矩阵,更像一个四格表可以输入到SPSS中进行因子分析,对项目进行统计分组。
至此,文献数据知识单元共现关系矩阵构建完毕。Bibexcel可以构建作者共
现矩阵、关键词共现矩阵、机构共现矩阵、参考文献共现矩阵。为了直观理解各知识单元之间的共现关系,需要进一步借助可视化分析软件来实现。先使用Ucinet软件将.xls转化为后缀名为.##文件后,再借助Netdraw可视化软件将知识单元之间的共现情况清晰的描绘出来,并分析图谱中节点的中介中心性和边的关联强度等。
Bibexcel在共现分析中的优势与不足
Bibexcel的强大功能在于知识单元的共现关系分析,对英文文献数据或专利
数据的共现关系分析已经取得令人满意的结果。如栾春娟《专利计量研究国际前沿的计量分析》[7] ,对1995-2007年期间《科学计量学》出版的关于国际专利计量研究的论文和引文进行计量分析,通过Bibexecel处理,得到高被引作者共被引矩阵、高频关键词共现矩阵和高频次作者共现矩阵,再通过Ucinet绘制作者共被引网络图谱、高频关键词共现网络图谱和高产作者学术合作网络图谱。但是,在CSSCI文献数据库中,Bibexcel对中文献数据的分析存在着局限性,主要原因是在于Bibexcel不能直接处理CSSCI格式数据。
中文社会科学引文索引(CSSCI)作为我国社会人文科学主要文献信息查询
与评价的重要工具,CSSCI提供来源文献、被引文献、优化检索等多种信息检索。该项目成果填补了我国社会科学引文索引的空白,达到了国内领先水平。从CSSCI下载某一领域的相关文献,并对其进行分析,不但可以科学合理、客观公正地评价人文社会科学研究的成果,而且对了解国内的研究现状和研究热点,因此具有非常重要的现实意义。
You must eslect a pair file (freq+tab+unit+tab+unit)in order to make a matrix!but first, view the cit-file and select the units that you wish to include in the matrix.
你必须选择一个准备做矩阵的文档,但首先要查看cit文件并选择制作矩阵的项目。 是
Do you wish to make a lower left matrix.你是否希望做一个左下矩阵 否
Do you wish to make a squared matrix. 你希望做一个方形矩阵。 是
If a squared matrix, should it be a transpose of the lower left part? 如果一个方形矩阵,它应该是左下部分的转置? 否
Do you wish to sort the matrix columns?if you answer ?No?, the order of the columns will be exactly as you have indicated in “The List”!
您是否想排序矩阵列?如果您回答?No?,表明列的顺序已经准确出现在“The List”中了! 是
If numerical values/units you should sort the numerically and ascending. Shall I do that? 假如数值或者项目已经按升序排列,如何选择? 是
Your matrix will have: 45 units, and the matrix will contain 990 cells for a lower left matrix! Do you wish to continue or would you rather want to reselect the units to be include?
你的矩阵包含:45个项目和990个单元格。你希望重新选择所包含的项目继续么? 是