【参数配置】中: 数据源信息:填写数据源信息,有一定语法规则; 网页资源:填写该部件输出的HTML内容使用的样式、脚本文件; 网页内容:填写该部件输出的HTML内容,用于提取数据的代码有一定语法规则; 参数设计器:当对部件语法规则不熟悉时,点击进入“参数设计器”,用可视化的方式完成数据源信息、网页资源、网页内容的填写。 使用部件的前提:准备好所配置区域的HTML 参数设计器:
代码。 将被提取数据的站点地址添加入“站点URL”,点击“加载站点结构”。站点加载后,展开,原则上里面所列均可进行配置。如提取新闻信息,选择“页
面”。
选择“页面”后,数据源配置区域会展开可进行配置的所有字段,这些字段是“页面”中文件(也即新闻)所具有的字段,部分字段存在于页面中,部分字段存在于页面“属性”中。
“计划开始时间”对应文章的发布时间,用于页面显示,“联系人”用于筛选数据源本次应用的重要属性,注意不是“作者”。
“显示标题(聚合页)”用于组建新闻列表时显示标题,注意,这里应选择“显示标题(聚合页)”不是“标题”或者“显示标题(细览页)”,三个属性代表不同的内容。
“排序序号”和“是否排在固定位置”可用于新闻置顶,属于常用属性,本次应用示例中没有相关要求,所以没有使用。
保存配置好的数据源,其中:
(1)数据源取唯一标识(ID):可为数字或字母,或二者组合,注意保持唯一性;
(2)数据源最大行数:填写新闻显示的个数。
填写完成后,点击“保存数据源配置”,在下面对话框中会出现此条数据源配置的记录。对于这条记录,可以相应做编辑或删除操作。本次应用中需要同时从三个频道筛选新闻数据,所以一共设置了三个数据源。
数据源配置完成后,展开“CSS和JS”区域,对应部件的“网页资源”区域。此区域可填写部件输出HTML所使用的样式或脚本文件。注意,不推荐使用该方法实现css和js,最好写成单独的文件加载,提供资源利用率。
“CSS和JS”区域填写完成后,展开“HTML代码”区域,首先将HTML代码复制进去。
以提取多行新闻标题信息为例,我们把一条完成的新闻标题信息称作“循环体”,而多条信息认为是一条信息的“循环”。所以下一步要做的,就是找到HTML代码中循环的部分,删掉多余循环体。
即只保留一条语句作为循环主体。
选择“设置循环条件”—“选择数据源”,选中待循环部分的代码?,点击“替换”,在循环部分外层会出现 ?,
这样就实现了循环提取数据功能。设置好后,选择“关闭”即可。
注意本次应用中需要按信息来源设置筛选条件,在设置循环条件时选中“联系人”并设置筛选条件,如筛选出来源为“贾雄鹰”的信息,可设置“联系人”等于“贾雄鹰”:
设置后,循环体外层变成:
选择“替换为数据值” —“选择数据源”,依次选择数据字段,设定最大字数,选中需要替换的HTML代码,点击“替换”即可,如“显示标题(聚合页)”替换文字部分,“计划开始时间”替换日期部分等。