《中国中医急症》杂志社
首页 > 期刊导读
 
/ / /
 

中美省州级政务服务站内搜索引擎功能对比研究

 
来源:中国中医急症 栏目:期刊导读 时间:2021-05-20
 

2019年10月31日,中国共产党第十九届中央委员会第四次全体会议通过《中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定》。决定指出,“创新行政管理和服务方式,加快推进全国一体化政务服务平台建设,健全强有力的行政执行系统,提高政府执行力和公信力”[1]。国务院于2019年4月26日颁布《国务院关于在线政务服务的若干规定》,指出在线政务服务是“为了全面提升政务服务规范化、便利化水平,为企业和群众提供高效、便捷的政务服务,优化营商环境”[2]。在各级的政务服务平台上,如何精确定位具体政务服务,是向全社会提供“互联网+政务服务”的首要工作。本文从情报学角度出发,以“服务搜索引擎”为研究对象,比较中美两个具有可比性的大国在精确定位在线政务服务上的差异。

1)研究对象特征说明

章燕华最早将政府网站搜索内容分为两类:一类是提供一般信息浏览和信息查询,对用户来说是查知性搜索,即信息(狭义)搜索;另一类则是通过查询特定的信息以便最终实现在线服务的搜索,即服务搜索[3]。

服务搜索引擎是政府网站搜索引擎系统的重要组成部分,与通用站内搜索的差异主要体现在3个方面。第一,搜索对象不同。服务搜索引擎针对“服务事项”,通用站内搜索针对“网页文章”。第二,搜索要求不同。服务搜索引擎以精确定位“服务事项”为主旨,重在“查准”,通用站内搜索通常意在收集与主题相关的政府文件及新闻,需要兼顾“查全”与“查准”。第三,搜索难度不同。事项的归属和管理往往对应于不同的行政层级,用户对于事项行政层级特征是否具有明确的理解,会直接影响服务搜索质量。

2)具体研究对象的选择

联合国每两年推出一份《电子政务调查报告》,在2020年的报告中美国排名第9位,我国排名第45位[4]。自2001年以来,美国一直属于全球电子政务发展的领先国家,而且从国土面积、人口数量、经济体量等多因素考虑,中美两国具有较强的可比性,因此以美国作为我国电子政务发展的参照系较为科学合理。本研究调研中国省级政务服务平台和美国州级政府网站上对于服务事项的搜索现状,发现它们存在的差异,并提出对应的解决方案。需要说明的是,美国州级政府普遍没有建设政务服务平台,因此其服务搜索并没有在形式上从通用站内搜索独立出来;而我国的服务搜索引擎普遍独立于通用站内搜索。

3)研究路径

本文的研究分3步进行。

第一步,通过文献调研,从中外对于政务搜索(检索)的历史研究成果中,梳理研究发展脉络,明确服务搜索引擎研究的指标。

第二步,采用网上调研的方式,运用构造的关键词,在美国各州政府网站和我国各省政务服务平台上搜索常见个人事项“机动车驾驶证核发”和法人事项“注册有限责任公司”,采集服务搜索的特征和搜索结果进行量化分析。

第三步,立足两国在服务搜索中体现的差异,提出我国服务搜索的改进策略。

1 政务服务搜索引擎研究综述

1.1 国内研究综述

截至2020年8月8日,在CNKI数据库中以“TI=(“政府”+“政务”)*(“搜索”+“搜索”)”为检索式,共获得文献105篇;其中包括20篇非相关主题论文,讨论“人肉搜索”“政府工作报告内容搜索”等内容;其余85篇论文,从各角度对政务领域的信息搜索问题进行分析,下面分别从搜索手段、搜索技术、搜索系统问题3个方面说明研究进展。

从搜索的手段看,随着各类政府信息资源依托互联网存在,搜索引擎[5]逐渐替代以“目录、索引、文摘”[6]为代表的纸质检索工具。为实现政府网站信息资源的发现和利用,围绕搜索引擎的研究逐渐分为两个方向:一是立足站内搜索的搜索系统建设及优化研究,以黄晓芹的研究为代表,分析了信息采集和搜索系统的开发思路、总体框架和主要功能[7];二是政府网站面向站外的商业搜索引擎(谷歌、百度等)优化研究(Search Engine Optimization,SEO),以于施洋等的研究为代表[8],着重分析通过调整网站组织和导航,提高网站页面的搜索引擎可见性。

从搜索系统所采用的技术看,各类主流的搜索技术逐个粉墨登场,相互组合融合以实现最优的搜索结果。盛苏平等首先将“主题法”引入电子政务领域[9],攸金娣等接着提出在电子政务中使用“全文检索”技术[10],孟涛等进而基于移动主体在电子政务中采用“XML”实现智能搜索[5],孙中华等又提出通过“非监督视频结构化”来实现政务视频检索的方法[11],继而杨芳等借助“语义网”和“元数据”实现电子政务文档的智能检索[12],吕翔设计了基于“本体”的政府信息资源检索系统[13]。孟庆国等的最新研究发现当前针对政务服务的搜索存在“搜不到、搜不全、搜不准、体验差”的问题,多层面分析后提出“基于资源画像建立知识图谱、基于用户画像构建需求模型、基于需求理解实现最佳匹配”的“智能搜索”方案[14]。

从搜索系统存在的问题看,用户对专业知识的不足是主要的矛盾。于静等认为,“由于对政务信息领域知识的缺乏,用户不能很好地提出符合自己检索需求的检索条件”[15]。张苗苗等认为,“政府网站通常根据其内部的组织机构来划分板块或进行信息分类”,用户“对于政府机构职能部门的职能划分、业务以及权限并不清晰”的限制,导致信息需求无法得到满足[16]。

1.2 国外研究综述

由于“服务搜索引擎”属于搜索引擎的分支,且政务服务在英文语境下可能有多种表达,因此采取较为宽泛的检索策略查找外文文献。截至2020年8月8日,在Web of science数据库核心合集中以“TI=(Search+Retrieve+Find)*(“Website”+“Web Portal”+“Webpage”+“APP”+“Mobile”)”为检索式,共获得记录609篇;经人工过滤,剔除523篇非相关主题论文,主要讨论“机器人移动的环境搜索”“查找医疗信息的APP功能”等内容;在符合“搜索引擎”主题的86篇论文中,大量研究指向通用的移动搜索和商业搜索,针对政务领域的搜索研究数量较少。

外国学者针对政务领域搜索的研究,与国内的思路相似,主要从站内搜索优化、商业搜索利用和分析两方面切入,但国外的研究大量采用了网站搜索日志作为分析数据来源。Ravid G等分析以色列公民咨询局网站访问日志,发现大量来自商业搜索引擎的外部请求,日志可以很好地反映用户的需求和意图[17]。Lambert F在从加拿大安大略省的两个城市政府网站3年的站内搜索日志分析用户的需求特征,证明两个网站的用户具有相似性的信息需求,认为政府网站能提供所有类型的信息[18]。Serrano-Cinca C等分析了西班牙城市网站的商业搜索结果与政府网站服务的匹配度,发现城市网站的排名不够理想,应该增加在社交网络中的可见性[19]。Henman P等通过对比英国政府网站站内搜索和谷歌商业搜索结果,发现门户网站在查找公共服务信息方面提供了更高的准确性,但搜索速度不快,应该将商业搜索结果纳入对政府网络门户网站的有效评估中[20]。Vyas C直接采用多个SEO工具,对印度政府和5个州的旅游网站进行评估排名[21]。

综上可见,国内学者主要从搜索引擎的外在特征分析搜索功能,国外学者更多通过搜索日志来探索用户需求,但是由于政务服务平台的建设刚刚兴起,因此针对“服务搜索引擎”的研究尚未从政府网站的站内搜索研究中独立出来,当前并未成为学术界广泛关注的研究对象。但是,现实中我国已经开通各级政务服务网站,并以省级平台作为省、市、区、街道乡镇政务服务的集中平台,服务搜索引擎的质量直接影响服务的可获得性,针对服务搜索引擎进行研究具有现实的必要性。

1.3 国内外政府网站搜索引擎的分析指标梳理和汇总

对中美省州级政府网站上的服务搜索引擎进行对比研究,需要选择合适的评价分析指标。下面罗列出从国内外相关研究文献中采集的指标,分为①搜索性能、②搜索设置、③结果展示、④索引功能4类,并分析用于服务搜索引擎分析的适用性,如表1所示。

表1 搜索引擎评价分析指标汇总表指标名称指 标 说 明类别适用查全率[22]Recall(召回率),检出的相关信息量与总量的比率。通过多个搜索引擎的结果集合来判别某个搜索引擎的查全率[23]①否查准率[27]Precision(精确率),检出的相关信息与检出的全部信息的百分比①是查询耗时[24]搜索返回结果的时间,在限定时间内完成查询的数量①否错链数量[25]结果中错误链接数量①是结果点击情况[26]用户点击搜索结果的记录,可观察到的用户行为与搜索质量之间的关系①否有效时间比率[27]有效时间比率衡量的是用户花费在获取相关信息上的有效时间与总搜索时间之间的比率①否平均精度[28]Mean Average Precision(MAP),搜索每个相关文档时获得的精度值的平均值①是均值倒数排名[28]Mean Reciprocal Rank(MRR),命中记录排名值的倒数的均值。如排名第7的是相关记录,则倒数值1/7,将前20条记录中命中记录的排名倒数再求平均值可得①否结果包含指向结果的链接[29]相关和有用的文档对几乎所有进行搜索的人都非常有用,并且可能包含指向得分为5的页面的链接①否选择多个测试关键词[30]如“天使”与“安琪儿”同义,将两者搜索到的结果合并①是稳定性[31]比较多次搜索的搜索结果,数量是否稳定,搜索得到的页面是否稳定,页面排名是否稳定①否用户满意[32]用户对搜索耗时、搜索界面、搜索显示、搜索交互、搜索精确度①否搜索结果重叠[33]document-overlap,两个搜索引擎搜索结果的重叠情况①否括号的使用[34]能使用括号表达查询内容②否相关词推荐[35]根据搜索日志,识别用户行为,形成热词库,进行相关推荐②是个性化[35]保留用户的搜索词,便于后续搜索②是高级检索[36]索引号、名称、生成日期、发布机构、信息分类、著录日期等核心元数据在高级搜索中出现②否多词检索[36]支持输入多个词汇进行组合检索,按照从“逻辑与”到“逻辑或”的方式组配②是搜索引擎位置[37]在首页、二级页面,在页面顶端或者中下部②是模糊检索[42]支持分词、纠错、模糊检索、拼音和繁体检索②是附加搜索[38]表单库搜索、召回库搜索、政府博客搜索、视频搜索、政府移动应用搜索等辅助搜索方式②否目录检索[39]根据用户心智模型设计网站分类目录②是分栏目检索[40]搜索引擎是各栏目独立检索还是全局综合检索②否检索范围[45]本站检索或网站群检索②是异常字符处理[41]当异常字符“、”“?”“#”等出现在关键词里,搜索引擎能识别和处理②是缺失词处理[46]搜索引擎能识别描述对象词组中缺失的词,并自动补足②是命中排名[42]第一个命中结果的位置③否相关性排序[43]对搜索结果进行相关性排序③是输出格式[44]关键词高亮显示,输出格式包含详细信息,便于用户判断③是聚合结果[49]跨栏目、跨分类整合网站中的各类服务资源,以聚合的形式向用户呈现搜索结果③是改变关键词的顺序[45]当改变关键词顺序后,搜索结果可能不同③是索引更新时间[46]搜索引擎索引的更新频率④否

2 研究设计与实施

下面从实验方案设计、方案预测试、方案实施3个方面介绍研究设计与实施。

2.1 实验方案设计

根据服务搜索评估目的,根据中美对比和中英语言特点设计具体实施方案,在中国34个(含港澳台)省级政务服务平台上,定位于省会城市(或经济最强城市)的人口最多的区,按照“事项名 区名”方式查找申办驾驶证和注册有限责任公司两个事项的办事指南。在美国51个(含哥伦比亚特区)州级政府网站上,定位于州首府城市(或经济最强城市)的人口最多的区,按照“事项名 区名”方式查找申办驾驶证和注册有限责任公司两个事项的办事指南。采集所有搜索的第一页结果。搜索设计涵盖搜索位置、近义词、多词搜索、相关词推荐、个性化、模糊搜索、异常字符处理、缺失词处理、改变关键词的顺序、搜索范围、目录检索、输出格式、聚合结果、平均精度等内容。

2.2 实施方案预测试

在中美分别选择3个省(州)进行预测试,选择的依据是2018年人均GDP,分别选择排序最高、最低和中间的3个省(州)。因此,首先需要采集调研所需的基础信息,依据各省人均GDP[47](港澳台数据来自世界银行等组织[48-49],汇率为6.8785[50])对各省市进行排名,并确认每个省的经济最强城市(GDP)[51]的人口最多的区。

采用专业网站数据采集工具八爪鱼,对搜索结果进行采集,采集字段主要包括3个:标题、链接、摘要。通过这3个字段,可以明确判断该搜索结果是否属于命中记录。从5月18日到5月22日,分别对中国经济强中弱3个省市(北京、海南、甘肃)和美国经济强中弱3个州(Massachusetts、Ohio、Mississippi)进行预测试。结果显示,通过在采集器中设置采集规则,对于结构简单的网站,可以连续搜索多个关键词并保存搜索结果,单个普通网站搜索数据采集时间可以控制在1小时以内,对中美省州级网站进行全面调研的方案具有可行性。

2.3 实验方案的实施

美国51个州级政府门户网站搜索结果数据的采集时间主要集中在5月26日至6月1日,中国34个省级政务服务平台搜索数据主要时间为6月9日至6月11日。因为所有数据在美国采集,部分中国网站因为改版、试运行、无法访问等原因采集较为困难,尝试多次采集,因此时间拖后;在后期数据处理中,也发现部分数据采集失败或错误,又重新调整策略进行采集。

对于每个搜索引擎,各采集了51个字段的数据,其中T1~T28均为搜索结果数据,包括结果数量和平均精度,T29~T51是搜索设置、搜索结果呈现、目录搜索等内容,字段具体说明如表2所示。后期数据统计分析,采用R语言实现。

表2 政务服务搜索数据采集字段列表特征字段ID字段名举例说 明T01all120搜索结果数量之和T02all_搜索结果平均精度(0~1)T03X0110搜索1:非正式个人服务用词,中美分别搜索“驾照”“Drive License”T04X01_accuracy1搜索1精度T05X0210搜索2:较正式个人服务用词,中美分别搜索“驾驶证”“Driving License”T06X02_accuracy1搜索2精度T07X030搜索3:模糊搜索,中文的拼音和英语错误拼写,中美分别搜索“Jia Zhao”“Driver Lisence”T08X03_accuracy0搜索3精度T09X0410搜索4:个人服务用词+地名,中美分别搜索“机动车驾驶证 合肥 蜀山区”“Driver License Boston”T10x04_accuracy1搜索4精度表2(续)字段ID字段名举例说 明T11X0510搜索5:地名+个人服务用词,中美分别搜索“合肥 蜀山区 机动车驾驶证”“Boston Driver License”T12X05_accuracy1搜索5精度T13X0610搜索6:正式个人服务用词,中美分别搜索“机动车驾驶证”“Driver License”T14X06_accuracy1搜索6精度T15X0710搜索7:非正式法人服务用词,中美分别搜索“办企业”“Register a Company”T16X07_accuracy1搜索7精度T17X0810搜索8:正式法人服务用词,中美分别搜索“注册有限责任公司”“Register Lim-ited Liability Company”T18X08_搜索8精度T19X0910搜索9:正式法人服务用词+地名,中美分别搜索“企业设立 合肥 蜀山区”“Start a Business Boston”T20x09_accuracy1搜索9精度T21X1010搜索10:异常字符,中美分别搜索“注册?公司”“Register?a Company”T22X10_accuracy1搜索10精度T23X1110搜索11:不规范省略服务用词,中美分别搜索“注册有限公司”“Register Limit-ed Company”T24X11_accuracy1搜索11精度T25X1210搜索12:正式法人服务用词,中美分别搜索“企业设立”“Start a Business”T26X12_accuracy1搜索12精度T27X1310搜索13:时事热词,中美分别搜索“新冠”“COVID-19”T28X13_搜索13精度T29SE_location_rank2搜索引擎位置(中央编码为3,中部的上下左右编码为2,其余位置为1)T30title-content0可设置搜索字段(标题、全文)T31time0可设置搜索日期T32area0搜索范围设置(本站/网站群)T33platform1服务平台情况(有专门平台(栏目),且结构化梳理事项,编码为1;有平台(栏目),仅罗列事项目录,编码为0.5;无平台(栏目),编码为0)T34advanced_search1有高级搜索,编码为1,否则为0T35standard_terms1搜索时能提示标准用词,编码为1,否则为0T36history_term1提供历史记录搜索词,编码为1,否则为0T37related_term1提供查询相关词,编码为1,否则为0T38popular_search1提供热搜词,编码为1,否则为0T39location_set0服务平台上搜索时可以定位地点,编码为1,否则为0T40search_location0在搜索时设置地点,编码为1,否则为0T41jump_to_subsite0设置地点后直接跳转到子站点,编码为1,否则为0T42jump_to_district0定位到市获得搜索结果,编码为1,否则为0T43Jump_to_city0定位到区县获得搜索结果,编码为1,否则为0表2(续)字段ID字段名举例说 明T44directory9平台一级分类目录数,中国采用服务平台的目录数,美国采用整个网站目录数T45search_by_directory0能通过目录逐级查找到“机动车驾驶证核发”事项,编码为1,否则为0T46abstract1搜索结果提供摘要信息,编码为1,否则为0T47combine_results3搜索结果为多类型内容的聚合,记录类型数量T48rank_choice0提供排序选项,编码为1,否则为0T49SE_support0由商业搜索(如谷歌)提供支持,编码为1,否则为0T50country1国别,中国编码为1,美国编码为2T51pro-sta1中国省名,美国州名

3 政务服务搜索比较分析

下面详细分析两国存在的差异,政务服务搜索引擎(Government Service Search Engine)在以下段落中简称GSSE。

由于本研究采集数据属于全样本、小样本数据,难以符合正态分布的要求,因此需要运用两组独立样本非参数检验中的Wilcxon W等级和检验(Mann-Whitney U)来分析两国数据的差异性,具体采用R语言的函数进行检验。

3.1 中美服务搜索的差异情况分析

经整理,检验结果如表3所示,如果P-value>0.05,则表明差异不显著,反之则显示差异显著;为明确差异内容和性质,按百分比计算“中美差异=(中国均值-美国均值)/中国”。

如表3所示,在可比的45个字段中,中美不存在显著差异的内容有16个字段,分别为:总精度,搜索4、5、6、7、9、10、12的精度,搜索2、8、10、11、12的结果数量,提供历史记录搜索词、一级目录数,提供排序选项;中美存在显著差异的内容有29个字段,主要体现在大部分搜索的数量、各类搜索设置选项和结果设置选项上。下面逐一分析每个差异项目,先分析中国占优的10个项目,再分析美国占优的19个项目,这些差异有的源于两国国情不同,有的则基于网站搜索引擎本身的设计和算法,本研究主要关注后者。

表3 中美省州级政务服务搜索差异情况字段Wilcxon检验结果差异性中美差异(%)T01W=388,p-value=显 著-=778,p-value=0.4264不显著-1.54T03W=394.5,p-value=显 著-=598.5,p-value=0.01006显 著-=680.5,p-value=0.06878不显著-=1075,p-value=0.02239显 著=285.5,p-value=显 著-=216,p-value=显 著-11 =481,p-value=显 著-=725,p-value=0.1661不显著-=493.5,p-value=显 著-=773.5,p-value=0.3524不显著-=586.5,p-value=0.005523显 著-=995,p-value=0.09344不显著2.14T15W=631,p-value=0.01931显 著-=766,p-value=0.3494不显著-=701.5,p-value=0.1011不显著-=621.5,p-value=0.01346显 著-=587.5,p-value=0.005567显 著-=819,p-value=0.659不显著-=743,p-value=0.2226不显著-=1011,p-value=0.1717不显著5.95T23W=753.5,p-value=0.2734不显著-=618,p-value=0.01804显 著-=729.5,p-value=0.1683不显著-=1019,p-value=0.118不显著-0.10T27W=528.5,p-value=显 著-=159,p-value=1.64e-12显 著-=622.5,p-value=0.01944显 著-23.66表3(续)字段Wilcxon检验结果差异性中美差异(%)T30W=1241,p-value=显 著=1317.5,p-value=显 著=1028.5,p-value=0.004297显 著=1618.5,p-value=显 著=1096.5,p-value=0.001387显 著=450.5,p-value=显 著-=1011.5,p-value=0.1213不显著=1241,p-value=显 著=1147.5,p-value=0.003077显 著=1555.5,p-value=显 著=799.5,p-value=0.5427不显著-=501.5,p-value=0.000155显 著-=663,p-value=0.003411显 著-=1248.5,p-value=显 著=994.5,p-value=0.1814不显著=459,p-value=显 著-100.00

3.2 中美服务搜索的差异细项分析(中国占优)

下面按照差异程度,从高到低进行分析。

1)服务平台上搜索时可以定位地点

中国除港澳台和新疆外,所有服务平台的搜索都有这个功能,而美国各州均没有,原因主要是美国的州政府网站对于办事服务并没有建设一个跨层级的统一平台,因此不存在“通过搜索设置直接定位到具体地点的具体服务”的可能性,该差异是一个系统性差异,主要是由中美地方政府在服务分工上的差异决定的,我国省级政府要通过政务服务平台统筹管理全省各级(省/市/区县/乡镇街道/村居)的政务服务,而美国州政府的办事服务平台不具备这样的功能。

2)设置搜索日期

中国有55.88%的搜索提供了该功能。但是,从服务搜索目的出发,搜索日期并不是一个必须项目。首先,政务服务事项的办事指南可能并没有发布日期这个要素;其次,事项的办事指南可能会更新,但是更新后会覆盖原有版本,因此不存在要查找最新或者特定时段的办事指南的需求。

3)设置搜索字段(标题、全文)

中国有近半数的服务搜索提供此功能。从服务搜索目的出发,搜索字段也不是一个必需项目。由于政务服务资源具有特殊性,因此只需针对“事项名称”进行搜索即可,如用户在服务平台搜索“身份证”,推测需求应该是需要办理、补办身份证,所以该项目可以从服务搜索的功能中去除。

4)搜索范围设置(本站/网站群)

中国有20.58%的服务搜索提供此功能。从服务搜索目的出发,搜索范围设置和“地点定位”存在重复,我国的政务服务平台设计的起点就是全省政务服务资源的统筹管理,因此该功能就成为多余。美国的搜索引擎不设置此选项,其默认的搜索范围通常能涵盖政府网站群。

5)高级搜索

中国有32.35%的服务搜索提供此功能。由于政务服务名称通常是诸如“机动车驾驶证核发”这类由名字和动词构成的偏正短语,语法结构简单,搜索时不针对段落,因此高级搜索的各类选项也不是必需的。

6)政务服务平台

中国仅港澳台没有专门的服务平台。美国由于各级政府在管理政务服务事项时分工明确,因此即使有专门的服务栏目,也没有将服务要素结构化展示的做法。而且,中美国情差异还体现在,美国部分网站提供在线服务(online Services)栏目,该栏目下所有服务都是可以“全程网办”的;而我国所有的政务服务,无论是否全程网办都会展示在服务平台上。

7)提供相关词

中国有64.71%的搜索提供该功能。这个功能是基于搜索引擎对政务服务名称词表的调用,可以帮助用户定位具体的事项,如搜索“驾驶证”,搜索框弹出“机动车驾驶证核发、机动车驾驶证注销、机动车驾驶证延期申请”等包含该搜索词的事项,能避免用户因为不熟悉政务服务正式用词而导致的定位失败。因此,该功能应该进一步全国推广,美国也同样应该拓展。

8)搜索结果为多类型内容的聚合

中国有20.59%的搜索结果不分类,而美国有56.86%的搜索情况不分类。是否需要围绕办事服务,将信息资源分类提供给用户,尚可商榷。以北京为例,搜索“机动车驾驶证”后,结果界面分为“服务指南、办事指南、政策法规、智能问答、惠民便民地图、综合结果”6类,排在最前面的“服务指南”是一些相关的公示公告,“办事指南”可直达服务页面,这种分类较为合理;如果考虑到用户以办事为直接目的,可以将“办事指南”放在最前面。美国Connecticut州就没有分类提供搜索结果,排在最前面的是机动车管理局(Department of Motor Vehicles)的关于Driver License申办、更新的页面,也非常清晰可用。因此,在这个项目上,搜索结果是否分类不重要,分类后如何根据用户需求排序更为关键。

9)提供热搜词

中国79.41%的服务搜索和美国47.06%的搜索提供了这个功能。该功能是搜索引擎基于用户搜索日志来推测用户搜索行为,可以帮助用户迅速定位在特定时间内特别常用的服务,如浙江省的服务搜索提供“①义务教育阶段学生入学、②公积金查询、③社保、④小微通、⑤幼儿园儿童入园”这5个热点办事服务。这个功能很必要,应该在中美都得到进一步推广。

10)搜索2(较正式个人服务用词)搜索精度

在此搜索中,中国采用的词汇“驾驶证”是正式用词“机动车驾驶证”的一部分,因此命中记录的精度较高;而美国采用的词汇“Driving License”与正式用词“Driver License”是同根词,因此精度较低。这个差异与研究设计有关,由于语言的差异,难以精确控制搜索词“偏离”正式用词的程度。

4.3 中美服务搜索的差异细项分析(美国占优)

下面分别从搜索结果和各类设置两类分析,差异程度从高到低进行分析,如涉及搜索结果及精度,则将两者组合起来分析。

1)搜索3(对汉语拼音、英语词汇错误拼写的搜索)及搜索精度

在此搜索中,中国采用的词汇“Jia Zhao”是非正式用词的拼音形式,全国仅5个搜索获得了结果,且精度非常低。这主要是因为我国的服务搜索普遍没有提供对拼音的支持,而“驾照”本身的搜索结果也欠佳。美国采用的词汇“Driver Lisence”是正式用词“Driver License”的拼写错误版本,结果显示美国搜索引擎对这种错误的容错率是比较高的,而且很多网站还特定指出该拼写错误,提供了正确拼写的词汇。在这个问题上,拼音搜索意味着对特殊群体(文盲、儿童)提供支持,降低使用门槛,美国的经验可以参考。

2)搜索13(对时事热词的搜索)及搜索精度

在此搜索中,中国采用的词汇“新冠”不应大量出现在服务事项中,因此搜索结果少是预料之中的,但是精度仅达到11.18%就差强人意了;搜索到的错误结果,通常是将“新冠”分拆为“新”和“冠”来处理的。美国采用的词汇“COVID-19”是正式用词,而且由于美国并没有专门的服务搜索,因此搜索到大量的相关新闻。因此我国需要考虑对于搜索词汇的分词算法和词表更新问题,“新冠”这样的词汇不应该被切分后进行检索。

3)搜索1(对非正式个人服务用词的搜索)及搜索精度

在此搜索中,中国采用的词汇“驾照”是日常用词而非政务服务正式用词,但是含义与“驾驶证”一致,因此平均3.82条的搜索结果和46.62%的精度不够理想。美国采用的词汇“Drive License”是正式用词“Driver License”的不符合语法的同根词,美国的搜索给出了9.63的平均搜索结果和76.69%的搜索精度,而且很多网站指出了正确的词汇。因此,服务搜索应该持续更新政务服务词表,提供同义词、近义词扩展搜索,从而扩大搜索范围,提高搜索命中水平。

4)搜索5(对地名+个人服务用词搜索)

在此搜索中,采用的词汇“地名 机动车驾驶证”的目的是希望通过地名直接定位到在该地点获得相关服务的页面,但平均的5.29条结果显示搜索往往将地名和服务名分开搜索。美国的搜索有平均9.39条的结果,但是也同样无法做到“定位”。在这个问题上,我国仅靠搜索引擎设计者改进算法是不够的,后面将详细分析对策。

5)搜索4(对个人服务用词+地名搜索)

和搜索5的情况相似,该搜索目的也是地理定位特定事项,区别仅在于交换了地名词汇和服务词汇的顺序,我国平均5.50条的结果表明搜索对多词检索中各词汇的处理是有侧重的,第一个词汇的重要性更为显著。

6)搜索11(对不规范省略用词的搜索)的精度

在此搜索中,中国采用的词汇“注册有限公司”在正式用词“注册有限责任公司”上缺省了“责任”,美国采用的词汇“Register Limited Company”也在正式用词“Limited Liability Company”上缺省了“Liability”。此时,美国78.68%的精度相对于我国50.99%的精度就有明显优势。搜索引擎对于不规范词汇的处理,一方面可以积累不规范的词汇形成近义词词表;另一方面也可以通过构造算法处理相似度高的词汇以提升系统的容错水平。

7)搜索9(对正式法人服务用词+地名搜索)

此搜索类同搜索4、5,中美都难以达到“通过地名直接定位到在该地点获得相关法人服务的页面”的目标,但是我国平均6.32条的结果和美国平均9.45条的情况仍存在差距。

8)搜索7(非正式法人服务用词搜索)

在此搜索中,中国采用的词汇“办企业”比美国采用的词汇“Register a Company”更大众化,但是搜索结果7条与美国的10.24条差异显著。此问题同样需要持续积累扩充近义词词表才能改进。

9)搜索8(正式法人服务用词搜索)的精度

在此搜索中,中国采用的词汇“注册有限责任公司”和美国采用的词汇“Register Limited Liability Company”类似(美国的表达还有一个语法瑕疵,正确表达是“Register a Limited Liability Company”),但搜索精度比美国低22%。这主要还是词汇问题,“注册有限责任公司”这个词汇仍然不够“正式”,如在四川省该事项的标准表达为“有限责任公司设立登记”,这种由于动词差异带来的搜索失灵可以通过改进算法来修正,而完善以专用名词为核心的政务服务词表则更为关键。

10)搜索6(正式个人服务用词搜索)

在此搜索中,中国采用的词汇“机动车驾驶证”和美国采用的词汇“Driver License”都是正式用词,但是搜索结果平均7.26条与美国的9.90条差异显著。随着我国政务服务平台的事项全面入驻,这个问题解决在望。对于服务搜索而言,并非结果越多越好,最理想的状态是直接定位到用户需要的那一项当地服务;比较理想的状态是搜索出围绕特定用词(如“驾驶证”)的各项服务,从而减少因为动词使用不当导致的漏检。

11)全部搜索的结果

在13个搜索中,有8个都存在我国搜索结果数量显著低于美国,因此总数也显著低于美国,平均少40条。同样,服务平台的建设完善是改进的主要方向。

12)搜索时提示标准用词

中国8.82%的服务搜索和美国56.86%的搜索提供了这个功能。在我国语境下,当用户搜索“驾照”,应提示“驾驶证”;在美国,当搜索“Drive License”,应提示“Driver License”。该功能是沟通政务服务供给端和需求端的重要桥梁,可以帮助用户学习正式规范的词汇,从而提升搜索质量和速度,因此我国的搜索应该向美国学习借鉴。

13)通过目录定位事项

在这个项目上,26.47%的中国网站和68.63%的美国网站能通过目录逐级查找到服务“机动车驾驶证核发(Get a Driver License)”。美国网站能通过目录查找的主要原因在于服务事项资源结构较为简单,通常在居民(Residents)或服务(Services)大类下就会出现以驾驶证(Driver License)为主题的各类服务的列表。在我国的“个人办事”或“个人服务”大类下,虽然通常都有相关度较高的“证件办理”和“交通出行”两个主题,但是驾驶证的申领业务却难以直接找到。这种情况是我国政务服务平台服务资源与行政层级一一对应致使“服务资源地理分割”的必然结果,如果没有在负责该服务的站点(子站点)的目录下搜索,是无法找到该服务的。例如“机动车驾驶证核发”是区县级业务,就无法在省级平台的目录里找到,这种困境同样影响关键词搜索结果。

14)商业搜索提供支持

47.06%的美国网站搜索由谷歌或者必应提供支持,而我国完全没有这种情况。这种做法值得我国借鉴,因为专业的搜索引擎公司不仅在搜索算法上具有显著的优势,而且已经并将持续积累用户搜索行为数据,这些都能为搜索质量提供保证。

15)搜索结果提供摘要信息

70.58%的中国服务搜索和94.12%的美国搜索都在结果中提供摘要信息,这种做法有利于用户理解搜索结果并判断是否要打开具体页面,应该全面普及。

16)搜索引擎位置

中国服务搜索位置的平均得分为1.82,美国的搜索位置得分为2.25,意味着美国网站将搜索引擎放在更靠近中央的位置,这体现出网站设计者对搜索引擎更为重视。在用户已经形成搜索习惯的情况下,应该将搜索引擎放置在更醒目的位置上。

4 结论与发现

4.1 研究结论

经对比研究,从平均水平上看,中美省州级政务服务平台的服务搜索引擎在某些方面上存在相似的表现,也存在显著的差异。

1)中国GSSE在“设置搜索字段(标题、全文)、设置搜索日期、搜索范围设置(本站/网站群)、高级搜索”“搜索结果聚合”这些功能上显著优于美国,但不适用于服务检索,因此这些设置可以去除。中国GSSE在“提供相关词、热搜词”的功能上显著优于美国,这些功能应该继续推广。

2)中国GSSE的位置不如美国居中,显示出美国GSSE在网站设计中地位更加重要;美国GSSE在“提示标准用词”“提供摘要信息”功能上显著优于中国,值得我国学习借鉴。

3)中美GSSE在“提供历史记录搜索词”功能上表现无显著差异,该功能有助于用户进行多次搜索行为,可以继续采用。中美在“提供排序选项”功能上没有显著差异,但该功能与搜索结果没有显著相关,不符合服务搜索的特性,可以去除。

4)从搜索结果数量看,中美GSSE在搜索结果数量上差异显著,但搜索精度无显著差异。从差异出发,中国的GSSE需要持续完善政务服务的近义词、同义词词表,消除日常用词和政务服务正式用语之间的障碍,便于用户迅速查找服务。

5)中美GSSE在通过搜索“地名+服务名称”定位特定地点的特定服务时都差强人意,有待进一步探索。

综上可见,“热搜词、相关词、标准用词”等围绕词汇的搜索引擎功能直接影响了搜索结果,因此持续更新政务服务同义词、近义词词表,搭建用户和政府机构间在领域知识上的桥梁可以在很大程度上提升搜索质量。

4.2 研究发现:我国政务服务平台存在服务资源地理分割现象

4.2.1 服务资源地理分割现象及后果

我国各省都建设了统一的政务服务平台,但是事项资源按照行政层级管理,因此自然形成服务资源地理分割现象。通常,政务服务平台的站内服务搜索采用了两种搜索模式,一是局部搜索,即搜索引擎只覆盖本级政府办理的事项;二是全局搜索,即搜索引擎能覆盖各级政务服务事项。如图1所示,采用局部搜索模式下,服务资源地理分割完全阻碍了用户对服务的查询和定位。

图1 政务服务平台的局部搜索和全局搜索

如果用户拥有具体事项的办理机构的行政层级和办事地点的领域知识,只需要达到特定层级的子站点,无论通过目录检索或关键词搜索,都可以定位到本地特定服务。但是,当用户缺乏领域知识,会出现以下困境:

1)局部搜索无法获得结果

由于服务资源基于地理位置被各子站点分割,如果处在省级平台,就只能搜索到省级服务资源,市级平台可搜索到本市服务资源,以此类推。因此,用户很有可能没有在正确的子站点平台进行搜索,也就不能找到所需服务。如“机动车驾驶证核发”属于市级和区级事项,如果平台采用局部搜索模式,用户在默认的省级平台上搜索就没有任何结果。

2)全局搜索结果过多难以定位

由于每个行政区划下都有类似的服务,因此同一服务在总平台上会产生大量的“同质”资源,如果平台采用全局搜索,会导致搜索结果过多无法迅速定位。同样以“机动车驾驶证核发”为例,全省各市各区的该服务全部成为搜索结果,用户需要耗费时间再次地点定位。

3)各地服务资源建设参差不齐导致搜索落空

当前我国政务服务平台仍在建设中,部分服务的梳理尚未完成,这些服务是任何搜索都无法到达的。如实验发现,在浙江省政务服务平台上能通过“驾驶证 杭州 萧山区”或“杭州市 萧山区 驾驶证”,直接搜索到服务事项“萧山区|机动车驾驶证核发、审验(机动车驾驶证初学申领)”;但是搜索词换成“驾驶证 杭州 余杭区”,就不能得到精确定位到地点的搜索结果,因为该地区的相关事项当时尚未登陆平台。

4.2.2 服务资源地理分割现象的解决思路一:通过“查找服务+定位地点”智能匹配服务

为解决问题,需要假设用户没有领域知识,不了解具体事项的办理机构的行政层级和办事地点,在这个前提下改进服务搜索的功能。

因此要明确采用全局搜索模式,同时使搜索系统能处理围绕地点要素,实现事项的两个地点要素(特定事项的办理地点、特定事项的管理机构所在地点)与用户所在地要素的精确匹配。为避免全局搜索受到过多结果的干扰,可以采用北京市GSSE的逻辑来优化:

第一步:寻找事项。根据用户输入的服务关键词,将围绕该关键词的服务事项作为检索结果呈现出来,不考虑地点。

第二步:定位用户所在地。由用户逐级选择本人所在地或办事地点。

第三步:智能匹配办事地点,给出结果,跳转到具体办事指南页。搜索系统将用户地点和特定事项的办事地点进行匹配,将办事人导引具体办事指南页。如果存在某事项同时由多级办理的情况,可给出简要的选项,确保用户到达最匹配的事项页面。如果用户定位的地点与特定事项的办事层级不一致(如用户定位到街道,但事项是区级或市级事项),匹配算法要“智能”地实现地点的“上下位转换”,将用户导引到可办的事项服务页。当特定地点的服务资源不存在时,需要智能匹配到该事项的上级管理机构页面,确保用户获得相关的引导。

4.2.3 服务资源地理分割现象的解决思路二:通过SEO实现“地点+服务”直接搜索定位

在平台上的服务资源被子站点地理分割的情况下,可以通过页面的搜索引擎优化,使搜索引擎能直接索引地点要素,打破地理割据,使服务资源在索引层面实现“扁平化”。这种做法不仅能实现站内搜索的地理定位,还将大大提升商业搜索的定位能力。

浙江省GSSE就实现了这种直接搜索定位。但是经查看,浙江省政务服务平台的办事指南页面并没有将地点属性放入页面的TDK(Title、Description、Keywords)标签中,因此对输入的地点关键词的匹配是依靠系统后台数据库中地点匹配算法实现的,事项的地点要素没有成为明显可搜索的属性,对站内搜索提出了更高的要求。

5 研究局限与启示

5.1 研究局限

分析政府网站的搜索引擎,仅分析搜索功能设置比较简单且时间可控,但是本研究采集了搜索结果,并分析结果和设置之间的关系,还进行了跨国比较研究,在范围和深度上都有拓展,也存在一些局限:

1)搜索数据采集不同步。由于各政府服务搜索的结果页页面结构不同及平台建设进度不一致,因此需要调整采集策略、多次尝试采集,导致最早采集的数据和最晚采集的数据相差2个月,影响了研究的准确性。但是因为研究正处于新冠疫情爆发期间,针对政务服务平台及搜索引擎的改版相对较少;尤其是美国,2个月内搜索结果几乎没有区别,因此减弱了数据采集准确性对研究结果的影响。因此以后做此类多站点搜索结果研究需要增加采集点,进行并发采集,及时刷新数据,提高数据采集的一致性。

2)搜索关键词设计不够精确。由于搜索结果的差异源于搜索词,进行中美对比研究需要中美搜索词针对搜索目标呈现相同的“偏离”,这个难度较大,希望以后能找到更好的方法。

3)对相关性的判断存在主观倾向。相关性判断一直是搜索引擎研究中的难点,后续研究可采用多人重复判断的方式进行,但在数据量较大的情况下研究成本会大量增加。

5.2 研究启示

服务搜索引擎,是我国政务服务平台的一个组成部分,其产生和发展从一个侧面体现了我国电子政务整体演进。我国的电子政务经历了从追赶到跟随的历史阶段,自“互联网+政务服务”系列政策颁布以来,尤其是随着“政务服务平台”的建设的逐步深入,我国已经逐渐步入自我创新发展的新阶段。虽然中美差异仍然存在,但已经呈现出各有所长、争奇斗艳的态势。从长期看,我国的电子政务有望走到引领世界潮流的前台。首先,我国“互联网+政务服务”已经成为各级地方政府的重要工作任务,地方政府产生了在政务服务领域持续创新的动力,如“最多跑一次、不见面审批、一网通办、智能审批”等创新层出不穷,甚至成为地方发展亮点。其次,我国的管理体制有利于地方政府在电子政务上持续投入资金,从而带来持续的改进。最后,我国电子商务的发展为电子政务提供了高标准的参照物,民众在线消费习惯会进一步推进政府在线服务的发展。未来可期。

[1]中国政府网.中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定_中央有关文件_中国政府网[EB].

[2]中国政府网.国务院关于在线政务服务的若干规定(国令第716号)_政府信息公开专栏[EB].

[3]章燕华.从用户需求角度看政府网站的检索服务[J].图书情报工作,2004,(8):23-25.

[4]2020联合国电子政务调查报告[EB].

[5]孟涛,梁永全,袁勇,等.基于移动主体的智能搜索引擎在电子政务中的应用[J].山东科技大学学报:自然科学版,2004,(3):66-69.

[6]傅明华.政府出版物中的法律文献及检索工具[J].图书馆杂志,1988,(6):35-36,44.

[7]黄晓芹.基于政务网的搜索引擎及信息检索系统设计[J].计算机时代,2013,(5):62-65.

[8]于施洋,王建冬,刘合翔.基于用户体验的政府网站优化:提升搜索引擎可见性[J].电子政务,2012,(8):8-18.

[9]盛苏平,刘春燕,张鹏,等.信息检索趋势及主题法在电子政务中的实现[J].办公自动化,2003,(9):38-40.

[10]攸金娣,邵剑梅.试论全文检索技术在电子政务中的应用[J].办公自动化,2004,(4):18-19.

[11]孙中华,孙晓野,付萍.基于内容的视频检索系统在电子政务中的应用[J].计算机工程与应用,2005,(17):22-25,49.

[12]杨芳,杨振山.基于语义网的电子政务文档智能检索[J].计算机应用,2005,(10):2434-2435,2438.

[13]吕翔.基于Ontology的政府信息资源检索系统分析与设计[D].南京:南京航空航天大学,2008.

[14]孟庆国,王友奎,田红红.政务服务中的智能化搜索:特征、应用场景和运行机理[J].电子政务,2020,(2):21-33.

[15]于静,吴国全,卢燚.基于领域本体的政务信息检索系统[J].计算机应用,2010,30(6):1664-1667.

[16]张苗苗,杨瑜.政府网站在信息检索服务中存在的问题及对策[J].图书情报工作网刊,2011,(11):50-53.

[17]Ravid G,Bar-Ilan J,Baruchson-Arbib S,et and Findability Through Log Analysis of Search Terms and Queries:The Case of a Multilingual Public Service Website[J].Journal of Information Science,2007,33(5):567-583.

[18]Lambert Electronic Information from Government Resources:A Comparative Analysis of Two Communities’ Web Searching of Municipal Government Websites[J].Government Information Quarterly,2013,30(1):99-109.

[19]Serrano-Cinca C,Muoz-Soro J F.What Municipal Websites Supply and Citizens Demand:A Search Engine Optimisation Approach[J].online Information Review,2019,43(1):7-28.

[20]Henman P,Graham vs Google for Finding Government Information on the Web:From a Website-centric Approach to a Web Ecology Perspective[J].Information Polity,2018,23(4):361-378.

[21]Vyas State Tourism Websites Using Search Engine Optimization Tools[J].Tourism Management,2019:73,64-70.

[22]Agata T,Nozue M,Hattori N,et al.A Measure for evaluating Search Engines on the World Wide Web:Retrieval Test with ESL(Expected Search Length)[J].Library and Information Science,1997,(37):1-11.

[23]Hawking D,Craswell N,Bailey P,et Search Engine Quality[J].Information Retrieval,2001,(1):33-59.

[24]李正,咸容禹,余前佳,等.基于版式电子文档的全文检索技术在自然资源部机关政务办公系统中的应用初探[J].国土资源信息化,2019,(2):22-26.

[25]Deka S K,Lahkar evaluation and Comparison of the Five Most Used Search Engines in Retrieving Web Resources[J].online Information Review,2010.

[26]Radlinski F,Kurup M,Joachims Search Engine Relevance with Click-based Metrics[C]//Preference ,Heidelberg:Springer,2010:337-361.

[27]He J,Shu B,Li X,et Time Ratio:A Measure for Web Search Engines with document Snippets[C]//Asia Information Retrieval :Springer,2010:73-84.

[28]Tongchim S,Sornlertlamvanich V,Isahara Search Performance:A Lesson Learned from evaluating Search Engines Using Thai Queries[J].IEICE TRANSACTIONS on Information and Systems,2007,90(10):1557-1564.

[29]Long H,Lv B,Zhao T,et and Compare Chinese Internet Search Engines based on Users’ Experience[C]//2007 International Conference on Wireless Communications,Networking and Mobile ,2007:6134-6137.

[30]Li K F,Wang Y,Nishio S,et al.A Formal Approach to evaluate and Compare Internet Search Engines:A Case Study on Searching the Chinese Web[C]//Asia-Pacific Web :Springer,2005:195-206.

[31]Vaughan L.New Measurements for Search Engine evaluation Proposed and Tested[J].Information Processing & Management,2004,40(4):677-691.

[32]Su L T.A Comprehensive and Systematic Model of User evaluation of Web Search Engines:Ⅰ.Theory and Background[J].Journal of the American Society for Information Science and Technology,2003,54(13):1175-1192.

[33]Ismail A,Sembok T M T,Zaman H B.Search Engines evaluation Using Precision and document-overlap Measurements at 10-50 Cutoff Points[C]//2000 TENCON Systems and Technologies for the New Millennium().IEEE,2000:90-94.

[34]Isfandyari-Moghaddam A,Bahari-Movaffagh and Comparing Search Features of Web metasearch Engines:A Checklist-based Approach[J].Malaysian Journal of Library & Information Science,2010,15(2):1-17.

[35]叶小榕,邵晴.政府网站搜索系统的日志挖掘、行为分析及改进[J].科技导报,2015,33(11):94-102.

[36]慕寿成.政府信息公开目录的完善——以目录检索为视角[J].湖北警官学院学报,2014,27(7):53-55.

[37]王大山,赖科霞,梁建平.智能搜索助力服务型政府门户网站建设[J].电子政务,2014,(6):103-110.

[38]李军.中美政务搜索看点[J].信息化建设,2012,(11):54-56.

[39]尤少伟,吴鹏,汤丽娟,等.基于路径搜索法的政府网站分类目录用户心智模型研究——以南京市政府网站为例[J].图书情报工作,2012,56(9):129-135.

[40]龙怡,刘俊熙,郭金兰,等.我国省级政府门户网站搜索引擎现状调研报告[J].现代情报,2008,(1):212-214,217.

[41]Hao C,Chuanqi T,Gao J.A Quality evaluation Approach to Search Engines of Shopping Platforms[C]//2017 IEEE Third International Conference on Big Data Computing Service and Applications(BigDataService).IEEE,2017:299-304.

[42]Mahmoudi M,Badie R,Zahedi M S,et the Retrieval Effectiveness of Search Engines Using Persian Navigational Queries[C]//7’th International Symposium on Telecommunications(IST’2014).IEEE,2014:563-568.

[43]赵龙文,莫荔媛,黄跃萍.基于结构和属性特征的政府开放数据检索方法研究[J].情报杂志,2017,36(5):148-152,123.

[44]黄碧云,刘雁书,李俊,等.中外政府统计网站检索功能的比较研究[J].情报科学,2007,(5):742-747.

[45]Wu S,Li evaluation and Comparison of Web Search Engines and meta-search Engines[C]//International Conference on Web-Age Information :Springer,2004:303-314.

[46]Zhu Q,Du J T,Meng F,et al.Using a Delphi Method and the Analytic Hierarchy Process to evaluate Chinese Search Engines:A Case Study on Chinese Search Engines[J].online Information Review,2011,35(6):942-956.

[47]国家统计局[EB].

[48]世界银行网站.GDP Per Capita(Current US$)[EB].

[49]Statista网站.Gross Domestic Product(GDP)Per Capita in Taiwan 2024[EB].

[50]中国银行网站.中国银行外汇牌价[EB].

[51]搜狐网.2019中国城市GDP排名出炉!_人口[EB].


文章来源:中国中医急症 网址: http://zgzyjz.400nongye.com/lunwen/itemid-38997.shtml


上一篇: 开放数据生态系统中利益相关者之间的互动关系
下一篇: 中医学论文_中医护理干预小儿上呼吸道感染对呼吸功能的影响



点击在线投稿

 
/ / /
 
 
 
 

Copyright 2001-2021 400农业期刊网版权所有 做最专业学术期刊论文发表网站
本站不是《中国中医急症杂志社》官网,如果需要联系官方杂志社,请联系客服索取网站或者电话。