基于天网搜索引擎的高校用户娱乐搜索行为研究.doc
基于天网搜索引擎的高校用户娱乐搜索行为研究
基于天网搜索引擎的高校用户娱乐搜索行为研究 【摘 要】 本文基于天网中文搜索引擎的日志对教育网用户的娱乐搜索行为进行研究。发现教育网用户检索艺人的频次分布符合幂律分布特征,说明艺人的被检率存在马太效应。用户进行娱乐搜索的时间特征和普通检索基本相似,但在全天某些时段呈现高峰期。不同类型高校用户进行娱乐搜索时的性别偏好存在明显差异。 【关键词】 搜索引擎用户日志Web挖掘娱乐搜索行为 A Research of the CERNet Users’ Entertainment Searching Behaviors 【Abstract】In this paper, the user log of Tianwang,a Chinese search engine system,is investigated to observe users’entertainment searching result shows that the frequency distribution of Chinese pop-star bEing searched is power-law distribution,which implies there is a Matthew Effect time distribution of users’entertainment searching behavior bears some similarity to that of thEIr general searching behavior,although there are several rush hours when users retrieve entertainment information more frequently during a from different types of universities prefer different genders when they retrieve entertainment information. 【Key words】 Search EngineUser’s LogWeb MiningEntertainment Searching Behavior 1引言 搜索引擎作为互联网应用的一个重要部分,其海量日志中蕴含着很多潜在信息值得挖掘,其中的一个重要方面就是对于搜索引擎用户行为的研究。目前学界对于基于大规模搜索引擎日志的用户行为研究集中在对用户的普通使用行为的研究上。如文献[1]对英文搜索引擎AltaVista、文献[2]对搜狗搜索引擎、文献[3,4]对北大天网等的日志进行分析,得出搜索引擎用户的基本行为特征,如使用频次分布、查询词长度、会话时间、点击习惯、访问时间的分布、检索词的局部相似性等;在此基础上,进而研究用户查询的多任务性[5~7]、用户查询的演化趋势[7,8]以及用户检索目的分析[3]等深层问题。 本文试图研究特定用户的特定信息检索行为的特征,为此,本文以天网搜索引擎[9]日志为研究对象,对中国教育网中不同类型高校用户的娱乐搜索行为特征进行了分析对比,并对分析结果的传播学意义进行一些初步的探讨。 本文所论述的“娱乐搜索行为”特指用户使用搜索引擎检索娱乐圈中比较活跃的艺人姓名,以获取相关娱乐信息的行为。选择娱乐搜索作为我们进行用户行为研究的对象,一方面是因为娱乐人物的列表比较容易获取和分类,并且检索娱乐信息是天网用户使用的一个重要功能,对天网用户的娱乐搜索行为进行研究,具备一定的代表性。更重要的原因在于,不同类型用户的娱乐搜索行为会具有比较明显的差异,比如女性用户和男性用户检索时偏好的艺人就具有明显不同,这使得对本文的研究结果进行探讨具备了实际意义。 之所以选择天网搜索引擎作为研究对象,是因为天网是目前国内最大的非商业性搜索引擎,其用户群体比较固定,主要为教育网用户。教育网用户主要来自国内的各高校,通过查询高校的IP网段可以有效识别用户的来源高校,这样通过对比不同类型的高校用户,比如文史类高校和理工类高校用户之间检索行为的差异,就可以推断出不同类型的用户检索行为的差异。 本文的具体安排如下:第一部分,探讨天网用户娱乐搜索行为的基本特征,如用户来源、艺人被检率分布、检索时间分布等,并探讨其与一般检索行为的差异。第二部分,探讨不同类型高校用户检索艺人的偏好现象,引入“偏好值”的概念描述艺人被不同类型用户检索所偏好的程度,并基于该数值进行聚类分析。第三部分,总结。 2天网用户娱乐搜索行为的基本特征 本文研究的数据来自天网搜索引擎2002年12月份的用户查询日志,共包含6577081条检索记录。
网址:基于天网搜索引擎的高校用户娱乐搜索行为研究.doc https://m.mxgxt.com/news/view/1207913
相关内容
基于搜索引擎索引分析的互联网舆情监控研究.docx搜索引擎蜘蛛如何工作?(了解搜索引擎蜘蛛的爬行原理及规则)
百度搜索引擎蜘蛛剖析(从行为到优化)
搜索引擎优化是什么意思啊
CD封面搜索引擎
搜索引擎蜘蛛的工作原理及影响(深度解析搜索引擎蜘蛛的访问机制及优化策略)
搜索引擎的基本语法规则中,在填写关键词时,用()表示“与”的关系。
李彦宏:人工智能与搜索引擎的缔造者
百度搜索引擎大全
QQ群关系可视化搜索引擎,吊炸天!