中国学术期刊网 » 论文 » 管理学论文 » 工商管理论文 » 商品检索中的多任务识别与行为特征分析论文正文

商品检索中的多任务识别与行为特征分析

中国学术期刊网【工商管理论文】 编辑:天问 现代图书情报技术 2016-05-05商品检索中的多任务识别与行为特征分析论文作者:张鹏翼 周翔 王军,原文发表在《现代图书情报技术杂志》,经中国学术期刊网小编精心整理,仅供您参考。

关键词: 商品检索 ; 购物任务识别 ; 购物任务分析 ; 多任务会话
摘要: 【目的】对商品检索中的购物任务进行识别, 并对多任务会话行为特征进行分析。【方法】利用淘宝商品分类体系以及自建的商品词表, 根据商品检索的检索式进行购物任务识别, 数据集为2 754个用户的19 704个检索会话。【结果】影响每个购物任务所用检索式数的因素包括商品分面、数量的多少以及描述难易程度; 有主要任务和次要任务之分的多任务会话中, 任务之间的关系更为紧密。【局限】购物任务识别方法有待完善, 只以检索式作为研究对象无法全面反映用户行为特征。【结论】本研究可以帮助理解购物中的商品检索行为, 并为设计更好的商品推荐算法、预测用户购物过程、行为等提供依据。

张鹏翼, 周翔, 王军
北京大学信息管理系 北京 100871
Zhang Pengyi, Zhou Xiang,, Wang Jun
Department of Information Management, Peking University, Beijing 100871, China
通讯作者: 周翔, ORCID: 0000-0003-0982-6047。
基金资助: *本文系国家自然科学基金项目“面向电子商务生态平衡的目录导购机制研究”(项目编号:71373015)的研究成果之一;
中图分类号: G358
--------------------------------------------------------------------------------
1 引 言
近年来, 网络购物由于其便捷、高效, 不受时空地域限制的特点, 越来越受到用户青睐。借助互联网高度的互动性、便利性、透明性和个性化, 网络购物得以提升服务质量, 并且可以通过数据挖掘、机器学习等技术来实施实时营销和精准营销[1]。基于以上优点, 网络购物成为了人们生活中越来越重要的一种购物方式。

据中国互联网络信息中心(CNNIC)发布的《2014年中国网络购物市场研究报告》[2]显示, 2014年网络零售交易额达到2.79万亿元, 同比增长49.7%。在网络购物发展势头迅猛的当下, 如何分析网络购物用户行为, 得出行为特征, 并以此为基础对电商系统进行优化和改进, 就成为一个值得关注的问题。在网络购物行为中, 同时开展多个购物任务的现象很常见, 但对于网络购物任务的识别以及多任务情况下搜索特征的分析很少。一般网络搜索也具有多任务的特性, 例如Spink等[3]的研究指出, 多任务信息检索是一种很常见的用户行为, 他们在检索系统随机抽取的1 000个会话中, 有11.4%的会话涉及多任务检索; Spink等[4]的研究也发现, 含有三个或以上检索式的会话中, 多任务会话占比超过九成。但对网络购物用户信息行为的分析中, 针对用户使用的检索式进行分析, 识别用户任务的研究较少。本研究旨在补充此领域研究的不足, 通过分析用户在网络购物时使用的检索式, 对用户的购物任务进行识别, 并根据所识别的结果展开多购物任务间关系以及搜索特征的研究。

与本研究相关的一些定义如下: 会话是一个客户与服务器之间的不中断的请求响应序列, 用户的一次会话代表了用户的一次网购过程[5]。本研究中, 如果用户在完成一个动作之后连续45分钟没有进行任何动作, 则视为一个会话的结束, 并将这之后用户第一个动作作为下一个会话的开始[6]。购物任务是指用户为了购买某一种商品所做出的一系列行为的集合, 基于研究目的, 本研究主要在单个会话中进行购物任务的识别, 多任务会话则是指含有多个购物任务的会话。

2 文献综述
2.1 检索系统中的任务识别
检索任务识别的主要思路有: 比较检索式之间的相关度; Glance [7]提出比较网络搜索引擎中进行检索所返回的URL; Raghavan等[8]提出比较检索所得的文档等。根据用户两次检索在上述指标上的相似程度, 判断两次检索是否属于同一个检索任务。

比较两个检索式相关度的方法主要有以下两种: 对比检索式之间的字符相似程度, 提取两个检索式中的检索词集合, 可用的指标有Järvelin等[9]的Jaccard指标, 以两个集合的交集与两个集合的并集的比值作为相似度的判断指标, 以及Jones等[10]提到的Levenstein距离; 对比检索式之间的语义关联程度[11], 采用向量空间的思想, 分别利用外部知识资源如Wiktionary和Wikipedia所提供的语义关系, 计算每个检索词与语义网中每个资源的相似度并生成向量(如检索词t, 共有W个资源, Ci为检索词t与第i个资源的相关度, 则生成的向量为C(t)=(C1,C2,…,Cw), 每个检索式对应的向量为检索式中包含的检索词对应的向量之和, 然后通过计算两个检索式所对应向量的夹角作为计算两个检索式相关度的指标。

Lucchese等[12]的研究在具体的检索任务识别中采取了以下方法: 首先对检索日志进行一定的处理, 步骤包括: 去除空记录和无意义记录、去除停用词、用算法去除检索词形态上的变化、去除持续时间较长而且含有过多检索式的会话记录(这些记录可能由机器产生, 与对用户研究的目的不符)。然后根据上文所提到的方法, 计算检索式之间的字符相似程度和语义关联程度。最后综合两个评价指标, 他们提出两种方法: 其一是做简单的加权处理, 对两个指标进行加权平均, 得到一个统一的指标; 其二是当词形相似度高于一定阈值的时候取词形相似度作为最终指标, 而当词形相似度低于阈值的时候取词形相似度和语义相似度的较大值作为指标。

从已有研究来看, 目前任务识别的主流方式是分析检索式之间的字符相似程度或语义关联程度, 建立相应的评价指标, 进而识别出同属于一个任务的多个检索式。

2.2 多任务检索会话研究
Spink等[13]认为, 关于多任务检索会话产生的原因主要有两种: 检索用户在一开始就有多个需要检索的主题; 检索用户一开始只有一个检索主题, 但在检索的过程中衍生出其他的检索主题。

关于多任务检索会话的特征, Ozmutlu等[14]发现多任务会话在检索式的长度和会话所花时间上都多于单任务会话。他们的另一项研究[15]也验证了多任务会话所花时间更多的结论。Lin等[16]发现多任务会话中检索式数量较之单任务会话更多。

Lucchese等[12]、Spink等[13]、Wang等[17]都采用日志分析的方法对多任务会话进行研究, 相关的研究结果如表1所示:


表1
表1

表1 相关研究结果对比
表1 相关研究结果对比
比较项 Lucchese等 Spink等 Wang等
日志来源 AOL AltaVista Bing.com
日志时间 3个月 1天 5天
会话数 307 254 37 547
检索式数 1 424 655 114 723
每个会话平
均检索式数 4.49 2.58 3.1
每个任务平
均检索式数 2.57 — 6.6
每个会话平
均任务数 1.8 — —
多任务会话
比例 74% 81.2% —
其他 会话的平均
持续时间为
15分钟 多任务会话平均时间和
检索式长度约为普通会
话的2倍 —

如表1所示, 网页检索中每个会话所含的检索式平均在2-5个左右, 多任务会话的比例高达70%-80%以上。

目前对多任务会话的研究主要集中在会话及任务的数值特征(如时间、检索式长度、每个会话平均任务数、每个任务平均检索式数等)。而进一步的研究, 如分析任务类型对相关数值特征的影响, 以及分析会话中任务间的联系等还比较缺乏。

本研究通过对商品检索日志进行处理, 采取以商品类型为特征对检索式进行标引进而对任务进行识别的新方式, 分析商品检索中多任务会话的基本情况, 并进一步挖掘商品类型与检索行为之间的关系, 以及多任务会话中任务关系与任务主次之间的关联, 填补目前该领域对这一方面研究的空白。

3 研究方法
3.1 数据描述及预处理
采用的日志数据是由第三方市场调查机构采集自用户客户端2013年5月在淘宝网上的访问数据。可用日志数据表中总共有记录1 409 160条, 涉及到81 759个访问会话, 4 285个用户。

数据预处理的步骤如下:

(1) 对商家数据进行筛选和剔除。由于本研究主要是针对网络购物中的消费者进行研究, 因此筛去了会话数大于100的用户(很可能是商家)的数据。

(2) 去除用户其他行为类型如登录、浏览、翻页、筛选等产生的记录。由于本研究侧重用户搜索时产生的日志, 其他行为的日志与本研究无关, 也一并进行筛选和剔除。

经过预处理得到的数据集合包括53 091个含有原始检索式的记录, 共涉及到2 754个用户, 占用户总数的64.27%; 共涉及19 704个会话, 占用户会话总数的24.10%。

3.2 任务识别方法及评估
对已有的商品检索记录进行任务识别, 流程如图1所示:


图11003-3513-32-3-1/img_1.png
1003-3513-32-3-1/img_1.png
新窗口打开

下载
下载压缩包下载PPT图1 任务识别流程


(1) 通过淘宝API①(①http://open.taobao.com/.)获取所有的商品类目数据信息——共14 000余商品类目, 类目层级4-5级。以这一商品分类目录为基础, 并对类目设置进行增补、修改和删减, 建立一套改进的商品类目等级分类目录。

(2) 对原有的商品检索记录进行切词处理, 对53 091条商品检索记录进行切词, 共得到163 617个词语。对所得词语的词频进行统计, 并选取其中出现频次大于等于10次的词语, 共2 376个。对所得词语进行筛选, 选取其中能代表商品类型的词语, 作为词表的组成部分。再将所筛选出的词语, 与建立好的商品类目分类体系进行匹配。同时选取商品类目分类体系中的商品类目名称, 也作为词表的组成部分纳入。将两部分进行合并, 得到一个较为完整的词表, 包含了绝大多数直接指向商品类目的词语以及一些检索中使用频率较高的品牌名称。

对购物任务进行识别时, 将商品检索记录与词表和商品类目映射关系进行匹配, 若一条检索记录匹配到词表中的某个词语, 则将该条检索记录所对应的购物任务用该词语所对应的商品类目进行标识。原始商品检索记录共有53 091条, 匹配成功的记录有41 486条, 匹配成功记录占总记录的78.14%。如果某一用户一个会话中的两条或多条检索记录被标识为同一商品细类, 则认为这两条检索记录属于同一购物任务。

为考察该购物任务识别方法的准确度, 从匹配成功的商品检索记录中随机抽取了200条进行人工的任务识别。在200条记录中, 有164条记录的购物任务识别准确或基本准确, 准确率为82%。

4 结果分析
4.1 会话及任务分布情况
检索日志共包含19 074个会话, 进行购物任务识别之后会话内包含被识别的购物任务的会话16 050个, 占会话总数的84.15%, 共对应购物任务26 182个。平均每个会话对应的购物任务为1.63个, 每个购物任务对应的检索记录为1.585条。为比较各商品大类之间每个任务的平均检索式数, 列出检索式数/任务数比值较高和较低的5个大类, 如表2所示。可见, 检索式数/任务数比例最高的类目是服装、箱包皮具、五金/工具、手表等, 而比例最低的类目主要是传统滋补营养品、药品/医疗器械、个人护理/保健/按摩器材、珠宝/钻石/翡翠/金银等, 经分析, 影响任务平均检索式的因素主要有以下两点:


表2
表2

表2 部分商品类目检索式数与任务数
表2 部分商品类目检索式数与任务数
商品类目 类目
ID 检索
式数 任务数 任务平均
检索式数
服装 161 7 770 19 358 2.49
箱包皮具 146 1 406 3 047 2.17
五金/工具 126 116 233 2.01
手表 159 129 256 1.98
网游 155 73 142 1.95
… … … … …
网络设备/
网络相关 116 51 72 1.41
珠宝/钻石/
翡翠/金银 147 176 246 1.40
个人护理/
保健/按摩器材 123 160 220 1.38
药品/医疗器械 156 68 92 1.35
传统滋补营养品 134 135 176 1.30

(1) 检索商品分面较多, 检索条件的涉及面也比较广泛的商品类型时, 往往会在一个任务中使用更多的检索式进行检索。如某用户(UID: 924212012883 1377467; SID: 99456)先以“雪纺衫”作为检索词, 但检索结果数量较多, 所以用户为了进一步筛选, 减少挑选范围, 加入限制条件, 使用“雪纺衫 短袖”进一步检索, 而后使用“雪纺衫 短袖 花色”进一步检索。相比之下, 任务平均检索式数较低的商品如传统滋补营养品、药品/医疗器械等类目下的商品专指程度较高, 用于进一步检索的条件也比较少, 进行一次检索之后所得的商品列表可以由用户在其中进行直接选择。比如某用户(UID: 10071878660749185838; SID: 624)购买保婴丹(属于药品/医疗器械), 只检索“余仁生+保婴丹”就得到较小的商品范围, 不需要更多的检索式缩小检索范围。