需要我们的帮助?请搜索。

用户线上行为建模与应用分析研究

l  技术特点   

目前,在网络日志内容的挖掘和应用领域中,受限于数据获取手段,主要的数据对象大都是特定的Web站点数据,这导致在分析用户个性化行为模式方面具有一定局限性。考虑到隐私等因素,直接从用户端获取数据十分困难。鉴于此情况,管道数据的价值凸显出来,通过管道数据可以相对容易和完整地获取用户的所有上网行为记录。管道数据的来源不仅仅局限于宽带运营商,也可以来自于一般的局域网出口,因此具有一定的通用性。相比于Web站点数据,一方面,管道数据可以具有典型的社区、地域、群体、地理信息特征,且信息全面,因而其在理解用户行为模式方面具有独特优势,另一方面,管道数据又具有网站类别多元化、非结构化、数据量大、数据重现率低(除网站主页外,单个用户多次访问同一URL的几率低)、用户构成复杂的特点,使得对于管道数据的分析更为复杂。截至目前,针对管道数据的挖掘方法体系尚未建立,因而开展该领域研究具有理论意义和科学意义。