基于网站用户浏览行为分析的个性化推荐服务综述

  互联网在上个世纪90年代开始普遍民用,发展至本世纪初,己经发展成为一个蕴含各个领域的、巨大的、分布广泛的、全球性的信息交换与共享平台,同时它也成 为人们获取信息的一个重要途径。至此,人们已经不愁找不到自己需要的信息。但是由于现在Web上信息的海量性、动态性、非结构性和无序性等特点,使得人们 要从Web上获取自己所真正需要的信息变得非常的困难,有时甚至感觉如同大海捞针。Google、百度和Yahoo等公认比较优秀的搜索引擎将网络资源进 行了一定的组织,在信息检索方面确实给人们的学习和生活带来了许多便利。这些著名的搜索引擎在信息检索的响应效率和查全率(Recall)方面做的已经非 常好,但在使用方便性和查准率(Precision)方面仍很不够。用户在使用这些搜索引擎时,不仅得认真反复地思考应输入什么样的关键词条,而且系统向 用户返回查询结果时,不但不能很好地根据不同用户进行区分服务,而且其返回的搜索结果通常是十分庞大和杂乱无章的,其中充斥着大量与用户的搜索意图毫不相 关的资料,用户经常需要花费大量时间才能人工地过滤掉大量不相关的结果,并耐心而艰难地寻找出自己真正所需的资料。所以,分析用户的兴趣、给用户提供个性 化的服务,成了网络产品发展的重中之重。

  到了2003年前后,Web2.0成为互联网的热门概念之一,它是相对Web1.0的新的一类互联网应用的统称。传统的Web1.0(亦即2003年以前 的互联网)的主要特点在于用户通过浏览器获取信息,用户需要自己去寻找所关心的信息在哪里,操作繁琐且不方便;Web2.0则更注重“草根”用户的交互作 用、注重“分享”(Share)的概念,用户既是网站内容的消费者(浏览者),也是网站内容的制造者。Web2.0以xml、Ajax等技术为基础,以博 客(Blog)、标签(Tag)、社会网络(SNS)、RSS、维基百科(Wiki)等社会软件的应用为核心,一定程度上实现了网络用户的兴趣发现、兴趣 共享和个性化推荐功能。比如:八宝盒是一个基于音乐分享及偏好而建立起来的SNS服务,利用多年积累研发的推荐引擎,8box能帮你找到可能喜欢的音乐, 帮你分析出哪些用户是你的音乐“同好”;电影推荐网站“What to Rent” (意为“租点什么”) 让初次光临的用户回答一系列随机的问题,并用这些问题来了解用户的特质,从而推荐DVD;豆瓣网以用户所参与的小组和关注的对象作为切入点,挖掘用户兴 趣,进而向其推荐其感兴趣的图书。可以说,以“发现”和“推荐”为主要功能的网站正如雨后春笋般在互联网上崭露头角。

  当然,Web2.0只是一个概念,其实在90年代末的时候就有人使用这个名词了,不过被炒热是在近几年。而当Web2.0风头正劲的时候,又已有人提出了 Web3.0的概念,认为:在Web3.0时代,会把Web2.0所有的东西重新整理,结合语义网络和庞大资料空间,提供更无以计数的个性化资料来源。其 中,Web3.0一个最重要的特性就是“智能”,也就是说,Web3.0是以智能的名义出现的。在今年4月份的博鳌亚洲论坛2008年年会“互联网的未 来”分论坛上,Google前全球副总裁兼大中华区总裁李开复也提及,下一代互联网必将是智能化和个性化的。或许,这些号称更加个性化、智慧型应用的互联 网概念涌现出来,又会像当初Web2.0一样导致互联网的另一场革命(尽管这里面有比较严重的商业炒作成分)。

  就算撇开Web1.0、Web2.0、Web3.0这些受饱受争议的概念词汇不说,应该没有人会质疑下一代互联网将会是智能化、个性化的这个观点。它将在 用户上网的时候,“不知不觉地”分析用户的兴趣,进而主动为用户推荐、提供其感兴趣的东西。而我们要考虑的,就是挖掘用户在上网过程中所体现出来的对网 页文本的兴趣,进而可以向其提供个性化的服务。

时间: 2024-10-28 13:59:14

基于网站用户浏览行为分析的个性化推荐服务综述的相关文章

Foursquare发5亿次签到地图展示个性化推荐服务

腾讯科技讯(小贝)http://www.aliyun.com/zixun/aggregation/17197.html">北京时间1月19日消息,据国外媒体报道,移动地理位置服务商Foursquare日前发布了该服务过去三个月产生的5亿次签到的地图,这不仅仅是用户曾经签到地点的集合,而且是Foursquare打造个性化推荐服务并挑战Yelp的纽带. Foursquare的这种做法在业界属于独一无二,它并不是要求用户从一开始就对某个地点进行评分或发表评论,而是提供了一种游戏性质的签到方式,用

关于隐式挖掘网站用户行为的分析

隐式挖掘网站用户行为 如何了解用户和需求 如何了解用户需求?根据用户是否主动参与分为显式与隐式两种挖掘模式,因为显式的动静比较大,有很大局限性,所以为了保证结果准确性以及提高用户接受度,一般都采用隐式. 用户的日常交互行为会产生四类关键数据:鼠标移动轨迹.链接点击分布.页面浏览流.页面停留时间.通过用户的行为能反映用户的观点,同时利用访问的网页次序可以找出网页之间的隐性关系. 收集数据 Web服务器的日志(用户会话记录) Web trends或类似的第三方共享软件(客户端分析,流量分析,可用性分

PHP图形计数器程序显示网站用户浏览量_php实例

PHP图形计数器程序是一款简单的图片计数器,为了直观显示一个网站有多少用户浏览,需要在网页底部放一个图片计数器,也就是当前页面的访问量,访问量的数据是保存在 txt 文件里,可自动生成 num.txt 文件,自定义初始数据,显示的数字图片保存在 img 目录下,可以换成自己做的精美的图片,更换即可,index.php是调用文件,很简单. 本程序只有几十KB,系统代码设计简单易懂. 效果如下: 关于程序的安装很简单: 1.这款图形计数器不需要数据库的支持,只要能运行PHP即可,将index.php

网站分析:网站用户的生命周期价值分析

中介交易 SEO诊断 淘宝客 云主机 技术大厅 Avinash Kaushik的博客中最近更新的一篇文章--Calculate Customer Lifetime Value,里面非常详细地论述了什么是网站用户的生命周期价值(Lifetime Value,简称LTV),及为什么要使用LTV这个指标.其中主要阐述的是在SEM及网站推广的过程中不要仅关注于一次访问(Visit)中的转化率(Conversion Rates)和CPA(Cost Per Acquisition)这些指标,计算用户在网站的

网站用户的生命周期价值

什么是用户的生命周期价值 生命周期是指一个主体从开始到结束的发展过程,所以网站用户的生命周期可以解释为用户从与网站建立关系开始到与网站彻底脱离关系的整个发展过程,而用户的生命周期价值就是在这个过程中用户为网站所带来的价值总和. 用户的生命周期可以分为4各阶段,如下图: 从用户的生命周期曲线可以看出用户在于网站建立关系期间一般会经历4个阶段,每个阶段都为网站带来不同的价值: 考察期:用户会试探性的偶尔来访问下网站,这个时候用户创造的价值比较低: 形成期:用户可能已经有点喜欢上你的网站了,他们会不定

网站用户生命周期

Avinash Kaushik的博客中最近更新的一篇文章--Calculate Customer Lifetime Value,里面非常详细地论述了什么是网站用户的生命周期价值(Lifetime Value,简称LTV),及为什么要使用LTV这个指标.其中主要阐述的是在SEM及网站推广的过程中不要仅关注于一次访问(Visit)中的转化率(Conversion Rates)和CPA(Cost Per Acquisition)这些指标,计算用户在网站的整个周期中创造的总价值将更具意义,用户生命周期价

报告称09年我国社交网站用户规模将达1.24亿

中介交易 SEO诊断 淘宝客 云主机 技术大厅 新浪科技讯 11月12日下午消息,中国互联网络信息中心(CNNIC)今日发布报告称,2009年我国交友和社交网站的用户规模将达1.24亿,接近国内网民总数的三分之一.而休闲娱乐和游戏仍是目前社交类网站的主要应用功能. CNNIC今日发布<2009中国网民社交网络应用研究报告>(以下简称报告),报告中预测截至到2009年底,我国使用交友和社交网站的网民数将达1.24亿.同时,根据统计其中每人平均拥有2.78个帐户.据此计算,我国共有社交网站注册帐号

千人千面、个性化推荐,解读数据赋能商家背后的AI技术

  背景介绍 大数据 大数据主要有四个特征:Volume(大量).Value(价值).Velocity(速度).Variety(多样). Volume(大量):互联网实时采集用户的各种行为,数据量庞大: Variety(多样):数据格式发生了翻天覆地的变化,数据类型的多样性也是大数据的特点: Velocity(速度):信息采集速度为秒级或毫秒级: Value(价值):海量数据中存在很多金矿,价值密度低,须通过不同类型的数据挖掘才能完整刻画用户,产生价值. 人工智能 通用人工智能(General

文章个性化推荐靠不靠谱?万字长文详解AI内容分发的真实现状

在AI时代,我们需要重新理解和认知内容C2M(单用户沟通)的机制和规律,去检讨传统传播理论的不足以及公共危机的管理方法,进而思考如何赢得沟通--要站在单个用户的角度来进行个体化沟通,而不是千人一面的宣灌或传播. 自从互联网商业化发展以来,不论是新闻客户端.视频网站或是电商平台--所有的平台,都是把自己默认为一个优秀的饲养员,它按照自己的想法,把内容(饲料)Push(喂)给用户. 这些饲养员都是受过训练的专业人士,行话叫做---由网站编辑为用户设置议程,按照大多数用户的口味挑选内容. 后来编辑实在