http://piglili.blogbus.com/logs/45219030.html
背景:在一次关于收藏夹tag功能的讨论会上,众人就tagging的意义展开了激烈讨论。
为将思路结构化,特写此文分别论述:1. tag有用吗?;2. tagging的利与弊;3.tagging系统及其UI设计。较为枯燥,算是一个知识点的梳理吧。
1. tag有用吗?
tag 随着web2.0而流行,已有7年历史(Keller, P. 2007)。tagging成为各大网站常见功能,但系统地使用它的人多吗?tagging的脑力负担不轻:要将信息分类尚属不易,勿论描述信息本身。对一条信息而言,应该tag类目还是属性?范畴应该更宽还是更窄?tag越多越好、还是控制在一定数量内?尤其困难的是,由于并非事前规划,无法很好预计被 tag内容的发展,入门、维护并不轻松。
但从目前网络发展形势而言——个人自生成内容(博文、图片、视频等)迅速增加,各类信息海量涌来——tag可谓管理海量信息的强大利器。本文第2部分将展开论述。
*注:本文中信息是指图像、视频、音频等资源,非仅指文字信息。
2. tagging的利与弊
2-1. tag与tagging
· tag作为元数据(metadata):元数据是所谓描述数据/信息的数据,tag是一种用户自创的元数据,特点是无层次结构、自定义。
· tagging构成分众分类法(folksonomy):分众分类法,指大众自发利用tag对信息进行描述、分类,构成与信息架构中传统分类法(taxonomy)相对的信息组织。二者的区别见下表1:
表1:taxonomy VS. folksonomy
2-2. tagging的利
结合表1的对比,可归纳出tagging的以下好处:
· 使信息组织更经济、高效、灵活。
如《未来是湿的》作者所言,“The Only Group That Can Categorize Everything Is Everybody”(只有所有人能把所有信息都分类)。就如大英百科全书的编撰与Wikipedia的关系一样:信息越多,传统分类法的劣势越明显——开发、维护成本只升不降;基于tagging、运用群众力量的分众分类法则相反。尤其当前的趋势是个人自生成信息越来越多,系统的分类、描述能力和效率可说远不如内容创造者本身。
· 对信息的索引、描述更丰富。
(1)tag固然不如传统分类法中的控制词表(thesaurus)那么严谨标准,但由于信息可被无穷多人赋予无穷多tag,故茫茫网海中只要有一个人跟你想到的描述一样,搜索就更有机会有所获。而要恰好用上专家词表内的专业化语词,难度可能更高。对于图像、视频、音频此类系统标注成本极高、效率极低的信息而言,tagging的价值会更明显。
例:豆瓣不可能有钱请专家对系统内的资源进行电影、图书、音乐以外的分类,又或者尚无全文检索的实力,那如何找到一部同性恋主题的电影?拿普通搜索与tag搜索的结果、结果的发散程度对比,就能感觉到大众的力量。
(2)用于描述某信息的所有tag往往是公开共享的,其分布往往呈图1所示长尾状收敛(Shirky, C. 2005)。各tag及其频率,既可反映大众对于该信息本质广泛一致的定义,又不至于让小众意见(minority opinion)完全被淹没。
图1:两条deli.cio.us书签的tag频率分布
· 更人性化的信息检索。
上述两利,最终优化的是搜索:由于对一组系统信息(如个人的博文、Flikr的所有相片、Youtube的所有video)的接入点更多了,用户在信息海洋中找到与之需求匹配的信息的机会也更高。即利用大众的智慧,使搜索在机器化的基础上,更语义化、人性化、社会化。
以上三点是tagging社会性优势。Golder et al(2006)提出tag大致在描述信息的7方面:它关于什么(主题、分类、属性等),它是什么(标题、类型等),谁拥有它(作者、协作者),修饰tag的tag,它的品质(有趣、雷人等),自我参考(我买过的、我的书等),任务管理(待读、找工作等)。该分类并非绝对,但从后三种可看出tag在标引信息时的一大特点在于自我性。这带来的好处有:
· 辅助个人信息管理。对个人信息管理而言,tag可以发挥更大的作用。因其高度自定义性,使信息可被个性化地描述,使个人使用情景(context)成为信息描述的一部分。“很喜欢”、“我想要”、“妈妈生日”这类tag,是系统较难为用户索引的。
· 身份识别。如从某博客的标签云/列表,能看出博主的兴趣、甚至职业等个人信息。
图2:某博客的tag云
Marlow et al (2006)与Ames & Naaman(2007)曾探讨用户tagging的动机(表2),表现出社会性与自我性的结合。
表2:tagging的动机
这又带来另一种优势:社会化网络的构建。tag聚物(信息),亦聚人。一方面,它昭示一个人的兴趣爱好,从而帮助个体寻找同好。另一方面,它能聚合兴趣团体。例如Flikr上一个语法错误、表意模糊的tag,sometaithurts(so meta it hurts,如此“元级别”,如此痛),却聚集了来自各色用户的各色相片。给照片tag上sometaithurts的个体,由tag聚集在一起,彼此间因此有了进一步社交化的机会,并将为这个tag聚集更多的物。
2-3. tagging的弊
tagging最为人所诟病的特性有:缺乏一致性、歧义、语法错误。这是由于与专家相比:
· 大众是“懒惰”的:tagging可能停留在粗浅的表层,而不做深入思考或精准描述。尤其当tag与系统固有分类维度重合的时候,就会失去价值。例如为豆瓣上的电影打上“电影”这个tag的意义是零。
· 大众是“虚伪”的:有人会为了让自己出现在搜索结果更前面等目的而乱tag;
· 大众很“笨”:
(1)拼写问题。除了拼错字词,英文里词组的分隔、大小写、单复数等就会造成大量混乱的tag;
(2)没记性。表现为个人在同一系统中使用不一致的tag(如字面相异,意义相同等)来标注同一或相似内容。
这导致大量污染性的垃圾tag,即所谓搜索结果中的噪音出现,从而降低检索效率。但这并非tagging的致命伤,通过设计的引导是可以改善这些问题的。第三部分将展开讨论。