您现在的位置:首页 >> a000000.com >> aaoooo.com >> 内容

对比传统网页分析新浪博客开启网页搜索的优势

时间:2012-5-23 16:32:10 点击:

  近日,笔者在访问新浪微博搜索的时候,发现新浪微博已经在“微博搜索”结果中加入了网页搜索。而这种搜索结果只有对指定的部分用户开放,而并非所有用户都可以在微博搜索结果中看到对应关键词的网页搜索结果,也就是说新浪微博在小范围内进行“灰度测试”网页搜索结果。

  如下图,在新浪微博的搜索网站 http://s.weibo.com/ 中输入搜索关键词“互联网”,搜索结果页面乍一看依旧是早期的布局——由关键词对应的微博和相关用户构成。搜索框下方是搜索条件筛选工具栏,可以指定筛选原创、认证用户、我关注的、图片、地区 等条件的搜索结果。

  

 

  而继续向下拉,在微博的搜索结果之后就可以看到对应的网页搜索结果,而且其中也是对搜索的关键词进行了标红显示。每一条网页搜索结果后方都标有“网页”字样,对应的搜索结果呈现信息和要素有以下几点:

  1.网页 title 标题

  2.原网页地址

  3.网页内容摘要

  4.分享次数

  5.分享时间

  6.分享人

  

 

  在以上六点元素中,可以进行点击的分别为 1、4、5、6 四个元素,点击其中的1.(网页 title 标题)和5.(分享时间)的反馈结果均是跳转到了原网站的网页,点击6.(分享人)则直接URL链接到了指定微博用户的微博页面。点击要素4.(分享次数)链接,则弹出如下对话框,提示发布一条微博,微博内容为“网页title” 加 “网页地址”——非常简单的交互。

  

 

  笔者对于网址搜索的结果来源以及搜索结果中展示的要素4“分享次数” 的统计和来源还是比较感兴趣的。首先,在新浪微博的所有访问页面中暂未发现可以提供网址列表供用户主动挑选分享的,因此猜测此处的网址搜索来源应是用户主动通过站外分享发布到新浪微博的。其次,新浪微博的开放平台网站 open.weibo.com 早些时候已经公开了一系列的“短链接”相关接口——其中包含一系列短链接点击次数、分享次数、评论次数、点击用户地区分布等数据统计。因此笔者推测,此处所谓的“分享次数”应为原网页对应的短链接的相关统计结果。如此实现,在技术上也是比较简单和完善的思路。

  

 

  下面再简要分析一下新浪微博推出网页搜索的初衷、优势和影响。

  众所周知,新浪微博是最近几年互联网圈内最火热的产品之一,曾经有一位业内的朋友谈起过:新浪微博刚好赶上了互联网X 年一个周期的高潮发展好时候。确实,从诞生到成为一款流行产品,新浪微博只用了一年。由于笔者自身关注社交网络多一些,之前也有好几篇文章中谈及新浪微博和互联网以及其他相关行业产业的关系,在此不再赘述。

  微博本身作为社交媒体social media 概念的产物,从诞生之初就更偏“媒体”一些,圈内的各大互联网也包括新浪自身都有将微博称为“自媒体”的叫法,而媒体则强调的是内容和传播性以及影响力等要素。新浪多年以来具有国内互联网企业中最强势的运营能力,因此在微博的内容运营中也是如鱼得水。经常穿梭于各大社区的朋友可能也会发现,从社区的内容质量上来看新浪微博具有非常高的优势。而在新浪微博开放平台发布之后,各种应用可以轻易和新浪微博进行接入合作,陆续有源源不断的互联网内容被用户分享到新浪微博中。

  笔者认为这就构成了很重要的第一点:微博中具有来自互联网的高质量内容。

  与传统的搜索引擎相比,这是极其明显的优势。曾记得N年前百度的创始人李彦宏 先生有一项构成了近日互联网搜索引擎基石的专利——“超链分析技术”(hypertext document retrieval system and method),甚至传言后来google 的搜索技术也与此有紧密关系。我们暂且不去分析此项专利的详细内容,但是可以想象,其实现的目的是在互联网的海量内容中进行搜索,并对搜索结果相关性进行调整、排序、显示——而如此的海量工作并定通过计算机实现。相比之下,新浪微博在网页搜索方面的基础数据和高度应该要更有优势,除去spam用户和内容的影响,用户分享的内容必定是其有兴趣的内容,因此必定要比传统引擎的搜索机器人spider爬虫的搜索结果的平均价值要更高——此所谓高质量!

  第二点,微博更容易得到网页结果排序。

  笔者简单分析过百度等传统搜索引擎的前端页面,用户在页面中的每一个链接的点击搜索引擎都会有记录程序向后端报告供后端分析和统计,以便对搜索结果进行算法调整和排序校正等。可以看出,传统的搜索引擎除了自身的排序算法之外,会根据用户行为进行搜索结果排序。

  而从目前新浪微博公布的短链接统计接口可以看出,新浪微博已经对来自互联网的所有网址URL在新浪微博上的点击、分享等行为进行了统计。而新浪微博能将此部分数据通过openapi 公布出来,笔者认为是新浪微博迈了具有跨越性的一步。百度和google等传统的互联网搜索引擎完全可以通过新浪微博的接口,获取互联网上的某个网址URL 在新浪微博中的“受欢迎度” 等数据,这将对搜索引擎调整自身搜索结果排序具有一定帮助。因此笔者大胆猜测,baidu 和 google、sogou 等传统搜索引擎已经在进行相关尝试或合作。

  因此,可以说新浪微博自身做网页搜索的话,在搜索结果排序上也是具有很大优势的。

  第三点:更高质量的用户行为——基于网址相关。

  其实,这一点和上面的第二点有些交集的地方,依然是从网页搜索结果排序的质量来说。在传统的搜索引擎中,用户一般都要通过大于一次的点击得到需要的内容,而在用户获得精确内容的时候,却没有向搜索引擎进行“反馈”。我们在各大搜索引擎中都看到过“赞”、“顶”、“打分” 等类似的功能,这也表明了搜索引擎想更精确的了解用户对搜索结果的满意度的愿望。

  在微博中,微博作为用户内容社区,用户关系是相对弱化的,这也更加强化了用户的行为是基于内容的兴趣。如果我们认为用户对网址的点击行为和传统搜索引擎的点击行为是对等关系的话,那么用户对包含网址的微博的分享行为不就是对网址的“顶”的反馈吗?这些传统搜索引擎“梦寐以求”的数据,微博上几乎可以轻易拿到。

  第四点:新浪微博网页搜索的劣势

  这一点说来,应该还是蛮多的。最直接的两点:1.网页索引量太少,相比百度、google的传统搜索引擎依靠爬虫主动获取网页内容的方式来说,依靠网友分享贡献网址的新浪微博索引的网页数量必定太少,短时间内难以与传统搜索公司抗衡;2.用户搜索习惯,微博毕竟还是微博的环境,用户搜索习惯不是很容易养成的。此外,搜索引擎是一项复杂的工程,也非一日两日之功就可以建立和完善的。

  第五点,新浪微博的搜索的未来?

  谈及互联网的未来,甚至某些产品的未来的时候,总是有很多人能够夸夸其谈的说一大堆。笔者则不是很愿意对一些未来大局类的事物做太多预测和谈论,还是之前那个观点——务实做好能做的,之后多为用户着想着做实事儿。

  从去年开始,就陆续有文章说新浪微博可能要做独立搜索,但一年过去了,貌似没看到多大变化。搜索只是 s.weibo.com 独立域名而已,搜索结果和搜索相关的体验貌似变化也不大——当然,此次加入了网页搜索应该还算比较大的变化。截止目前,不能说新浪微博搜索给大家的感觉不温不火也差不多吧(笔者暂且自大一把如此认为)。新推出的网页搜索则简单的在原有的搜索结果展示 用户搜索结果、微博搜索结果 之后加上了网页的搜索结果,笔者理解为这是在尝试,所以用户体验与之前的展示结果差异不大。

  涉及到网页搜索,必然涉及到流量输出,此处是指搜索结果的流量输出。盈利模式是否又会和传统的搜索引擎类似,提供搜索相关性广告和竞价排名等服务呢?笔者认为从求稳的角度来说,这种方式可以作为前期最主要的方式。也相信“美丽说” 和“蘑菇街”等社区的消费分成的盈利模式在新浪微博上一样可以顺风顺水的实现,在微博搜索上则更可以借此东风。

  简单分析到此,肯定也不尽全面,也欢迎有兴趣的朋友一起讨论。

  写到这儿,笔者还是想感叹,新浪微博手中握着好多宝库,而新浪微博眼前却一直处于亏损严重状态。未来在其产品线铺全面开和壮大之后,新浪微博能否将这些宝库都发掘出来并实现对应价值?这是个极具诱惑的话题!而更多的人,除了站一边拭目以待以外,还真没啥其他办法和动作了。最后,希望新浪能让大家看得过瘾。

作者:佚名 来源:不详
共有评论 0相关评论
发表我的评论
  • 大名:
  • 内容:
  • aa0000.com(www.144go.com) © 2018 版权所有 All Rights Reserved.
  • 粤ICP备14041623号-3