首页>>>行业应用>>>移动     [相关厂商信息]

Myspace首席技术官谭晓生:移动社区搜索

2008/12/19

  12月18日-19日,第二届CNGI工程技术论坛暨移动互联网国际峰会在北京召开,会上,工信部副部长奚国华、中国移动副总裁沙跃家、中国工程院副院长邬贺铨、以及各大设备厂商、终端制造商、内容服务提供商等出席了会议并做了主题演讲。

  以下是Myspace首席技术官谭晓生的演讲实录。

  谭晓生:谢谢主持人,刚才前面几位嘉宾很多都谈到了facebook和Myspace,今年三月份我们给这个网站起了一个中文名字叫做聚友网,Myspace对中国很多用户听起来都会有很多的困难的。Myspace是从互联网起家的SNS网站。因为它有非常庞大的互联网的基础,所以开始比较早的进入到手机的应用,从Web的应用到嵌入式客户端的应用都有,目前在Myspace.com有各种各样的传统的操作系统方面的应用,也有比较新的像iphone上面的,像Google的系统下面都有客户端的SNS的应用,但是应用的模式基本上还是从互联网到手机的扩展,没有太多的做完全基于手机的SNS,更多的把互联网上SNS的功能移植到手机的客户端上,方便用户的使用,目前还是处于这样的阶段。

  对于Myspace中国来说,聚友网我们在08年推出了第一个免费版本,也是考虑到中国手机的用户和互联网的用户,其实用户使用体验和西方的用户差别都比较大。今天谈到的题目是移动社区搜索,在07年5月份我们就组建了一支团队,是来做个性化的信息搜索,这里面正好在移动社区收缩当中可以使用到这样一个技术。首先这是一个背景数字,我就不过多的做介绍了,中国互联网的用户市场仍然是保持非常快速的增长的。社区交友的用户量也非常大,而且尤其在东亚区,对SNS的使用比例也是比较高的。

  用户为什么在社区里面要使用搜索?这种使用其实还是有点不太一样,在社交网络里面,他如果要来搜索,第一个会在已经存在的人际关心网络里面找到其中某一个人,或者某一个人的信息,在SNS里面分,分network和networking两种不同的分支,第一个network是把已经有的社交网络搬到移动互联网或者客户端进行访问,这种要找已经有的这些朋友,找到已经有的联系人,然后找到已经有的联系人,基本上一个要看他最近有什么样新的动向,比如说他web状态信息是什么,或者他现在和谁又成为了朋友,他新发了一张照片或者新写了一篇博客等等,这是对已有朋友的了解,找到这个人以及这个人相关的信息。还有一种需求是在陌生的环境里,他要交新的朋友,像networking这种应用,就是要找一个人去聊一聊,要结识新的朋友,一般的目的一个是为了打发时间,另外就是为了找一些艳遇这也是非常正常的。在陌生人的网络里面,陌生人的量是非常大的,在Myspace有3亿多注册用户,在聚友网内也有差不多将近600万的用户,在这里面你找到什么样的人是你所需要的,如果一个个看和聊成本是非常高的。另外他不是为了找人,他上来是为了找有趣的内容,比如很多上聚友网的内容很多的是为了看博客和照片,尤其是看照片是第一需求,找各种各样的照片看,看到谁比较来电,就会去看看这个人写的博客,或者去他的空间看一看,这是一种比较典型的应用。我们如果在手机终端上做这样的服务就相当的困难,比互联网还要难。手机终端的展现能力比较有限,你看照片的话不可能看尺寸太大的照片,如果看空间的话,往往都是抽象出来,比如说这个名字是什么,昵称是什么,多大年龄,是男的还是女的,这些信息的展现非常有限,和互联网的应用有很大的差别。在这种情况下,用户的互动也不会像电脑上一样,找的如果不太合适很方便的翻页,可以浏览的比较快,通过手机终端去做的时候,交互的速度相对比较慢,通过大量得按键操作,这个时间也相对来讲比较长,这里面就有如何我们给用户提供,仅仅是给自己有用的信息。其实我们有一个理念,什么东西是信息呢?信息是用户能够信任的,并且和用户息息相关的这些消息才称之为信息,对于用户是有用的这些信息。

  怎么解决这些问题?我们从去年5月份实践就是要做个性化的信息提取,第一包括了用户个人的信息空间,和他自己要检索的信息空间,和我们这个社区里面已经有的信息空间,在里面要做一些匹配,目前我们做了一些尝试,首先看我们有什么样的东西,就是在这种社交网络里面有用户的姓名,有他所在的国家或者地区,有他所在的地域信息,其实这里面地域信息一个是通过IP地址自动提取的归属地在哪里,另外就是有年龄和性别,在Myspace我们还会要求用户填他的性取向,其实在中国目前比较开放的国家,他填的还是蛮开放的,同性恋什么的也都会填上去,而且基本上也不会隐讳这些东西。用户会来填写自己的兴趣和个性,是喜欢听音乐,喜欢古典还是什么音乐,有些什么爱好,都是自己填出来。还有他会填自己受教育和工作的经历,在Myspace这种陌生人的交友网络上填的相对小一些。比如像facebook,像国内的校内网用户的信息就会填得很好,你帮他检索所需要的人或者是内容的时候,都会非常有用。他感兴趣的群体这个是在Myspace填的很多的,就是你上来为了干什么,你为了结交什么样的人?这是用户自己所声明的信息,这是我们作为用户兴趣显性挖掘的时候,我们当做显性信息。

  还有其他隐性的东西就是这个用户在上面交了什么样的朋友,他的朋友都有什么样的特性,我们通过这个都是能够知道的。还有这些用户自己都产生了什么样的内容,他说他自己上来是为了找音乐爱好者的,但是如果他整天看的都是美女图,看的这些博客的内容也都是在某一个另外的倾向上,我们可以认为用户自己声称的东西和实际的表现是有差别的,这是用户的行为。这些用户自己产生和消费的内容,比如他读了什么东西,写了什么东西,他都看过什么样的空间,他和朋友互动的时候,这里面用户在社区里面经常会碰到美女,认识一下,交换一下QQ号,还有就是直接的问,你有没有兴趣我们晚上一起出去什么的,这种都会有,也是反映用户的行为特性的,我们虽然说从隐私保护来讲别的用户不会知道这些信息,但是我们做后台分析的时候这是能够知道的,有多少人的兴趣是一夜情,这个我们也是可以知道的。比如对广告点击的历史也可能知道,他感兴趣的内容是什么,比如说现在投了三星的广告,这个用户是不是点击了这个,点击了这个,这个阶段他对手机感兴趣是相对比较大的。他安装了一些什么样的SNS,现在Myspace也是做了开放平台,今年4月份的时候我们做的,在这西面用户安装了什么样类型的也是一个隐含的信息,他喜欢展示类的还是喜欢和人去互动类的,还是安装的是一个比较偏暴力的游戏,这些信息部分我们叫做隐性的挖掘,就是用户隐性信息的挖掘,根据他的行为,不是他自己声明的,是自己实际做的。

  这个项目是在去年5月份立项的,今年年初我们开始和国内一家机构进行合作,这个方面也非常有意思,个性化信息检索是我们国家自然科学基金一个项目,研究机构有一个痛苦的地方,他们没有用户海量的数据和用户行为的数据,Myspace正好有这样一个特点,我们和国内一家科研机构达成一个合作,由他们帮我们做一些基础的科研,我们提取一部分用户数据来作为科研输入的东西,以及作为验证的一些资料,同时我们自己有一个三四个人的团队,由他们来做商业化,就是怎么样转化到实际中的应用,到后面大家会看到我们有一个系统,是一个内部使用的,在我们产品上实际上已经投放了,在内部要评估,叫做information for you。在这里面可以看到,这是inforU的截平,每个ID对照的是一个用户,这个ID对照的用户来说,我们这里面提取出来的可能会有的兴趣,这个提取是显示和隐性两部分都有的,他自己声明的是什么,他写的博客是什么,目前还没有加入到用户人和人之间的互动,而是自己产生的内容,他在博客里面写的,和在论坛里面发的东西,我们提取他对什么感兴趣,这个里面有阅读、轮滑,喜欢电视,又练瑜珈,又看了《狼图腾》这个书,这些东西其实在做用户匹配的时候,给他推荐朋友的时候,我们现在在传播的模块里面有一个这个人你可能会认识,或者这个人你会感兴趣,给他推荐的时候会加上这样的匹配。这里面有一个我们是同行,或者我们过去是同事,或者是同学,这个比较多的是从显性化里面的,他如果填了社交网络可以填业缘。地缘我们是同一个城市的,或者我通过IP地址可以看到你是非常近的区域的,我和你所处的地理位置比较近,比如像一些群组里面,比较明显的要做一些线下活动,给他推荐的地域至少是同一个城市,可能产生一些事情,这是地缘。音缘,Myspace在整个全球里面有980万的音乐人,在中国虽然中国的本土音乐很少,但是毕竟音乐是Myspace的一个招牌,很多人上来也是为了听欧美的音乐或者和音乐人有一些交往,音缘就是你们都是喜欢某种类型的音乐,我们会记录用户所有的音乐消费历史,在空间的玩法里面,用户为了找某一个音乐放在自己的空间里面当做空间的背景音乐,大多数用户都有这样的选择。他历史上都选择过什么样的音乐,我们都是给他记录下来的,叫做歌单,从这个歌曲来说,其实最后可以分出来,这个音乐是属于什么类型的音乐。在音缘里面,给他推荐个性化信息的时候,这首歌你可能会喜欢,或者这个人他的音乐方面的爱好和你非常像,你愿不愿意看看是不是可以成为朋友。

  这是我们实际在产品里面的体现,就是你可能认识他们,但是这个产品的体验做得还不是很好,我们马上要推出的版本里面会直接告诉你为什么我推荐他。这是我们的一个问题,给他推荐了,但是没告诉他为什么你可能会和这个人有缘,这里面的信息有,只是没有把这个展现出来,在下一个版本里面这些东西就都会有的。

  这是Myspace日本的手机客户端,Myspace在全球里面,在手机上做得最好的是Myspace日本,美国目前Myspace.com所做的产品,基本上就是把Web上的功能引到手机上,就是所有的功能都可以有,但是用户的使用体验的确用起来不是很方便。包括Myspace中国我们是把Iphone也开发出来了,应该这几天就可以发布。这个版也是继承了美国的风格,就是仅仅是完成了所有的功能,功能很全,我们估计中国用户用的时候不是很方便。像刚才说的我们的推荐,这部分内容也没有带进去,第一个版本也没有带进去,但是下面会集成进去,第一个我们当做练手的Iphone,下面会往手机平台上做。这是Myspace最新的一些消息,这是网站推荐的内容,这是网站推荐的人,还有这些朋友请求,这个版本比较多的就是功能性的,在这里面可以看到有音乐内容,可以给你推荐音乐内容,允许用户对别人进行评价,这边是做广告的,这里面在Myspace Japan里面会有TV,在中国TV是进不来的。这是要找某一个音乐人的界面,这是对于用户的空间来进行评级,对音乐来进行评级,对于视频进行评级,这部分的东西一个是和搜索相关,另外就是和方式相关。在这里面有非常大的改进空间,可以做个性化的,根据用户过去消费的历史进行匹配。

  回过头来做一个总结,个性化信息检索目前处于一个什么阶段?个性化信息检索,研究的开始其实在上个世纪的80年代就开始的,包括斯坦福、卡内基梅陇、微软的美国研究院,以及国内的北大研究室,复旦大学、中科院计算所、哈尔滨工业大学等等这些研究机构或者是学校,其实早就开始在做个性化信息的检索。但是真正的个性化信息检索开始引起足够的重视,比如说进入到国家自然科学基金应该是去年到今年的事情,而研究机构在这方面其实是面临着很大的困难,经费还是小事,最主要的没有数据,而这方面的研究,其实大量的要靠样本,原有的数据拿过来做模型,看这个模型训练的结果,最后再看评估体系,往往还是加上是人介入的。就是一般的比如编辑拿过来,用人工来判定,人工来判定当做一个学习的资料去学,再由人工判定的资料做一个自动的判定,最后往往还有大量人工的判定,检测模型的效果,不行的话再进行调整,这是用的主流的方法之一。在这里面包括了要建用户检索的信息空间模型,在做这种个性化信息检索里面,还会挖掘人和人之间的关系,挖掘人的社会属性,他的朋友是什么样子的,他的朋友的信息也会当做他检索模型里面的信息要推送过来。同时最后还会做一些协同过滤方面的东西,就是和他相似的这些人检索信息的时候有什么样的特色,最终也会当做他所检索信息的一些属性进来。就是他的朋友以及系统给他自动聚类出来的,这些人他们可能在现实生活当中不认识,但是他们检索信息的模式非常相近,这部分也会当做检索信息的内容给出来。目前还是一个非常初级的阶段,在Myspace的产品里面,我们目前仅仅是用到了推荐朋友,给他推荐新朋友,第二个是阅读博客,或者阅读论坛的时候,尤其是阅读博客的时候,会给他再推荐一些其他的内容,用到内容推荐,这是目前非常初步的应用。

  预计在明年年初的时候,我们和科研机构第一期会出来一些成果,这些成果出来之后,会继续的用在网站和手机版的推荐上面,应该会再往前走一步。当然真正从科研项目来说,时间是五年,我们还有四年时间,只是一个初步的,所以它仍然在发展。但是在企业上,在商业上的应用应该是已经基本上能够用了,成熟期还谈不上,但是应该是可以用了。存在的问题就是潜在有隐私的问题,当这个研究目的,比如说用户的数据我们拿出去做分析,签有关的保密协议等等这些东西,在中国毕竟用户的隐私大家还不是那么在意,如果这个事在美国的话弄不好可能会被告了,但是做一个研究也是很无奈的事情。对于它的前景来说,我个人是非常看好的,因为它存在非常大的需求,让用户很快的找到信息,用户的方便性。中国之所以能够树立一个非常高的互联网的门槛,跨国的互联网公司进来很多发展的不是很顺利,和用户的使用心理有很大的关系,中国的互联网用户非常懒,而且不主动,如果你不能够主动的把信息推到他的面前去看,让他寻找去学习的话就非常难以成功。我们去年当时发布Myspace是原汁原味的产品,结果我们被骂得狗血淋头,砖头真的是满天飞,有一个月时间我们压力特别大,这也是中国互联网公司的机会,因为它直接拷贝进来的话非常难以成功,Google是另外一个特例,Google的搜索之类的东西其实是非常简化了,但是如果在社区上面,在中国绝对需要这个方面的创新。目前我们做的个性化信息检索项目不是Myspace全球做的,仅仅是Myspace中国自己开始的一个项目,在这方面是能够提高用户体验的一个方式。

  我的演讲就到这里,谢谢大家,谢谢主持人,祝大家中午有一个好胃口。

搜狐IT



相关链接:
NTT Docomo张永生:移动SNS的个性化与管理 2008-12-19
广电总局易凯:手机电视的运营管理和应用 2008-12-19
联想移动梁军:移动宽带互联网的未来 2008-12-19
谷歌中国总裁李开复:移动搜索精准至关重要 2008-12-19
闵昊:应用于手机移动支付的硬件方案QSIM 2008-12-19

分类信息:     热点专题_移动增值_文摘   行业_移动_文摘