云计算 频道

腾讯CTO:"四化"是搜索引擎未来发展趋势

  腾讯搜索引擎技术的产业化

  提问:我感觉到非常好,下一代搜索引进四化,个性化、社区化、智能化、移动化,我觉得你这个四化非常好,但是我想提出一个问题就是,你搜索引擎的工具以后主要是腾讯用,还是别的公司也可以用,因为现在每个公司只要是搞互联网的,包括人民日报都在做自己的搜索引擎,这是一个问题?第二个问题也想到数据的问题。

  前几天有一个报道,台湾的一个做饭的大老爷们,40多了4、5点多在撒尿被Google给拍下了,给上网去了,不一定围绕着把这个东西弄起来,其实是在收集数据,说不定哪天就有用。所以,腾讯也在收集数据,主要还是在社区网,在自己的客户群,你们有没有对这些大规模数据的收集想法,有没有其他想法?

  第三个问题我听出来客户群不对外开放的,你有10个亿…?

  熊明华:10个亿的注册帐号,国内帐号在线是3.8亿、3.9亿,不到4个亿。

  提问:这些客户群不对外开发的,因为是你的命根子,对外对你有什么好处,不开发有什么好处?

  熊明华:这个问题非常好。

  提问:第四个问题刚才跟这位先生提的有点相关,你实际上是在做社区内很快的深度搜索,一个比较好的服务形式很快的时间内提供给客户,这是很好的方法,还有推送服务。针对某些特定人群,我有什么样的服务,比如我要开一个国际会议,或者开一个产学研讨会,针对这方面有兴趣的人推送过去,这种有没有考虑,他在今后市场上面有没有一个大的,或者说是人群,分不同的小组,因为推送服务人也挺多?

  熊明华:感谢张院士,这四个问题我觉得非常恰当关键点。第一个问题腾讯做搜索,将来是不是一个开放式的,还是只给自己用。其实目前腾讯,比如我们在全国大概有30个数据中心,主要的数据中心大概有5个,这些数据中心其实的目标是说他是已经可以到为第三方提供这种数据整合服务的。为什么这个云计算,我不知道大家有没有注意,大概2、3个星期前,我们在上海跟思科CEO有一个联合记者会,当时我们其中有一个点大家可能不太关注,我们会把企业服务作为腾讯未来发展的一个点,其中最主要一个点,因为腾讯是做即时通信出身,我们跟一个给企业内用的REM,包括国务院办公厅也在用,目前我们跟思科一个合同可以通过我们这个系统跟电话进行互联互通。这个其实就是我们的一个基础,腾讯现在的战略就是说,希望将来能为更多的企业,包括第三方的互联网在提供这种搜索,包括搜索,包括通讯,包括这种文档管理方面的一个服务。

  其实我们以前的博士都是把这套软件免费给这些单位,他们自己装,自己运营。我们目前已经推出另外一款,我们来做你们来建帐号,不要管要多少服务器,你就告诉我要多少人的容量,然后我来帮你做服务器的运营,这个其实是我们的一个切入点。所以,我们的设备还是思路很清楚,将来包括搜索服务都属于面向企业云计算的,所以这是回答了你第一个问题。

  刚才讲四个问题比较多,所以我们跳一下。针对第二个问题,这个其实4、5年前我们跟高德国内做地图的,我们跟他谈过一些交流合作,高德就做过一件事情,开着车到中国城市去转,后来据说有一些政策上的规定他们被禁止了。我们就跟高德建议说,他们应该到海外各个地方去转,去收集这个数据,这个数据收集我觉得张院士提出一个很好的课题,这个课题就是我们现在做数据挖掘,数据采集的一个很重要的课题,就是说我们怎么让用户,现在的这种Google用车自己去采集的方式他一个是投入大,一个是慢。但是Google还做一个很好的项目,他让用户到上面去填数据,这是我们目前在做的一个数据,比如我们住在中关村一带,你们家附近有什么饭碗或者什么东西,这个东西可以有客户提供…

  张尧学:我打断一下,好象我们对吃饭比较感兴趣,举什么例子的时候一般都是举吃饭,中国有特点,就是行业有行业的数据,为什么新华社他为什么自己做,因为他有几十年包括采访,写的文章这些东西,我就说他能不能获得我们国家互联网企业合作,针对特殊用户做特殊服务,不仅仅是通过行业,还比如包括教育、医疗,因为它是社会主义国家的特点,你搜索引擎和客户怎么样和大规模数据库结合起来?

  熊明华:所以我同意这个观点,在搜索领域有一个技术改革暗网技术,就是藏起来。这个里面跟这个有点类似,包括新华社,包括国家图书馆,包括医疗科学家,其实我们跟医疗方面,我们就跟很多机构谈过,我们现在在做这个。国内有一个网站叫好大夫,比如你看这个病大夫怎么评价,就把评价写上去。但是,当时这个网站建立的时候,他派人到各个医院去抄数据,后来发现中国其实有一些所谓的专家数据,我们现在跟医疗协会机构在谈。

  张尧学:我觉得最好跟政府谈完,政府谈完有下文。

  熊明华:政府能够支持这个最好。

  张尧学:这个解决几个问题,一个是你数据安全的问题,第二个就是你经济模式的问题,首先安全解决了使他们感觉到你不会,比如让人家滥用,或者让人家给你偷走,推动信息化的核心就是把数据整理在一起,然后按照什么样的方式给人家去用。我们做了很多这方面的工作,包括数字图书馆,那是最大的一个数字项目,政府也投了很多钱,起码已经投了10个亿,这个东西做出来以后如果不和你的商业模式挂钩是很难用起来的,风险也很大,需要有一个安全问题,我们国家有很多数据很大都放在那,比你自己收集要强,我们数据有时候可信性有一些问题?

  熊明华:完全同意张院士的建议,如果政府能出面来帮助作为一个产业政策来进行这种集中式的数据整理。

  提问:张院士两个话是两层意思,现在搜索引擎是腾讯的私有技术,这个私有技术如果拿到另外一个领域去弄,另外一个领域搜索数据要放开开来,你们会很乐意把你们的数据拿过去用给很多人服务,包括腾讯也会从中获得商业利益,这样的话风险非常大。因为,开放那些私有领域的技术,比如国家统计局,中国过去40、50年经济发展那些数据,新华社那些数据,包括国家图书馆那些东西,数据一旦开放有一点点安全问题,这个数据价值就会大打折扣。刚才张院士他是站在国家的立场上说,在国家很多重要领域有很多私有数据,你们愿不愿意把你们很重要的搜索引擎数据给那些私有领域去用?

  熊明华:绝对没有问题,可以免费提供。

  提问:一个企业没有商业利益是不会去做的?

  熊明华:我们有一个腾讯公益基金会。

  提问:不一定免费这是一个战略。

  熊明华:所以我觉得说,如果国家把这个作为一个产业来发展任务的话,我们肯定愿意承担。

  张尧学:你的用户群为什么不开放,开放对你有什么好处,什么坏处?

  熊明华:其实用过我们Qzone的用户可能知道腾讯的Qzone是向第三方开放的,目前我不知道有人有没有用豆瓣网,有人提出豆瓣网在Qzone里面就被整合的。中国发展阶段,目前确实有一个最大的问题是什么呢?怎么去保护用户的隐私和防止隐私被滥用,个人信息滥用。

  张尧学:不开放是为了保护用户隐私?

  熊明华:目前我们是有限度的开放,跟我们信任的伙伴才会开放,像豆瓣网,豆瓣网是读书,有一些心得。包括大众点评这些比较好的合作伙伴。当然了我们现在还不能完全开放,完全开放发现有很多国内不法分子滥用,这里也呼吁怎么把这方面更完善一点,更遏制这方面的恶意使用。

  张尧学:服务推送?

  熊明华:服务推送我们搜索目前已经做了一个尝试,订阅你的搜索服务,今天云计算你可以订阅跟云计算相关的一些文章,搜索情况,但是现在还是试验阶段。但是,这一点我们发现是非常有用的,因为特别是对这种科研人员来讲,他要跟踪某一个热点,甚至跟踪某一个会议的情况,他就可以通过这种方式来实现。这一点我们从技术手段上是有的,关键是说怎么去把用户的需求更准确的描述出来,因为现在只是很简单用关键字,比如云计算关键字是不对的,很多事他是不需要关心的。怎么样让他通过自然语言描述出来,我需要什么样的信息,当然人看就看明白了,但是靠计算机处理目前水平还不够。

  张尧学:假如有一个好的服务推送模式,卖给你会很高兴,出很多钱都会买吗?

  熊明华:那当然,说完一个简单中文最核心的技术改分词技术,就是把一个中文话分成一个关键字提取出来,这个分字技术中国做的好也只有78-80%。如果你通过博士论文把研究中文分词做到90%的话,那腾讯来肯定可以给你颁个工程师的称号。

0
相关文章