老三的BLOG

关注google、关注百度、关注google earth

« 在Google Earth上看美国大选Google Earth上能看中国城市天气预报 »

百度CTO说:Google反作弊不如百度



21世纪经济报采访了百度CTO(已经确定今年年底辞职),在其采访过程当中,提到了百度相对于google的优势。部分内容如下:

《21世纪》:与Google的反作弊比,你们有什么优势?

刘建国:说Google的技术比我们好,我不认同,他们主要是不够集中。比如反作弊的, Google中文就做不过我们,这有技术问题,还有人力,要知道作弊惯用的手法,而Google不知道。这个模式我们比Google发展得更快,我们更接近用户。我们中文的理解做得比他们好,比如像分词、切词,中文是一个一个字,放一块儿,那些字和词是不一样的。我做得比Google好。他们没有专门研究中文。

《21世纪》:你们是用自己的技术?

刘建国:是的。我们中文分词,这个技术里面没有英文,中文本身的处理我们已经到位,还有语法的应用,我们做得很好。语法是主谓宾,如何用,老外不理解。

《21世纪》:你们用以前的文字识别技术吗?

刘建国:对中文我们有一套独特的做法,现在成熟的技术都不太适合我们。

《21世纪》:有没有用哪个平台?比如大的软件?

刘建国:这个软件是我们自己做的。

《21世纪》:是应用软件?

刘建国:不是一套。我们直接用自己的东西。比如说词典、分词、词汇。这不是释义的词典,可能有很多资源。比如我们用人民日报的语料库,我们购买这样的资料。更多的平台是我们自己的搜索引擎。我们有日志,总结新的词汇。我们对10亿计的网页也能分析。这是Google中文做不到的。至少没有聚焦。另外从中文用户体验来说,我们也做得比他们好,比如用户体验是什么、习惯是什么。比如相关搜索,在中文里面,用户心里想的一个事情,比如“软件”这个词,用户心里想的是软件下载,但搜索的是“软件”这个词,他输入“软件”,与搜索不符。百度会提示得更加精细化,到底是软件下载还是加密,全自动服务,这样用户会觉得很好。类似的工作我们下了很多功夫。其他像拼音检索,错别字纠正,我们也能正确提示。现在有些搜索正在抄我们。我认为不能崇洋。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

最新评论及回复

最近发表

Powered By Z-Blog 1.7 Laputa Build 70216

Copyright 2006 hilaosan.com Rights Reserved. 备案序号:沪ICP备06047717号