百度学术能否替代 Google 学术网站?有没有其他选择?

关注者
5951
被浏览
446936

186 个回答

宁愿用百度学术也不愿意用我KEG实验室的 ArnetMiner 吗?虽然人已经毕业多年,但还是要借这个问题坚定不移的推广一下ArnetMiner,绝对是CS领域的第一学术搜索引擎,别说百度学术了,在很多方面连Google Scholar也是轻松秒杀啊。

1. 刚进入一个领域,你最要紧的是了解这个领域顶会、牛人和经典文章吧,比如搜一下Semantic Web (Search 'semantic web'),你会得到这样的结果。

除了能够得到相关的论文,还能够基于话题模型抽取出最权威的领域专家和顶会,给你最全的行业领域指引啊。

2. 每个细分领域的牛人也就那么几个,紧跟牛人的步伐就能紧跟学术的潮流啊,所以多看看牛人的研究趋势和最新成果吧,好吧,来个最牛的例子,UIUC的韩老板(Jiawei Han - Professor)。
左上角的profile由他们的个人主页语义抽取,右上角的social network是学术合作的关系和分析出的师生关系,中间的曲线是基于话题模型根据作者文章抽取出的此人的研究方向变化曲线。最下面就是该专家发过的文章啦,最新最全,一目了然。当然还有一些细节,大家可以自己去体会。

3. 什么?不知道一个领域的牛人都有谁,不相信我们推荐的牛人的客观权威度?那给你一个客观的权威排序列表,按照H-index排的总权威了吧。给一个data mining领域的排序结果(Experts ranked by hindex)。


Philip Yu,Jiawei Han,嗯嗯,都是学术界的大老板啊。还有一个有意思的是Rising Star(Experts ranked by risingstar),就是学术界冉冉升起的新星,当时做的这个排序模型是专门发现学术新人的,居然排出来了很多曾经的师兄师姐,甚是佩服,希望有一天你也能出现在Rising Star ranklist里面哦。

4. 还不够震撼,不够好玩吗,那试试“学术地理搜索”呗(AMiner - Academic Researcher Social Network Search

展现了学术牛人们的地理位置分布。没错哦,CS领域最牛的国家就是美、欧、中、香港啦,哦,中间那个貌似是以色列。

还有CS领域的全历史演进图,可以看到从最开始的模式识别,分出神经网络、图像处理、机器人技术,再到后来的机器学习、机器视觉、自然语言处理,再到后来的深度学习、概率图模型等等等等,你可以去了解每个阶段的发展历史!

5. 只有分析和挖掘也不够,还是要有一些实实在在的便捷功能,比如提供每篇文章的BIBTEX,甚至是paper的pdf,随便找一篇(Scalable and Robust Construction of Topical Hierarchies.)绝对是CS研究僧们的福音不是吗。


细节的地方太多太多了,很多很实用很有趣的功能等大家自己去发现吧。自己也确实在参与Arnetminer的开发过程中受益良多,最后祝唐杰老师所在的KEG实验室早日跻身世界数据挖掘领域的顶级实验室。

PS: 评论中有很多兄弟姐妹们提了很多很宝贵的意见,我觉得特别好,希望大家能够多提意见,多拍砖,我到时候集中发给唐老板,说不定你的建议就可以体现在下一版中了。。。汗,越来越像做广告了。。不过真没啥利害关系,只是很热爱之前的工作,也希望能给为大家开启学术研究领域的另一片小天地。
本来找了一些关键词,打算对这几个学术搜索引擎做个评测。关键词的选择包含多个领域,没有加入任何个人倾向,以求真实反映几个引擎的水平。其中也包括 @曾博提到的bing学术(其实是叫Microsoft Academic Search)。答案写了一多半,截图也做了不少,但后来全删掉了。原因很简单,因为根本没有意义。作为非专业领域的研究人员,你根本无从评价用这个关键词搜出来的那些文献对你有没有参考价值。作为专业领域的研究人员,你也不知道是不是只有你这个领域的东西用这个搜索引擎结果比较好。

以我个人比较擅长的领域搜索结果来看,百度学术,Google Scholar和Microsoft Academic Search这三个引擎里面,Google的结果相关度比较好,Microsoft与其不相上下,百度的稍差。但这个还是要看搜索的关键词,有些关键词在这个引擎上结果比较好,有些就很差。他们三家本质上的区别在于默认情况下,Google Scholar会搜索作者名,百度会搜中文文献并且没法改,Microsoft只会搜论文标题和内容。

在学术搜索里,更懂中文其实没什么优势。除了某些特定领域外,大家都知道中文期刊和论文是个什么水平。至于英文文献来说,百度的索引量好像还不够。比如你直接搜Deep learning,百度只能给出1010个结果,而Microsoft是13,123,Google是2,830,000。虽说一般只看前几页的内容,而且后面也有很多不太相关的搜索结果,但多个关键词的结果来看,Google能索引到的东西总比Microsoft和百度多,而前几页的内容基本上Google和Microsoft是差不多的,只是排序可能不同。

从实用性看,百度无疑是最差的,功能简单到有些简陋。看起来只是个简单的试用版,除了搜索其他功能一概没有,估计以后可能会增加。而另外两家功能相当丰富,比如论文的引用统计,生成不同格式的引文或者导出到软件,基本能用到的功能都有了。

其实实际使用中并不存在转向问题。一个搜不出来想要的,就换一个好了。可能你想搜索东西的时候,最先打开的就是Google Scholar和Microsoft Academic Search,实在不行也试试百度。但不是说你用Google这辈子就不用百度了。