...
对10亿个搜索关键词的日志文件,如何快速获取到热门榜Top10的搜索关键词这个问题应该是典型的TOP N问题。内存又有限,基本思路是分而治之。1.把文件分割成足够小的N份2.分别对每份取top n 3...