1m等于多少kb,小于1m的照片怎么弄

1m等于多少kb,小于1m的照片怎么弄 每晚10点,捕获技术思考和创业资源洞察“分而治之”( Divide and conquer)方法(又称“分治术”) ,是有效算法设计中普遍采用的一种技术。有一个1G大小的一个文

每晚10点,捕获技术思考和创业资源洞察

“分而治之”( Divide and conquer)方法(又称“分治术”) ,是有效算法设计中普遍采用的一种技术。

有一个1G大小的一个文件,里面每一行是一个英文单词,词的大小不超过16字节,内存限制是1M。请设计一个算法思路,返回频数最高的100个词.

初步一看,要处理的文件大小1G,可内存却只有1M。我们知道1G的文件用1M的内存空间处理不太现实。按照1M的上限来计算,假设每个单词都为16个字节,那么1M的内存可以处理多少个单词?

我们来计算下,1M = 1024 KB = 1024 * 1024 B 。1M / 16B = 2^16个单词,那么1G大概有多少个单词呢?有2^26个单词,但是实际中应该不止,因为我们是按照最大单词长度来计算的,有可能有的单词只有两个字母。

大数据面试题:考察1M = 1024 KB?

方案1大概思路:

  1. 分而治之/hash映射:顺序读文件中,对于每个词x,取hash(x)P00,然后按照该值存到5000个小文件(记为x0,x1,...x4999)中。这样每个文件大概是200k左右。如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解得到的小文件的大小都不超过1M。
  2. hash统计:对每个小文件,采用trie树/hash_map等统计每个文件中出现的词以及相应的频率。
  3. 堆/归并排序:取出出现频率最大的100个词(可以用含100个结点的最小堆),并把100个词及相应的频率存入文件,这时我们又得到了5000个文件。最后把这5000个文件进行归并(类似与归并排序)的过程。

类似这样的方案应该有很多,我们共同去研究学习,经验都是个人实践总结出来的,以上仅代表个人观点。以此分享给大家,不足之处望大家留言补充。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/24284.html

(0)

相关推荐

  • 赤瓦不剌的意思(字义,诗词)

    词组赤瓦不剌的意思(字义,诗词)基本解释详细字义 赤瓦不剌拼音:chì wǎ bù là注音:ㄔˋ ㄨㄚˇㄨㄚˋ ㄅㄨˋㄈㄡˇ ㄌㄚˋㄌㄚˊ解释:见"赤瓦不剌海"。基本字义
    赤chì(ㄔˋ)
    1、红色,比朱色稍暗

    阅读 2021年11月17日
  • 为什么帅的人鼻子都高,为什么帅哥鼻子都很挺

    为什么帅的人鼻子都高,为什么帅哥鼻子都很挺 文 | 幸孕姐(高级母婴护理师,原创不易,请勿抄袭)我们在生活中总是对女生的外貌得较多,但实际上男孩子的外表也十分重要,与长得好看的人类似,长得帅的也同样会受到优待。但是在

    攻略 2021年10月25日
  • 丰田纯电汽车最新消息,丰田有纯电动汽车吗

    丰田已经不止一次在公开场合公开表示,不鼓励全部汽车都换成纯电动汽车,或者说纯电动汽车不是以后主要的电动汽车模式。

    科技 2021年10月26日
  • i7 4790相当于i5什么水平(i7 10710u相当于什么级别)

    型号:华为MateBook D15 系统:视窗11 软件版本: I76700k属于中高端水平,其最大核心频率为4.2GHz,核心数为四核,8MB L3缓存,其采用14nm制造工艺,...

    2022年1月21日
  • 梅西巴萨首个进球,梅西在巴萨进了多少球

    巴萨86分钟遭大巴黎4球完爆!梅西双手叉腰无奈!还去客场吗?网友提问:巴萨86分钟遭大巴黎4球完爆!梅西双手叉腰无奈!还去客场吗?优质回答:必须去啊。不去怎么82拉菲其他网友观点当然要去了,姆巴佩说:梅西老兄,德国的拉菲

    攻略 2021年12月10日
  • 抖音小店无货源:开好店之后,这三种商品展现方式你一定要会

    抖音小店无货源:开好店之后,这三种商品展现方式你一定要会
    x哈喽大家好,我是戈多喵。现在网上有非常多的文章来教你选品,可是就是没有文章说选好品之后商品怎么展现出去。毕竟我们是开店的,商品再好,没人看到也是白搭。今天戈多

    电商 2021年12月13日