算法通过村第十一关黄金挑战——位运算如何实现压缩储存

news/2024/7/24 3:20:52 标签: 算法, java, 数据结构

大家好,我是怒码少年小码。

由于现在处于备赛阶段,接下来我写的代码都将使用Java语言。

用 4 KB 内存寻找重复元素

题目要求:给定一个数组,包含从1到N的整数,N最大为32000,数组可能还有重复值,且N的取值不定,若只有4KB的内存可用,该如何打印数组中所有重复元素。

分析:本身是一道海量数据问题的热身题,如果去掉“只有4KB”的要求,我们可以先创建一个大小为N的数组,然后将这些数据放进来,但是这里数组最大为32KB,而题目有4KB的内存限制,我们就必须先确定该如何存放这个数组。
如果只有4KB的空间,那么只能寻址842^10个比特,这个值比32000要大的,因此我们可以创建32000比特的位向量(比特数组),其中一个比特位置就代表一个整数。
利用这个位向量,就可以遍历访问整个数组。如果发现数组元素是v,那么就将位置为v的设置为1,碰到重复元素,就输出一下。

java">public class FindDuplicates32000{
    public void checkDuplicates(int[] array) {
        BitSet bs = new BitSet(320000);
        for (int i = 0; i < array.length; i++) {
            int num = array[i];
            int num0 = num - 1;
            if (bs.get(num0)) {
                System.out.println(num);
            } else {
                bs.set(num0);
            }
        }
    }
    class BitSet {
        int[] bitset;

        public BitSet(int size) {
            this.bitset = new int[size >> 5];
        }

        boolean get(int pos) {
            int wordNumber = (pos >> 5);//除以32
            int bitNumber = (pos & 0x1F);//取模32
            return (bitset[wordNumber] & (1 << bitNumber)) != 0;
        }

        void set(int pos) {
            int wordNumber = (pos >> 5);//除以32
            int bitNumber = (pos & 0x1F);//取模32
            bitset[wordNumber] |= 1 << bitNumber;
        }
    }
}

这段代码定义了一个名为FindDuplicates32000的类,它包含一个名为checkDuplicates的方法,该方法用于查找数组中的重复元素。这个方法使用位集数据结构来查找和跟踪数组中的每个数字的索引。下面是对这段代码的详细解释:

  • public class FindDuplicates32000:这是一个名为FindDuplicates32000的公共类。
  • public void checkDuplicates(int[] array):这是一个公共方法,名为checkDuplicates,它接受一个整数数组作为参数。
  • BitSet bs = new BitSet(320000);:创建一个新的位集对象bs,大小为320000位。
  • for (int i = 0; i < array.length; i++) {...}:这是一个循环,用于遍历输入数组。
  • int num = array[i];:从输入数组中获取当前元素的值。
  • int num0 = num - 1;:计算当前元素的索引的前一个值。
  • if (bs.get(num0)) {...}:检查位集是否已经标记了当前元素的索引的前一个值。如果是,则输出当前元素的值。
  • else {bs.set(num0);}:如果位集没有标记当前元素的索引的前一个值,则将其标记。
  • class BitSet {...}:这是一个内部类,表示位集数据结构。它包含两个方法:getset,分别用于获取和设置位集中的位。
  • boolean get(int pos):此方法返回位集中的特定位置是否已被标记。
  • void set(int pos):此方法将位集中的特定位置标记为已标记。

主要作用是查找并输出数组中的重复元素。它使用位集数据结构来跟踪每个元素的索引,以便在遍历数组时可以快速检查某个元素是否已经被标记过。如果某个元素已经被标记过,那么它就是重复的元素,会被输出。

代码不要求会自己写,但是一定要看得懂。

END

本篇的参考博文:https://juejin.cn/post/7281159113881501715


http://www.niftyadmin.cn/n/5122255.html

相关文章

关于安科瑞智能仪表在铁塔行业的应用-安科瑞 蒋静

应用场景 可应用于基站的交直流配电箱及对基站内的动力设备进行数据采集和控制。 功能 1.对多个回路进行全电参量测量&#xff0c;实现基站内各回路用电能耗的集中管理&#xff1b; 2.丰富的DI/DO输入输出&#xff0c;NTC测温&#xff0c;温湿度测量等非电参量监测&#xff…

TypeScript 快速入门

一、TypeScript 是什么 TypeScript 是一种由微软开发的自由和开源的编程语言。于2012年推出。 TypeScript 是 JavaScript 的一个超集。为 JavaScript 添加了类型系统。 TypeScript 与 JavaScript 的区别 TypeScript JavaScript JavaScript的超集用于解决大型项目的代码复杂性 …

Doceker-compose——容器群集编排管理工具

目录 Docker-compose 1、Docker-compose 的三大概念 2、YAML文件格式及编写注意事项 1&#xff09;使用 YAML 时需要注意下面事项 2&#xff09;ymal文件格式 3&#xff09;json格式 3、Docker Compose配置常用字段 4、Docker-compose的四种重启策略 5、Docker Compos…

外贸出口食品亚马逊FDA认证办理

一、食品FDA认证简介 在2002年公众健康安全和反生物恐怖预防应对法&#xff08;生物恐怖法&#xff09;指示美国食品和药物管理局&#xff08;FDA&#xff09;&#xff0c;卫生和人类服务部 的食品管理机构&#xff0c;采取措施保护公众从对美国粮食供应和其他与粮食有关的紧急…

CRD2 值得一读的知识蒸馏与对比学习结合的paper 小陈读paper

一定要读 真的是不一样的收获啊 不知道 屏幕前的各位get到了没有 Hinton et al. (2015) introduced the idea of temperature in the softmax outputs to better represent smaller probabilities in the output of a single sample. Hinton等人(2015)引入了softmax输出中温…

第2篇 机器学习基础 —(1)机器学习概念和方式

前言&#xff1a;Hello大家好&#xff0c;我是小哥谈。机器学习是一种人工智能的分支&#xff0c;它使用算法和数学模型来使计算机系统能够从经验数据中学习和改进&#xff0c;而无需显式地编程。机器学习的目标是通过从数据中发现模式和规律&#xff0c;从而使计算机能够自动进…

使用Java做业务开发,如何做好一个定时任务的技术选型?

1. 轻量级任务调度 Quartz Scheduler 适用场景: 单机或简单的分布式任务调度特点: 提供丰富的调度选项&#xff0c;如Cron表达式、固定间隔等&#xff1b;支持持久化&#xff0c;能够在应用重启后恢复任务&#xff1b;支持任务监听和触发器监听。建议: 如果你的应用是基于Spr…

简单在线聊天功能(含源码)

简单在线聊天功能 简单在线聊天功能&#xff08;含源码&#xff09;-遇见你与你分享