1. 问题:100个连续
的数打乱
之后,随机取出1个数
,问如何最快速
的判断出少了哪一个?
分析:对于所有100个连续的数,只要除余100。一定在0~99之间。一般来说,比较常规的做法就是先排序(利用Hash表定位),在循环查找。当然时间复杂度是O(2n)。现在介绍一种很牛的O(n)做法:求二进制异或运算。
异或运算: 0^0=1^1=0; 0^1=1^0=1。0~99个数全部异或的结果只能是0。如果缺少一个数,那么全部异或的结果正好就是那个数。为什么呢?我们做个小实验:假如有四个数: 0001 0010,0101, 0110 排列成一个matrix.
bits: 1 2 3 4
0 0 0 1
0 0 1 0
0 1 0 1
0 1 1 0
全部异或: 0 0 0 0
我们可以下结论了,要全部异或的结果为0,那么所有bit位上的1的个数必须为偶数。
反过来说:如果其中有一个数不存在了(比如0001),那么少0的的bit位上的值不变(因为1的个数还是偶数),而少1的bit位上的值就变成了1(1的个数为奇数了)。
这样0~99的道理也就一样了,所以异或的结果就是少的那个值。代码如下:
int data=0;
for(int i=1;i<=99;i++){
if(i==78) //少78
continue;
data=data^i;
}
System.out.println(data);
2. 问题:100个连续
的数打乱
之后,随机取出2个数
,问如何最快速
的判断出少了哪两个? (注意少2个数了)
分析:常用的做法可以先创建一个100个结构的Hash表,然后循环一次将所有数哈希100之后的位置上置1。然后顺序循环100次查找这个Hash表。前后需要O(2n)的时间。然而有没有更快速的做法呢?当然,直接操作bit.
假设我们有32个连续打乱的数字(0~31)缺少两个数2和11,希望把标记1标记在一个32位上。也就是一个整形变量,标记完之后就成为了:
bits position 31 30 29 28 ....... 11 10 .... 2 1 0
int a= 1 1 1 1 ....... 0 1 .... 0 1 1 (缺少数的bit位上为0)
至于如何标记成为a,我们可以看看下面的小段代码:
long bits=0;
for(int i=0;i<32;i++){
long bitMove=1;
if(i==2||i==11)
continue;
bitMove=bitMove<<i;
bits=bits | bitMove;
System.out.println(bits+" : "+Long.toBinaryString(bits));
}
此时我们将数字a每8位作为一个数字b,如果b==255, 则说明全部8位都是1(没有缺少数字)。如果b!=255,则说明有某些位是0(有数字缺少),然后再在不等于255的8 bits上顺序查找等译0的位数即可。这样就相当于原来需要顺序查找32 bits(查找32次)。而现在只需要先查找4个8位的块,然后再需找某个8位块中的bit(也就是需要4+8=12次)即可。这就是分块查找的基本原理了。
通过一个32个连续的数,我们发现了敲门。这样对于100个连续的数呢?很简单,我们需要4个32位就够了。注意:由于最高位如果是1的话,整形数据将会变成负数,不方便我们的计算。因此我们用long数据来存储32个位数。
代码如下:
public class Test{
public static void main(String[] args){
//需要4个32位数据,用long存储为了避开int存储可能带来的负数。
//intBits[0]的最低32位标识数据0~31
//intBits[1]的最低32位标识数据32~63,
//intBits[2]的最低32位标识数据64~95,
//intBits[3]的最低4位标识数据96~99
long[] intBits={0L,0L,0L,0L};
//用100bit位标识是否存在0~99的数据
//此时需要循环的次数为100次,时间复杂度O(n),n为连续的data数量。
int loop=0;
for(int data=0;data<=99;data++){
long bitMove=1;
if(data==2||data==11) //缺少数据2和11
continue;
bitMove=bitMove<<(data-32*(data/32));
intBits[data/32]=intBits[data/32] | bitMove;
loop++;
}
//中间打印标识结果
System.out.print("标识结果(循环"+loop+"次):");
for(int i=3;i>=0;i--)
System.out.print(Long.toBinaryString(intBits[i]));
System.out.println();
//分块查找,每8bit一块,一共需要100/8=13块
//其中如果8bit全部是1,则该数据等于2^8-1=255
//前3个intBits都全部位数都用来标识数据
loop=0;
int zeroSize=0;
for(int i=0;i<4;i++){
long bits=intBits[i];
long eightBits=0;
int eightSize=0;
while((eightBits=bits%256)!=0){
System.out.println("第"+((eightSize+1)+i*4)+"个8bits块:"+Long.toBinaryString(eightBits));
if(i<3&&eightBits!=255){
for(int j=0;j<8;j++){
loop++;
if(eightBits%2==0){
zeroSize=j+eightSize*8+i*32;
System.out.println(" zero size="+zeroSize);
}
eightBits=eightBits>>1;
}
}
bits=bits/256;
eightSize++;
loop++;
}
}
System.out.println("标识后查找需要循环"+loop+"次");
}
}
这段代码只需要循环98+29=117次,少于一般情况下的200次。
3. 问题:有1到10w这10w个数,去除2个并打乱次序,如何找出那两个数?(不准用位图)
我想用分块查找的思想,首先开辟一个a[100][1001]存储结构,遍历10W个数存放这个结构
int[][] a=new[100][1001];
for(int i=0;i<99998){
a[i/1000-1][i%1000+1]=1;
a[i/1000-1][0]++; //记1000个数是否已经满了。
}
for(int j=0;j<100;j++){
if(a[j][0]<1000){ //这1000个数里面有数少了
for(int k=1;k<1000;i++){
if(a[j][k]!=1){
System.out.println("少了的呢个数就是:"+(j*1000+k));
}
}
}
}
性能分析:
首先循环99998次为数组设置标志位。然后双重循环(其实真正需要双循环的是有2次,因为就少了2个数),因此双重循环的次数因该是: 100(块查找次数)+2*1000=2100次。
一共循环99998+2100 因此效率是O(n+m) 其中n为待查找数字的个数(10W),m为分割的块数与快内查找的次数。如果n远远大于m,则查询效率接近于O(n)。因此这种查找数据越多效率越好。
分享到:
相关推荐
腾讯:数字中国指数报告
2023腾讯全球数字生态大会(公开)PPT合集,共70份。
腾讯研究院:2019腾讯数字生活报告-2019.5-48页.pdf
腾讯数字生活报告2019-腾讯研究院-201905.pdf
腾讯数字生活报告2019.pdf
android 腾讯定位并判断网络连接 ,通过网络定位,在定位前先判断网络链接状态,状态良好,则定位。
数字科技创新专利报告:广东第一,腾讯凭借什么成为领头羊?.pdf
腾讯信用评分是什么?腾讯信用分用法及提高方法.docx
2019腾讯数字生活报告(48页),资源名称:2019腾讯数字生活报告(48页)腾讯研究院:2019腾讯数字生活报告-2019.5-48页.zip...
腾讯TDC数字农村解决方案.pdf
国开大学企业战略管理形考任务四:为什么腾讯、阿里这么热衷于组织变革?答案.pdf
腾讯三面问题预览: 1.OC你了解的锁有哪些?在你回答基础上进行二次提问; 追问一:自旋和互斥对比? 追问二:用C/OC/C++,任选其一,实现自旋或互斥?又述即可! 2.内存泄漏可能会出现的几种原因,聊聊你的看法? 追问一:非...
腾讯数字孪生云白皮书 腾讯 2022
腾讯全球数字生态大会:5G车路协同创新应用白皮书
腾讯微云怎么用?腾讯微云网盘上传文件教程.docx
以腾讯为样本 开放平台应遵循哪些基本逻辑?.docx
小Q今天在上厕所时想到了这个问题:有n个数,两两组成二元组,差最小的有多少对呢?差最大呢? 输入描述: 输入包含多组测试数据。 对于每组测试数据: N - 本组测试数据有n个数 a1,a2...an - 需要计算的数据 ...
腾讯业务产品线众多,拥有海量的活跃用户,每天线上产生的数据超乎想象,必然会成为数据大户,为了保证公司各业务产品能够使用更丰富优质的数据服务,腾讯的大数据平台做了那些工作?具备哪些能力?大数据,这个词...
腾讯会议在去年年底推出,集结腾讯在AI、云计算、安全等方面的能力,全方位满足不同场景下的会议需求,在短短两个月内就突破千万日活大关。面对多样且复杂的场景,比如开会环境嘈杂、同一地点多设备接入、房间声学...
腾讯之道:我们应该向腾讯学什么?-电子版