经典问题7 c/c++ 程序设计－－－0、1串个数统计问题

来源：互联网发布：sql 删除数据库编辑：程序博客网时间：2024/05/17 06:48

(1)面试题：下面程序的结果是多少？
     1    #include <iostream>
     2    #include <string>
     3
     4    using namespace std;
     5
     6    int main()
     7    {
     8        int count = 0;
     9        int m=9999;
    10        while(m){
    11            count++;
    12            m=m&(m-1);
    13        }
    14        cout<<"the count of the number 1 is:"<<count<<endl;
    15        return 0;
    16    }
－－－－－－－－－－－－－－－－－－
$ ./a.out
the count of the number 1 is:8
－－－－－－－－－－－－－－－－－－
知识点：统计二进制数中1的个数；
拓展：问题：给出一个整数，请设计算法计算该整数以二进制格式表示时的1的个数。
例如，十进制整数150，二进制表示为10010110，则1的个数为4个。要求算法效率尽可能的高。
解答：
方法1：分别判断各个位
--------------------------------------
int bit_count(unsigned int n)
{
    int count;
    for(count = 0; n; n >>= 1)
    {
        count += n & 1;
    }
    return count;
}
----------------------------------------
方法2：循环中直接计算1的数量
如何只数'1'的个数？
1)如果一个数字至少包含一个'1'位，那么这个数字减1将从最低位开始依次向高位借位，
直到遇到第一个不为'0'的位。依次借位使得经过的位由原来的'0'变为'1'，而第一个遇到的那个'1'位则被借位变为'0'。
36 d = 100100 b
36-1 d = 100011 b
2)如果最低位本来就是'1'，那么没有发生借位。
现在把这2个数字做按位与：n & n-1的结果是什么？
2个数字在原先最低为'1'的位以下（包括这个位）的部分都不同，所以结果是保留了其他的'1'位。
36 & 36-1 d = 100000 b
这个结果刚好去掉了最低的一个'1'位
----------------------------------
int bit_count(unsigned int n)
{
    int count;
    for(count = 0; n; n &= n - 1)
    {
        count++;
    }
    return count;
}
-------------------------------------

方法3：并行计算的
------------------------------------------------------------
#define POW(c) (1<<(c))
#define MASK(c) (((unsigned long)-1) / (POW(POW(c)) + 1))
#define ROUND(n, c) (((n) & MASK(c)) + ((n) >> POW(c) & MASK(c)))

int bit_count(unsigned int n)
{
    n = ROUND(n, 0);
    n = ROUND(n, 1);
    n = ROUND(n, 2);
    n = ROUND(n, 3);
    n = ROUND(n, 4);
    return n;
}
---------------------------------------------------------------
一下子看不明白，先把宏展开来：
POW是计算2的幂
MASK很奇怪，一个全1的无符号数字除以2的幂的幂加1？
好在打印出来还能看得懂：
------------------------------------------------------------
MASK(0) = 55555555 h = 01010101010101010101010101010101 b
MASK(1) = 33333333 h = 00110011001100110011001100110011 b
MASK(2) = 0f0f0f0f h = 00001111000011110000111100001111 b
MASK(3) = 00ff00ff h = 00000000111111110000000011111111 b
MASK(4) = 0000ffff h = 00000000000000001111111111111111 b
--------------------------------------------------------------
这些mask分别把32位数字划分为几个部分。每个部分的前一半和后一半分别是全'0'和全'1'。
MASK(0)分为16个部分，MASK(1)分为8个部分，...
ROUND中对n的处理：(n & MASK) + (n >> POW & MASK)
POW的值刚好是MASK中连续'0'(或者连续'1')的长度。也就是说ROUND把由MASK分开的n的各个部分中的高POW位和低POW位相加。
为了便于说明，取一个简单的部分：MASK(1)的0011
假设n的值为1001，那么ROUND后的结果就是10 + 01 = 11 b，把这个结果赋值给n，这时n的含义由原来的二进制位串变为'1'位的数量。
特别的，当ROUND(n, 0)时，把n当作一个32个部分各自'1'位的数量。（'0'表示没有'1'，而'1'则表示有1个'1'）
计算完n = ROUND(n, 0)后，n是一个16个部分各自'1'位数量的'数组'，这个'数组'的每个元素只有2个二进制位。最大值为2，足够由2个二进制位来表示。
接下来，计算完n=ROUND(n,1)后，n是一个8个部分各自'1'位数量的'数组'，这个'数组'的每个元素只有4个二进制位。
最大值为4，足够由4个二进制位来表示。（实际只需要3个二进制位）
...
最后一步，计算n=ROUND(n,4)后，n是一个1个部分各自'1'位数量的'数组'，这个'数组'的每个元素有32个二进制位。
最大值为32，足够由32个二进制位来表示。（实际只需要6个二进制位）
这个代表32位内'1'位数量的32位二进制数也就是我们要求的结果。

这个方法的好处是只需要5步（log n (n=32)），并且没有循环（或分支），流水线不会被打破。
下面举例说明：
from：http://en.wikipedia.org/wiki/Hamming_weight

经典问题7 c/c++ 程序设计 －－－0、1串个数统计问题

经典问题7 c/c++ 程序设计－－－0、1串个数统计问题