阿里巴巴一道算法题

来源:互联网 发布:sql left join where 编辑:程序博客网 时间:2024/05/19 22:57

无意看到一道阿里巴巴的算法题,题目如下:

字符串数组seq[] = a,b,c,d,aa,ba,ca,da,ab,bb,cb,db,ac...,aaa,aba,...
(1)aaa是第几个字符串
(2)ababacd是第几个
(3)第1000个字符串是什么
(4)编写函数find(),返回字符串在seq中是第几个(语言不限)

网上有很多答案,大多千篇一律的错误解答如下:

错误分析结果:
(1).长度,很容易推导出长度是n的字符串在第4^(n-1)个之后,aaa是1位和2位全排列后的第一个,即第4^(3-1)+4^(2-1)之后的第一个,也即第21个。


(2)字符,每个字符可以判断出它之前的字符全排列了多少次,
字 符: a b a b a c d
全排列: 0 1 0 1 0 2 3
4^次幂: 0 1 2 3 4 5 6
即1*4^1+1*4^3+2*4^5+3*4^6 = 14405(考场不让用计算器...换成2的次幂来算)。

(3)把1000转为二进制是 11 11 10 10 00,
他们分别对应4进制里的 3  3  2  2  0,
对应字符就是 d d c c a,倒序就是accdd,这里算出来的是1001的字符串,
第1000个是上一个, 即 accdd-1 = dbcdd。

 

实在不忍看下去了,估计都是转载的答案。很显然以上解答只有第(1)小题是对的。想一下,若字符串为“aaa”,那么按(2)的思路思考的话, 那么他应该是序列seq中的第一个,这显然是不对的,也与第(1)小题矛盾了。

正确解答:

(1) 对于一个长度为n的字符串序列,且字符串中每个字符串取值于集合{a, b, c, d},很显然有4^n种排列方式,这应该是高中排列、组合中就讲过的内容,不解释了。

seq是包含所有长度从1……n的字符串数组,“aaa"是n=3时,所有排列的第一个元素,因此是4^1 + 4^2 + 1 = 21,即为第21个元素。

 

(2) 对于所有长度为n的字符,每个字符可以判断出它之前的字符全排列了多少次,
字 符: a b a b a c d

全排列: 0 1 0 1 0 2 3
4^次幂: 0 1 2 3 4 5 6
即1*4^1+1*4^3+2*4^5+3*4^6 = 14405

这并不是"ababacd"在seq中的最终位置,还应当加上所有长度小于n的字符数组的个数,即4^1+……+4^6 + 14405 = 19865

 

(3) 4^1+……+4^4 < 1000 < 4^1+……+4^5,因此,第1000个字符串的长度肯定为n = 5;第1000个字符串在seq中的实际下标为999,因此999-340=659,659的二进制表示为1010010011,倒序之后就是"dabcc"

(4) 代码如下:

#include <iostream>
#include <string>
using namespace std;

double find(string str)
{
 double sum = 1;//字符串数组从下标0开始

 int len = strlen(str.c_str());
 for (int i = 1; i < len; ++ i)//注意此处的求和范围
 {
  sum += (double)pow(4, i);
 }

 for (int i = 0; i < len; ++ i)
 {
  sum += (str[i] - 'a') * (double)pow(4, i);
 }

 return sum;
}

int main()
{
 cout << find("aaa") << endl;
 cout << find("ababacd") << endl;
 cout << find("dabcc") << endl;

 system("pause");
 return 0;
}

原创粉丝点击