2009年阿里巴巴搜索研发类笔试试题

来源:互联网 发布:高晓松 前妻 沈欢 知乎 编辑:程序博客网 时间:2024/06/06 05:22
试卷分三部分
1.java
2.
搜索 C++(这2个为什么要混在一起?)
3.
公共(都要做)
 
我做的是B卷、搜索研发类,只记得其中的一部分内容(都是关键字,实在记不全所有的内容了。。。。。)
 
B
基本上都是选择,只有最后公共题的最后两题不是。
1DOM
2utf-8编码字节大小?
3、网络蜘蛛
4、分布列(概率中的数学期望)
5、搜索查准率和查全率的一个计算题
6、索引压缩
7cralwer速度的影响
8、信息熵量大小的影响
9Trie算法的最差时间复杂度
10HTML
11HTTP协议
12、信息检索模型
13、分布式通信协议
14、分布式搜索引擎
15-25C语言的一些知识,在面试宝典里面基本上都能找到原型
 
1、要对语句A>1 OR B <= 3 测试……(不记得了)100%覆盖,至少要多少测试用例
2、典型的针对系统漏洞的Dos攻击?
34223615,( ?) A20 B24 C25 D45
43升,5升,7升量筒,已知35量筒装满水,7量筒为空,问至少要倒多少次才能使其中一个量筒的水为4
5、太长了
6、太长了
7、保护邮件安全的软件?
8、普通用户执行超级用户文件的指令
9、软件测试对象
10、软件缺陷生命期
11OPENAPI平台
12、超长字符串攻击属于?
13、项目的最重要的是()和()
14、可能引起Cross Site Scripting攻击的是?
15、马可夫模型(HMM)的三个基础?(非选择)
16、有序集合a, b,求交集(非选择)
HMM需要解决三个基本问题:

  *1 评估问题:

  给定观测序列 O=O1O2O3…Ot和模型参数λ=(A,B,π),怎样有效计算某一观测序列的概率.

  *2 解码问题

  给定观测序列 O=O1O2O3…Ot和模型参数λ=(A,B,π),怎样寻找某种意义上最优的观测序列.

  *3 学习问题

  怎样调整模型参数λ=(A,B,π),使其最大?

  基本算法

  针对以上三个问题,人们提出了相应的算法

  *1 评估问题: 向前向后算法

  *2 解码问题: Viterbi算法

  *3 学习问题: Baum-Welch算法