实习面试题

来源:互联网 发布:管家婆sql server下载 编辑:程序博客网 时间:2024/06/05 09:23

保研结束了,最近事也不多,想着应该找个公司实习一下,锻炼自己,顺便赚点小钱,所以投了一家做机器学习相关算法的公司,试试运气。以下是电话里面试官提的一些问题,在此做个总结哈~

1.如何用c语言编写生成不重复的随机整数?
(出题原因:机器学习中,需要将样本随机划分为训练集和测试集)
· 随机函数相关知识:
要取得[a,b)的随机整数,使用(rand() % (b-a))+ a (结果值含a不含b)。
要取得[a,b]的随机整数,使用(rand() % (b-a+1))+ a (结果值含a和b)。
要取得(a,b]的随机整数,使用(rand() % (b-a))+ a + 1 (结果值不含a含b)。
(总的来说,通用公式:a + rand() % n ;其中的a是起始值,n是整数的范围)
代码如下:
(分析过程详见:http://blog.sina.com.cn/s/blog_50c5672801009s1k.html)

//令总样本数为n,训练集样本数为m#include<stdio.h>#include<stdlib.h>#include<iostream>#include<time.h>using namespace std;int a[1000000];int main() {    srand((int)time(0));    int n,m;    cin>>n>>m;    for (int i=0;i<n;i++)      a[i]=i+1;    //将a[i]与前面任意一个数交换,类似洗牌的过程    for (int i=n-1;i>n-m-1;i--)    {        int w=rand()%(i+1); //取得[0,i]之间的随机整数        int t=a[i];        a[i]=a[w];        a[w]=t;    }    //输出a[n-m]~a[n-1]的m个数    for(int i=n-m;i<n;i++)        cout<<a[i]<<" ";    return 0;}

2.线性分类器有哪些?
· Fisher线性分类器
基本思想:选择投影方向,使得类间距离尽可能大,类内距离尽可能小
步骤:
1)计算每类样本的均值向量
2)计算每类样本类内的离散度矩阵
3)计算总的类内离散度矩阵Sw
4)计算样本类间离散度矩阵Sb

未完