基于支持向量机与LIBS光谱技术做定量分析研究——记我的毕业论文

来源:互联网 发布:评价耶稣知乎 编辑:程序博客网 时间:2024/05/17 06:39

    此文只是对我毕业论文工作的简单的总结和一些想法而已,思维天马星空,行文毫无逻辑。

    3月2日开学,我的毕业论文工作正式展开,之前老师让研究生师姐在寒假里发的两篇文献就赶在见老师之前一天粗粗看了一遍,大概了解了一下,仅仅为了应付老师足够。第一次开会,老师就指定了一篇论文,安徽光机所的王春龙的基于支持向量机的LIBS技术的什么研究,具体名称忘记了,是做定量分析的,然后其中让我回去搜文章提到的林智仁教授的LIBSVM工具箱,安排的具体工作就是下载下来,免费的?直接使用?开源的等等相关,然后。这个对我来说小菜一叠,我就在网上找到了林智仁的官网,并下载了下来,百科了一下libsvm是什么,然后一个星期顺利完成任务。

       就只交代一下论文开始,其中乱七八糟的各种琐碎的事儿我也已经忘记得差不多了,后悔没有在做论文的时候写下来,以后做长期项目(毕业论文估计算吧,耗时三个月)就应该形成工作日志,每天、每周做了什么记录下来,累积起来就成了工作经历。第一次接触支持向量机和LIBSVM这个东西,后来知道它是一种机器学习方法,其实就是对我的一些数据进行学习建立模型,利用模型来达到我们的目的,分类或者预测。对于这个东西完全没有概念,那怎么办?按老师说的去找相关论文,不管是分类的还是回归的,然后我就在知网上下载了好多论文,这么多论文不可能每个都看吧,其实按要求应该每个都看的,但是我就听研究生师姐说的看摘要和结论,我要写综述嘛,看这些足够写综述了,于是综述写出来了,8000字顺利完成任务,然后导师夸奖了一下,然后提了一句最后论文是要查重的,额额,貌似应该被发觉了,嘻嘻。

   其实用支持向量机定量分析在我们实验小组之前是没有人做的,也就意味着我没有师姐可以请教,带我的那个师姐之前有做过用PLS做定量分析,我用的光谱数据就是用的她的实验数据,请教她大概知道了我大体方向是什么,就是有13个样品,LIBS技术测出了他们的光谱,每个测了10组,每一组光谱都包含了这个样品的信息,它是由什么元素组成的,含量是多少,然后我就需要利用LIBSVM这一工具,假设后面3个样品中某个元素的含量是不知道的,然后预测出该元素的含量,与真实含量做对比,看定量分析的效果如何。我是怎么开展具体工作的呢?LIBSVM不会用,首先要知道怎么用吧,然后找度娘,百度出李阳的关于LIBSVM使用的系列视频,不过他是基于MATLAB平台上的,然而我是matlab零基础,于是找了一本讲matlab的书看了前2章,它的一些语法变量使用什么的大体了解了一下,到时需要用到的时候再翻书,我觉得这是个很好的办法,毕竟我不是要精通matlab,只是要是稍微使用一下而已。在做开题答辩之前,我用来预测出的一个样本的10组质量分数全是一样的,这不符合常理,但是也不知道原因,于是就先置之不理,先把开题报告和答辩做好再说。答辩结束终于有时间研究原因,我先以为是参数问题(后来觉得额貌似这想法很离谱,不过开始不知道的时候一切错误想法都是可以被理解的,呵呵),然后我就想着怎么参数寻优,然后我就百度LIBSVM参数寻优,看了几篇关于做做回归的博客,是在Windows平台下做的,然后林教授有网格寻优的程序,于是我就从matlab转战Windows平台,我还知道所用数据有固定的格式,而且还很麻烦,得给每个属性定标号,如果有100个属性,就得定100个标号,还好我用我聪明的脑袋想着现在excel表格中处理好数据,保存为txt格式,然后再Windows平台下使用,这期间我也知道了归一化这个程序,原来开始是要给数据归一化的,并且处理了一些数据之后,我知道之前数据一样的原因是没有归一化,其实这是走了很多弯路的,我这么多数据根本不应该在Windows平台下使用,最后还是在matlab平台下做的,最后也表明Windows是我走的弯路,但是没有这弯路,我也不会知道怎么运行dos命令,不知道python这个语言,不知道excel数据是可以保存为txt格式,不知道txt格式的数据可以在excel中打开····很多很多。开始在windows平台下处理数据这些努力并不是无用功,没走过弯路怎么知道最后成果的来之不易呢?而且我在windows下没能画出网格参数寻优三维图,只有一个等标线图,于是我决定自己拿数据在matlab画,于是我又学会了怎么在matlab中画三维图。

   具体我走的弯路还有很多,如果不是某一次在dos中运行程序出错,而且我解决不了,我想我还会一直在windows平台上抹黑的走下去,然后我就转战matlab平台。用matlab做支持向量机回归真的很方便,不用对原始数据做什么标号,将属性和标签放在两个变量,调用这两个变量就好了。最后说说我的论文具体怎么做的吧,我们要做回归,属性就是实验测出来的LIBS光谱,这么多光谱用全谱的?我是先进行谱线归属,用了nist数据库(一个专门查元素光谱段的网站),用的是特征光谱的波峰和积分,积分是对一段光谱进行就和处理,其实应该用洛仑兹拟合的,但是时间来不及的,就做的求和处理,结果表明用积分的数据做的定量分析结果比峰值的预测结果好。标签就是钢铁合金中元素的质量分数,因为libsvm只能单变量输出,所以是某一种元素的质量分数,貌似lssvm这个工具箱可以做到多变量输出,但是我的论文工作已经完成了,所以也就没去研究它了。

   通过这次论文我才明白,当初接触一个你感觉完全不懂的事物时,不要想着我不会,无论多大的课题或者项目,完成它都是分阶段的。当你慢慢的一步一步起步从零开始,每一天都有进步的时候,最后完成这个事情是自然而然的事情。不知道大家的毕业设计是怎么做的,当时我去找导师要跟她做论文的时候说,我的论文不容混过去,如果你想混的话还是别浪费双方时间了。当时我和我闺蜜都是冲着可以真正学到东西才去找这个老师的,因为我们都是大学四年混过来的,不想在最后一学期还这样混下去,于是我们想不想就说行。在论文期间也有很多值得说的事儿,比如我是一直看小说的人,不知怎的小说瘾又犯了,好几天没去实验室,但是那一周又要交给老师一个8000字的综述,为了完成任务熬了一个通宵才把8000字妥妥的写出来。小说从来都是我的致命弱点,所以我一直在尽量戒掉它。

0 0