<!-- /* Font Definitions */ @font-face {font-family:宋体; panose-1:2 1 6 0 3 1 1 1 1 1; mso-font-alt:SimSun; mso-font-charset:134; mso-generic-font-family:auto; mso-font-pitch:variable; mso-font-signature:3 135135232 16 0 262145 0;}@font-face {font-family:"Cambria Math"; panose-1:2 4 5 3 5 4 6 3 2 4; mso-font-charset:0; mso-generic-font-family:roman; mso-font-pitch:variable; mso-font-signature:-1610611985 1107304683 0 0 159 0;}@font-face {font-family:Calibri; panose-1:2 15 5 2 2 2 4 3 2 4; mso-font-charset:0; mso-generic-font-family:swiss; mso-font-pitch:variable; mso-font-signature:-1610611985 1073750139 0 0 159 0;}@font-face {font-family:微软雅黑; panose-1:2 11 5 3 2 2 4 2 2 4; mso-font-charset:134; mso-generic-font-family:swiss; mso-font-pitch:variable; mso-font-signature:-2147483001 705641554 22 0 262175 0;}@font-face {font-family:Tahoma; panose-1:2 11 6 4 3 5 4 4 2 4; mso-font-charset:0; mso-generic-font-family:swiss; mso-font-pitch:variable; mso-font-signature:1627400839 -2147483648 8 0 66047 0;}@font-face {font-family:"/@微软雅黑"; panose-1:2 11 5 3 2 2 4 2 2 4; mso-font-charset:134; mso-generic-font-family:swiss; mso-font-pitch:variable; mso-font-signature:-2147483001 705641554 22 0 262175 0;}@font-face {font-family:"/@宋体"; panose-1:2 1 6 0 3 1 1 1 1 1; mso-font-charset:134; mso-generic-font-family:auto; mso-font-pitch:variable; mso-font-signature:3 135135232 16 0 262145 0;} /* Style Definitions */ p.MsoNormal, li.MsoNormal, div.MsoNormal {mso-style-unhide:no; mso-style-qformat:yes; mso-style-parent:""; margin:0cm; margin-bottom:.0001pt; text-align:justify; text-justify:inter-ideograph; mso-pagination:none; font-size:10.5pt; mso-bidi-font-size:11.0pt; font-family:"Calibri","sans-serif"; mso-fareast-font-family:宋体; mso-bidi-font-family:"Times New Roman"; mso-font-kerning:1.0pt;}.MsoChpDefault {mso-style-type:export-only; mso-default-props:yes; font-size:10.0pt; mso-ansi-font-size:10.0pt; mso-bidi-font-size:10.0pt; mso-ascii-font-family:Calibri; mso-fareast-font-family:宋体; mso-hansi-font-family:Calibri; mso-font-kerning:0pt;} /* Page Definitions */ @page {mso-page-border-surround-header:no; mso-page-border-surround-footer:no;}@page WordSection1 {size:612.0pt 792.0pt; margin:72.0pt 90.0pt 72.0pt 90.0pt; mso-header-margin:36.0pt; mso-footer-margin:36.0pt; mso-paper-source:0;}div.WordSection1 {page:WordSection1;}-->
《Lucene构建网站搜索系统》课程计划表
序号
培训内容
课时
1
搜索引擎简介
课程目标:了解如何使用搜索引擎以及搜索的高级语法。
课程内容:
搜索引擎的高级语法如site,filetype等。
界面布局。
搜索引擎的总体架构。
网站搜索的常用功能。
1
2
全文检索与Lucene简介
课程目标:了解全文检索的基本原理与Lucene的基本使用。
课程内容:
倒排索引的原理。
Lucene的整体结构、基本概念。
Lucene常用API的介绍与使用。
2
2
中文分词
课程目标:
l 中文分词的原理。
l Java实现的中文分词。
课程内容:
Lucene中的中文分词。
中文分词的常用方法。
查找词典算法。
中文分词流程与结构。
形成切分词图。
最大概率分词方法。
N元分词方法。
未登录词识别。
词性标注。
5
3
文本分类
课程目标:
了解基于机器学习的文本分类的原理与实现。
能够实现朴素贝叶斯文本分类方法。
能够实现支持向量机文本分类方法。
课程内容:
特征提取方法与实现。
贝叶斯理论的原理。
朴素贝叶斯文本分类方法与Java实现。
支持向量机的原理。
LibSVM介绍与Java实现的文本分类。
基于规则的文本分类方法与实现。
6
4
实现搜索功能
课程目标:
掌握搜索基本功能与扩展功能的实现。
课程内容:
关键词飘红功能。
输入框智能提示。
搜索结果分类统计及层次展开功能。
相关搜索词。
实现“您是不是要找…”功能。
用户搜索日志挖掘。
8
5
搜索深入优化
课程目标:
掌握提高搜索性能与改进结果排序的方法。
课程内容:
索引优化与搜索优化。
实现时间加权排序。
实现字词混合索引。
2
6
使用Solr实现网站搜索
课程目标:
掌握如何使用solr实现前后台分离的网站搜索。
课程内容:
Solr的原理与发展历程。
Solr基本用法。
Solr扩展与定制。包括ASP.NET的调用。
3