oracle10g全文索引

来源:互联网 发布:asp微信支付源码 编辑:程序博客网 时间:2024/04/30 04:23

oracle10g全文索引
--------------------------------------------------------------
以下是oracle10g建立全文索引的步骤,来源记不清了.
---------------------------------------------------------------

一、验证是否有ctxsys用户和ctxapp角色

登录oracle检查ctxsys用户:

$sqlplus /nolog

sql>conn / as sysdba

sql>select username from all_users;

如果没有该用户则,根据第二部安装选配件。如果已经有了这个用户,而如果是锁定状态的话,则把该用户解锁。

二、安装选配件

如果没有ctxsys用户,则在oracle用户中使用dbca安装选配件:

1,打开dbca,选择Configure Database Options

sql>$dbca


2,在以下界面中选择所有数据库组件


3,点击Next进行安装。


三、安装成功后则可以查看到有ctxsys用户和ctxapp角色

四、使用ctxsys用户登录后,授予sms用户(要建立全索引的数据库用户)执行ctx_ddl的权限

sql>conn ctxsys/sms

sql>grant execute on ctx_ddl to sms;


五、创建分词

sql>conn sms/sms

sql>

begin

ctx_ddl.create_preference ('SMS_CHINESE_LEXER', 'chinese_vgram_lexer');

end;

/

六、创建全文索引

sql> CREATE INDEX INX_CTX_QY_VCHR_ZS ON sms.yw_qy_jbxx(VCHR_ZS) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS ('LEXER SMS_CHINESE_LEXER');
全文索引自动同步,可以见文章
sql> CREATE INDEX INX_CTX_QY_VCHR_ZS ON sms.yw_qy_jbxx(VCHR_ZS) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS ('LEXER SMS_CHINESE_LEXER sync (on commit)');

七、数据同步

create or replace procedure SMS_LEXER

is

begin

ctx_ddl.sync_index('INX_CUSTOMINFO_ADDR_DOCS');

ctx_ddl.optimize_index('INX_CUSTOMINFO_ADDR_DOCS','FULL');

end;


begin

DBMS_JOB.ISUBMIT(job=>1010,what => 'begin SMS_LEXER();end;',

next_date => SYSDATE, interval => 'SYSDATE + (1/24/12)');

commit;

END;

select * from yw_qy_jbxx where contains(VCHR_LXR,'xx') > 0


--------------------------------------------------------------
以下是oracle10g全文索引常用操作.

---------------------------------------------------------------
查看表名和索引名:
select   table_name,index_name   from   user_indexes;  
查看索引字段名及其它
select   INDEX_NAME,COLUMN_NAME,INDEX_OWNER   from   dba_ind_columns   where   TABLE_NAME=yourtablename;  

删除索引:
drop index QYMC_TEXT;
drop index QYMC_TEXT force;

全文索引——CONTAINS 语法
我们通常在 WHERE 子句中使用 CONTAINS ,就象这样:SELECT * FROM table_name WHERE CONTAINS(fullText_column,'search contents')。

我们通过例子来学习,假设有表 students,其中的 address 是全文本检索的列。
1. 查询住址在北京的学生
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'beijing' )
remark: beijing是一个单词,要用单引号括起来。

2. 查询住址在河北省的学生
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, '"HEIBEI province"' )
remark: HEBEI province是一个词组,在单引号里还要用双引号括起来。

3. 查询住址在河北省或北京的学生
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, '"HEIBEI province" OR beijing' )
remark: 可以指定逻辑操作符(包括 AND ,AND NOT,OR )。

4. 查询有 '南京路' 字样的地址
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'nanjing NEAR road' )
remark: 上面的查询将返回包含 'nanjing road','nanjing east road','nanjing west road' 等字样的地址。
          A NEAR B,就表示条件: A 靠近 B。

5. 查询以 '湖' 开头的地址
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, '"hu*"' )
remark: 上面的查询将返回包含 'hubei','hunan' 等字样的地址。
          记住是 *,不是 %。

6. 类似加权的查询
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'ISABOUT (city weight (.8), county wright (.4))' )
remark: ISABOUT 是这种查询的关键字,weight 指定了一个介于 0~1之间的数,类似系数(我的理解)。表示不同条件有不同的侧重。

7. 单词的多态查询
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'FORMSOF (INFLECTIONAL,street)' )
remark: 查询将返回包含 'street','streets'等字样的地址。
         对于动词将返回它的不同的时态,如:dry,将返回 dry,dried,drying 等等。

原创粉丝点击