更新组合值

来源：互联网发布：大数据基金有哪些编辑：程序博客网时间：2024/06/10 16:02

好久没有静下心来写东西了, 1 是没有遇到好的案例 2 是最近好像有点忙，但又有点不知道自己在忙啥的感觉一样。强制自己静下心写东西，但这时候又觉得自己啰嗦，阐述

点东西说了很多，又不知道自己在说什么。好了废话不说上正题

开发需要支持一个 SQL，现有逻辑是更新 A表 name 字段，需要通过ＩＤ关联B表。然后把B的name，赋值给A表的name 值。　本来这个PL/SQL 有。但是现在逻辑变了。

说是根据现在这个逻辑基础上，如果 B表中多个数据字段type 字段的值为1，则汇总B表所有name 的值，最后赋值给 A表数据。

这个需求看似不难，但是我后来做的过程中发现不少坑， 1 B表多条数据和A表关联上，但是满足条件的 B表的name 值一样，最终导致 A表中的name 更新后

如‘张三，张三，张三，张三’。经过确认后只要一个张三就可以。这个又设计到字段中重复数据去重？？咋办？？

另外如果 B表数据关联有 20 多个！导致 A表的name 值过长！此时又经过确认，截取 3个不同值就可以，本来我打算截取3 个最新的值，我想到的是，正则表达式。但是木有必要。能简单点就简单点吧。

考虑再三，同一个字符串去重，过于复杂需要用树形函数分隔，我想到用想到相邻函数判断相等，则为空，然后在分组数据中把 name 值提取出来。

还有就是性能问题， A表 2个G，B表 2G。 2 G关联 2G，关联分组，去重，截取。更新没有优化的话，估计在半小时开外。那就优化。最终SQL

DECLARE
CURSOR dataCur IS
with taba as(
select /*+ materialize */ order_id, main_wo_flag, party_name, count(1) over(partition by order_id) cnt from
UOS_WORK_ORDER uwo where main_wo_flag = '1' and uwo.arch_flag = 0
),tabb as(
select /*+ materialize */ order_id, main_wo_flag, party_name,
case when lag(party_name ) over(partition by order_id order by party_name) = party_name then null else party_name end party_name2
from taba where cnt>1
), tabc as( select /*+ materialize */ order_id, to_char(wm_concat( party_name2)) party_name from tabb
group by order_id
), tabd as( select /*+ materialize */ rowid rid,uot.id from uos_order_track uot )
select rid, regexp_replace(party_name,'^([^,]+)(,)([^,]+)(,)([^,]+)(,)(.*)$','\1\2\3\4\5\6') from
tabc, tabd where tabc.order_id = tabd.id order by 1;

type rowid_table_type is table of rowid index by pls_integer;
type cur_org_name_type is table of varchar2(255);

v_rowid rowid_table_type;
v_cur_org_name cur_org_name_type;
BEGIN
OPEN dataCur;
loop
fetch dataCur bulk collect into v_rowid, v_cur_org_name LIMIT 20000;
dbms_output.put_line( 'v_rowid.count:'||v_rowid.count );
forall i in v_rowid.FIRST ..v_rowid.LAST
update uos_order_track set cur_org_name = v_cur_org_name(i) where rowid = v_rowid(i) ;
commit;
exit when dataCur%notfound;
end loop;
CLOSE dataCur;
END;

综合性能稳定在2 分组之内，这个可是大表，大表关联更新哦。。。。

with taba as 提取数据，提高性能

select rid, regexp_replace(party_name,'^([^,]+)(,)([^,]+)(,)([^,]+)(,)(.*)$','\1\2\3\4\5\6') 表达式截取第三个逗号前面的字符串。

case when lag(party_name ) over(partition by order_id order by party_name) = party_name then null else party_name end party_name2 上一条数据如果一样则为null.

wm_concat( party_name2) 合并字符串， 10G中， 11G不建议用。

order by 1 很重要，提升性能关键，这个就不说了，太多，避免啰嗦。

fetch dataCur bulk collect into v_rowid, v_cur_org_name LIMIT 20000; 批量游标，减少 SQL 引警搜索引擎频换切换。 LIMIT 20000 防止回滚段压力过大，

0 0