[请教] mysql 从一张表更新另一张表， sql 语句如何效率最高？

最近工作上遇到的问题，有条sql语句执行时间一直很长，情况如下：
a表记录电话通话情况的表，b表记录的是电话通话失败的原因，两表之间通过一个叫sessionid的字段关联在一起。两表结构大致如下：
a表：
id，主键，自增
caller-->主叫号码
callee -->被叫号码
state ->通话结果，成功=1，失败=2
sessionid -->唯一标志一通电话的标记位
fail_reason -->电话通话失败原因
send_time --电话拨号的时间,unix时间戳

b表：
id -->主键，自增id
reason ->电话通话失败的原因
sessionid -->唯一标志一通电话的标记位
create_time -->记录创建时间

a表记录大概50W条，b表记录大概20w条，且b表中存在sessionid重复的记录
由于某些原因，电话失败原因不能通过a表关联b表查询得到，而要定期（30分钟或1个小时）从b表更新到a表中，这个更新语句该如何写效率最高？
最初我的写法是这样：
update a表 t
set t.fail_reason = (SELECT t2.reason from b表 t2
where t.sessionid = t2.sessionid
and t.status = 2
order by t2.create_time desc
limit 0,1
)
where t.status = 2
and UNIX_TIMESTAMP() -t.send_time < 3600
and (t.fail_reason = '' or t.fail_reason is null)
-------------
以上语句写成数据库事件，每隔半个小时执行一次，后期随着数据增大，感觉效率非常低，执行一次最少都几十分钟，
后来百度google到另一种写法:
update a表 t ，b表 t2
set t.fail_reason=t2.reason
where t.sessionid=t2.sessionid
and t.status=2
and UNIX_TIMESTAMP() -t.send_time < 3600
and (t.fail_reason = '' or t.fail_reason is null)
但还是很慢

请问这类逻辑，mysql中sql语句有什么好的写法吗？还是我该去考虑增加索引，或者做数据拆分了？

sessionid

语句

通话

10 replies • 2016-06-06 10:57:49 +08:00

F281M6Dh8DXpD1g2

Nov 22, 2014 via iPhone

先看执行计划再谈优化

a2z

Nov 22, 2014

先说几个优化的地方，既然a表中sessionid不会重复，就用sessionid作为主键。
a表status加索引，格式tinyint(1)或者enum(1,2)
a表sendtime加索引
a表failreason加索引
b表sessionid加索引

a2z

Nov 22, 2014

(t.fail_reason = '' or t.fail_reason is null)

空值统一用''或者null，要么'' 要么null，这样也能少一个判断快一点

F281M6Dh8DXpD1g2

Nov 22, 2014 via iPad

@a2z dml加索引不是更慢

a2z

Nov 22, 2014

@liprais

看情况了。myisam引擎还可以。
其实你这样完全没必要update a表，join b表做个view就可以了

caixiexin

Nov 22, 2014

@a2z 非常感谢！因为这个些表使用有段时间了，而且其他程序也在用，所以不方便改查表为查view
关于索引的话，经常会被修改的字段是不是不适合加索引？a表的status和sendtime由于用户可能会重播，所以取值经常改动= =

laoyuan

Nov 22, 2014

两个表 sessionid 都做索引， a表 unique，b表 index。建一个中间表t3 俩字段，主键 sessionid，还有reason

TRUNCATE TABLE t3;
INSERT INTO t3 (SELECT sessionid, reason FROM (SELECT sessionid,reason FROM t2 ORDER BY create_time DESC) as t22 GROUP BY sessionid);
UPDATE t,t3 SET ... WHERE ...

这点数据量秒秒钟的事。

caixiexin

Nov 24, 2014

@laoyuan 照你的方法，确实几秒钟就搞定了，太感谢了：）

MonkeyDLuffy

Jun 6, 2016

@laoyuan 方法非常好用为啥这样速度能提高这么多求指点

laoyuan

Jun 6, 2016

@MonkeyDLuffy 和 LZ 写的完全是两个思路，主要是因为 LZ 没有掌握这一技能： GROUP BY 的时候如何选中某一项最大或最小的那条记录