数据库数字参考表的妙用

日期: 2012-07-02 作者:ISADBA 来源:TechTarget中国 英文

  今天的主角就是数字参考表,什么是数字参考表?一个表中,存放了从1开始连续到很大值的数字的表,我们称为数字参考表。

  DROP TABLE IF EXISTS ref_number;
  CREATE TABLE `ref_number` (
  `id` INT(11) NOT NULL AUTO_INCREMENT,
  `status` TINYINT(3) DEFAULT 0 NOT NULL,
  PRIMARY KEY (`id`)
  ) ENGINE=INNODB DEFAULT CHARSET=utf8

  #填充数据的存储过程

  DELIMITER $$
  USE `test`$$
  DROP PROCEDURE IF EXISTS `sp_pCreateNums`$$
  CREATE DEFINER=`root`@`localhost` PROCEDURE `sp_pCreateNums`( cnt INT UNSIGNED)

  BEGIN
  DECLARE s INT UNSIGNED DEFAULT 1;
  TRUNCATE TABLE ref_number;
  WHILE s <= cnt DO
  BEGIN
  INSERT INTO ref_number(id) SELECT s;
  SET s= s+1;
  END;
  END WHILE;
  END$$
  DELIMITER ;

  主题就是数据库中参考表的妙用,我们分三种需求来分别说明数据库中参考表的使用,主要针对解决数据库的“历史问题”。

  一、两个事务同时锁定一个不存在id导致的死锁

  两个事务同时向数据库插入记录,插入的id是一样的。插入前查询表中是否存在这个id,如果不存在,那么会给这个id上锁。mysql允许多个事务给同一条不存在的记录上锁,

  然后在插入记录,这个时候就产生冲突和死锁。

  解决这个问题的方法还是挺多。

  方案一:有可能的话,尽量使用auto_increment。

  方案二:如果不能使用auto_increment,程序尽量维护这个id的唯一性,不要重复使用。

  方案三:引入参考表。

  如果业务表不能建立auto_increment,也不方便做一个算法来维护这个唯一性的列,那么我们建立一个数字参考表,如开始建立的ref_number表。

  id列对应业务的id列,status对应这个列是否被使用,0为未使用,1为使用,修改业务表之前先从数字参考表中获取一个未使用的id,

  然后修改参考表的状态值,在使用这个值插入到表中,这样就不会因为两个事务锁住同一个不存在的id而产生死锁。

  二、两张同时有写入的表之间数据同步,如何处理自增长主键的冲突问题。

  这个问题在特殊的情况下才会出现,主要是前期规划和后期需求的冲突导致的。

  首先描述一下需求和环境:

  一个数据库实例里有两个数据库(schema),两个数据库内分别有两个表。php.test和java.test。

  test表大概如下:

  CREATE TABLE `test` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `status` tinyint(3) DEFAULT NULL,
  PRIMARY KEY (`id`)
  ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

  这个schema中表结构大致一样,记录也是一样的,只是字段多少而已。现在的问题是多个团队和功能会往这两个表插入数据,还有程序需要对这两个表做双向同步,保证他们数据一致性。

  现在我们模拟插入两条数据。

  insert into php.test values (”,’mysqlops’);结果 1,mysqlops
  insert into java.test values (”,’mysqlops’);结果 1,mysqlops

  这样在做数据表的双向同步就产生了冲突。

  我能想到的解决方案有以下几个:

  1、值留一个表,取消另外一个表,这个是最简单最理想的方案了。不过理想和现实往往有很大差距。

  由于两个表存在有一定差异性,不同团队的代码都对两个表有依赖关系,所以暂时还没法实施,但最终会这样(我希望最终会这样)。

  2、取消auto_increment,程序能够产生唯一有意义的主键,现在还没有找到可用和可控制的唯一标识代替auto_increment。

  由于是多个团队操作这两个表,程序生成自增长id也是不现实的。

  3、使用主主复制,php和java分开在不通的master上写入,调整auto_increment的offset,来保证每个服务器的auto_increment和对方是不冲突的。

  这也是我们现在使用的方法,不过问题在于启用了master-master的双主写入,在架构维护上有一些问题,比如没法做到HA,数据库迁移或者操作的时候限制更多。

  4、也就是我们今天说的参考表。

  建立一个参考表,php和java先去参考表获取一个没有使用的id,然后把参考表上这个id的状态置为已使用,然后使用获取的id插入到自己操作的表中。

  这个方案相对修改代码较少,对数据库架构也没有影响。

  三、在某些查询时候需要使用的参考数据

  下面的方法主要吸收与姜老的 《mysql技术内幕 sql编程》

  1、查询一个字段连续的值有哪些,这个需要数字参考表。

  这个查询和数字参考表没太大关系,主要使用的是临时生成的行号,不过特别有趣,分享给大家。

  create table t(a int unsigned not null primary key);
  insert into t select 1;
  insert into t select 2;
  insert into t select 3;
  insert into t select 100;
  insert into t select 101;
  insert into t select 103;
  insert into t select 104;
  insert into t select 105;

  求出哪些是连续的,并给出连续的范围。

  SELECT
  MIN(a) start_range,
  MAX(a) end_range
  FROM
  (SELECT
  a,
  rn,
  a-rn AS diff
  FROM
  (SELECT
  a,
  @a := @a + 1 rn
  FROM
  t ,
  (SELECT
  @a :=0) AS a) AS b) AS c
  GROUP BY diff ;

  2、使用数字参考表可以更快的预建立时间维度表

  DELIMITER $$
  USE `test`$$
  DROP PROCEDURE IF EXISTS `sp_createTimeDim`$$
  CREATE DEFINER=`root`@`localhost` PROCEDURE `sp_createTimeDim`(START DATE,END DATE)
  BEGIN
  SELECT DATE_ADD(START,INTERVAL id-1 DAY) FROM ref_number WHERE id<=DATEDIFF(END,START)+1;
  END$$
  DELIMITER ;

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

ISADBA
ISADBA

相关推荐