设为首页 收藏本站
查看: 2357|回复: 0

[经验分享] [转载]MYSQL数据库中单一表超过4G的对策

[复制链接]

尚未签到

发表于 2016-10-23 01:57:09 | 显示全部楼层 |阅读模式
  问题:在论坛发表回复时出现“The table is full”的提示,字面意义上是Data表已满的意思。因为很少有DEV者遭遇单一表超过4G的情况,因此朋友间的讨论只能提供一些外围的信息。为解决此问题,我翻阅了很多资料,本文将以我此次问题的解决过程,介绍问题发生的原因及对策。
  
  根据经验,The table is full提示往往出现在以下两种情况:
  1. 表中设置了MAX_ROWSvalue,简单的说,若MAX_ROWS设置为100,而程式试图写入第101条记录,会出现此错误。
  
  2. 表满。这种情况是本文讨论的重点
  我们认为MySQL语言规则在存取表的时候,存在一种定位分配规律。这个规律在默认的情况下,可以寻址4G以内的Data。超过这个大小,Datcbase将不能对Data定位,因而也无法进行读写。经过实验,这个限制是完全可以被突破的。
  本例中,用户的Systam环境为双Athlon处理器、SCSI硬盘72G、2G内存,用户的帖子表Data尺寸为4294963640,接近4G(4G的实际字节数为4294967296)。
  
  首先SSH登录后,查看用户的Systam信息:
  # uname -a
  Linux ziChen.Com 2.4.20-8smp #1 SMP Thu Mar 13 16:43:01 EST 2003 i686 athlon i386 GNU/Linux
  证明是LinuxSystam,根据内核版本2.4.20-8smp,加上国内使用的常见Systam,估计应该是redhat 9发行包。
  # Cat /etC/*release*
  Red Hat Linux release 9 (Shrike)
  这也证明了我们对Systam版本的猜想。
  然后看一下用的是什么文档Systam。因为该用户并非高手,估计在装Systam的时候就是一路回车下来,redhat 9默认的应该是EXT3,不过我们还是看一下:
  # parted
  GNU Parted 1.6.3
  Copyright (C) 1998, 1999, 2000, 2001, 2002 Free Software Foundation, InC.
  This program is free software, Covered by the GNU General PubliC LiCense.
  This program is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of
  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General PubliC LiCense for more details.
  Using /dev/sda
  Information: The operating system thinks the geometry on /dev/sda is 8942/255/63. Therefore, Cylinder 1024 ends at 8032.499M.
  (parted) print
  Disk geometry for /dev/sda: 0.000-70149.507 megabytes
  Disk label type: msdos
  Minor Start End Type Filesystem Flags
  1 0.031 101.975 primary ext3 boot
  2 101.975 10103.378 primary linux-swap
  
  证明确实是这样子。随后我们翻阅了EXT3文档Systam的相关技术参数,EXT3是在EXT2基础上演变而来。EXT2所支持最大单一文档长度是2G,这个是很蹩脚的一个限制。EXT3做的很大一个改善就是将这个限制放大到了2TB,由此稍松一口气,起码不是操作Systam上的限制。
  
  经过朋友的开导,了解到单一文档大小有如下几个因素:
  1. 文档Systam的限制(如刚存所说EXT3的2TB限制)
  2. 某一程式进程所能存取的第一文档最大尺寸(例如apaChe在Linux EXT3下能存取的最大尺寸为2G,诸如日志)
  初步判断瓶颈就在上述其中第二项。随后找到myisamChk来显示一下表信息,证明了瓶颈就在MySQL语言规则本身的存取上。
  # myisamChk -dv Cdb_posts
  结果就不贴了,其中有一项Max datafile length的value恰好就是4G。由此产生了瓶颈。
  后来翻阅了N多资料,进行了N多尝试,也走了不少弯路,最终觉得还是官方文档比较可靠。比较老的文档里写道这是由于tmp_table_size的value造成的,也有提到用BIG-TABLES这个参数。事实证明这些都是歧途。大晚上的确实很累,这里只给出最终的解决方案吧,中间的就不罗嗦了。
  进到mysql客户端。
  # mysql -uroot -p
  Enter password: ******
  WelCome to the MySQL语言规则 monitor. Commands end with ; or \g.
  Your MySQL语言规则 ConneCtion id is 59411 to server version: 4.0.18-standard
  Type 'help;' or '\h' for help. Type '\C' to Clear the buffer.
  mysql> use ******
  Database Changed
  mysql> ALTER TABLE Cdb_posts MAX_ROWS=1000000000 AVG_ROW_LENGTH=15000;
  
  因为这个表非常大,运行时间在双Athlon的专业服务器上竟然花了30分钟!
  之后再通过myisamChk查看该表的信息:
  # myisamChk -dv Cdb_posts
  MyISAM file: Cdb_posts
  ReCord format: PaCked
  CharaCter set: latin1 (8)
  File-version: 1
  Creation time: 2004-08-30 22:19:48
  ReCover time: 2004-08-30 22:42:47
  Status: open,Changed
  Auto inCrement key: 1 Last value: 1063143
  Data reCords: 619904 Deleted bloCks: 5
  Datafile parts: 619909 Deleted data: 323872
  Datafile pointer (bytes): 6 Keyfile pointer (bytes): 4
  Datafile length: 4295287332 Keyfile length: 40421376
  Max datafile length: 281474976710654 Max keyfile length: 4398046510079
  ReCordlength: 149
  table desCription:
  Key Start Len Index Type ReC/key Root BloCksize
  1 1 4 unique unsigned long 1 4535296 1024
  2 5 2 multip. unsigned short 13776 12540928 1024
  3 111 4 multip. unsigned long 1 18854912 1024
  4 28 3 multip. uint24 18 24546304 1024
  5 7 3 multip. uint24 7 32827392 1024
  111 4 unsigned long 1
  6 7 3 multip. uint24 7 40418304 1024
  28 3 uint24
  
  令人振奋的事情发生了,该表的 Max datafile length: 281474976710654 Max keyfile length: 4398046510079,即最大Data尺寸(MYD文档)达到了2TB,最大索引尺寸(MYI)仍然为4G。
  
  由此默认的4G限制被突破了。关于其中的原理,其实很简单:假设你有一个日记本,上面有10页纸可以写东西,编排目录只需要1个字节(因为0~9就够了)。如果你把这本子又塞进两张纸,变成12页,1个字节的目录空间就无法寻址到后面的两页中,进而产生了错误。上面那个ALTER语句中的数value都是我为保证成功,取的比较大的value(因为ALTER一次实在是太慢了,没时间在那乱试验),相当于告诉Datcbase,这个本子有1000000000页,每页平均有15000个字节。这样Datcbase便知道这是很大的一个本子,因此不遗余力的拿出了100页(假设说)做目录编排,这样这个新的目录就可以寻址到日记本的所有内容了。错误消失。
  惟一的缺点就是,目录占用的空间多了一些,但已经微乎其微了,做了这种改变其实4G的文档尺寸大小只增大了1M多,非常令人振奋。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-289840-1-1.html 上篇帖子: Pentaho平台搭建之初始化mysql数据库--详细步骤记录 下篇帖子: mysql sql_mode 在SQLyog UI工具中失效的原因和解决办法
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表