来源 l Hollis(ID:hollischuang)
关于String有没有长度限定的问题,我之前单独写过一篇文章剖析过,最近我又抽空回顾了一下这个问题,创造又有了一些新的认识。于是准备重新整理下这个内容。
这次在之前那篇文章的根本上除了增加了一些验证过程外,还有些缺点内容的改动。我这次在剖析过程中会考试测验对Jdk的编译过程进行debug,并且会参考一些JVM规范等全方面的先容下这个知识点。由于这个问题涉及到Java的编译事理干系的知识,以是通过视频的办法讲解会更加随意马虎理解一些,视频我上传到了B站,大家可以到文末点击阅读原文查看。

String的长度限定
想要搞清楚这个问题,首先我们须要翻阅一下String的源码,看下个中是否有关于长度的限定或者定义。
String类中有很多重载的布局函数,个中有几个是支持用户传入length来实行长度的:
public String(byte bytes[], int offset, int length)
可以看到,这里面的参数length是利用int类型定义的,那么也便是说,String定义的时候,最大支持的长度便是int的最大范围值。
根据Integer类的定义,java.lang.Integer#MAX_VALUE的最大值是2^31 - 1;
那么,我们是不是就可以认为String能支持的最大长度便是这个值了呢?
实在并不是,这个值只是在运行期,我们布局String的时候可以支持的一个最大长度,而实际上,在运行期,定义字符串的时候也是有长度限定的。
如以下代码:
String s = \公众11111...1111\"大众;//个中有10万个字符\公众1\公众
当我们利用如上形式定义一个字符串的时候,当我们实行javac编译时,是会抛出非常的,提示如下:
缺点: 常量字符串过长
那么,明明String的布局函数指定的长度是可以支持2147483647(2^31 - 1)的,为什么像以上形式定义的时候无法编译呢?实在,形如String s = \公众xxx\"大众;定义String的时候,xxx被我们称之为字面量,这种字面量在编译之后会以常量的形式进入到Class常量池。那么问题就来了,由于要进入常量池,就要遵守常量池的有关规定。
常量池限定
我们知道,javac是将Java文件编译成class文件的一个命令,那么在Class文件天生过程中,就须要遵守一定的格式。
根据《Java虚拟机规范》中第4.4章节常量池的定义,CONSTANT_String_info 用于表示 java.lang.String 类型的常量工具,格式如下:
CONSTANT_String_info {u1 tag;u2 string_index;}
个中,string_index 项的值必须是对常量池的有效索引, 常量池在该索引处的项必须是CONSTANT_Utf8_info 构造,表示一组 Unicode 码点序列,这组 Unicode 码点序列终极会被初始化为一个 String 工具。
CONSTANT_Utf8_info构造用于表示字符串常量的值:
CONSTANT_Utf8_info {u1 tag;u2 length;u1 bytes[length];}
个中,length则指明了 bytes数组的长度,其类型为u2,
通过翻阅《规范》,我们可以获悉。u2表示两个字节的无符号数,那么1个字节有8位,2个字节就有16位。
16位无符号数可表示的最大值位2^16 - 1= 65535。
也便是说,Class文件中常量池的格式规定了,其字符串常量的长度不能超过65535。
那么,我们考试测验利用以下办法定义字符串:
String s = \"大众11111...1111\"大众;//个中有65535万个字符\"大众1\"大众
考试测验利用javac编译,同样会得到\"大众缺点: 常量字符串过长\"大众,那么缘故原由是什么呢?
实在,这个缘故原由在javac的代码中是可以找到的,在Gen类中有如下代码:
private void checkStringConstant(DiagnosticPosition var1, Object var2) {
if (this.nerrs == 0 && var2 != && var2 instanceof String
&& ((String)var2).length >= 65535) {
this.log.error(var1, \"大众limit.string\公众, new Object[0]);
++this.nerrs;
}
}
代码中可以看出,当参数类型为String,并且长度大于即是65535的时候,就会导致编译失落败。
这个地方大家可以考试测验着debug一下javac的编译过程(视频中有对java的编译过程进行debug的方法),也可以创造这个地方会报错。
如果我们考试测验以65534个字符定义字符串,则会创造可以正常编译。
实在,关于这个值,在《Java虚拟机规范》也有过解释:
If the Java Virtual Machine code for a method is exactly 65535 bytes long and endswith an instruction that is 1 byte long, then that instruction cannot beprotected by an exception handler. A compiler writer can work around this bugby limiting the maximum size of the generated Java Virtual Machine code for anymethod, instance initialization method, or static initializer (the size of anycode array) to 65534 bytes.
运行期限制
上面提到的这种String长度的限定是编译期的限定,也便是利用String s= “”;这种字面值办法定义的时候才会有的限定。
那么。String在运行期有没有限定呢,答案是有的,便是我们前文提到的那个Integer.MAX_VALUE,这个值约即是4G,在运行期,如果String的长度超过这个范围,就可能会抛出非常。(在jdk 1.9之前)
int是一个 32 位变量类型,取正数部分来算的话,他们最长可以有:
2^31-1 =2147483647 个 16-bit Unicodecharacter2147483647 16 = 34359738352 位34359738352 / 8 = 4294967294 (Byte)4294967294 / 1024 = 4194303.998046875 (KB)4194303.998046875 / 1024 = 4095.9999980926513671875 (MB)4095.9999980926513671875 / 1024 = 3.99999999813735485076904296875 (GB)
有近 4G 的容量。
很多人会有迷惑,编译的时候最大长度都哀求小于65535了,运行期怎么会涌现大于65535的情形呢。这实在很常见,如以下代码:
String s = \"大众\"大众;for (int i = 0; i <100000 ; i++) {s+=\"大众i\"大众;}
得到的字符串长度就有10万,其余我之前在实际运用中碰着过这个问题。
之前一次系统对接,须要传输高清图片,约定的传输办法是对方将图片转成BASE6编码,我们吸收到之后再转成图片。
在将BASE64编码后的内容赋值给字符串的时候就抛了非常。
总结
字符串有长度限定,在编译期,哀求字符串常量池中的常量不能超过65535,并且在javac实行过程中掌握了最大值为65534。
在运行期,长度不能超过Int的范围,否则会抛非常。
末了,这个知识点 ,我录制了视频,个中有关于如何进行实验测试、如何查阅Java规范以及如何对javac进行debug的技巧。欢迎进一步学习。
☞无代码来了,还要程序员吗?
☞董明珠回应直播带货刷单;腾讯五年 5000 亿发力新基建;Python 3.9 新特性 | 极客头条
☞芯片供应被掐断,华为能否安全渡劫?
☞来了来了!
趋势预测算法大PK!
☞Python开拓之:Django基于Docker实现Mysql数据库读写分离、集群、主从同步详解 | 原力操持
☞15 岁黑进系统,发挑衅邮件意外获 Offer,不惑之年捐出全部财产,Twitter CEO 太牛了!