Java 字符串
毫无疑问 String
是作为一个 Java 开发工程师天天都需要打交道的类,那么如果问 String
字符串的最大长度是多少知道吗?
可能想都没想,就直接回答 65535
,那么问题来了,真的吗?
首先对于 String
可以有下面几种用法:
- 定义一个
String
类型的变量:private static final String STRING_TEST = "xxxxxxxxxxx";
或者String newString = "newString";
- 通过在方法中定义
String
类型的变量,通过字节流创建字符串:byte[] bytes = new byte[length];String s = new String(bytes);
;
有朋友可能会说,这两种不都是定义一个字符串变量,有什么区别吗?表面上看是没什么区别,但是实际上区别还是蛮大的。
首先第一种方式定一个静态类变量,或者普通的字符串变量,这种形式字符串是存放在栈中的;而第二种方式字符串是存放在堆中的。这个时候有的小伙伴又要问了,这存在不同的地方有什么关系呢?首先这关系可大了!
当字符串存放在栈中的时候,根据 class
文件的结果规范,可以看到所采用的的存储格式是这样的:
CONSTANT_Utf8_info {
u1 tag;
u2 length;
u1 bytes[length];
}
其中 u2
是一种类似于Java 中 int
一样的数据类型,只是表示的是一个 2 个字节的数据类型,只不过 int
是 4 个字节,这也就意味着允许的最大长度为 65535
个字符。所以可以得出一个结果,当字符串存放在栈内存中的时候,字符串的长度可以达到 65535
。
再看看第二种方式。很显然第二种方式不管是通过字节流的方式,还是 new
一个对象,存放的位置都是早 Java 的堆内存中,而且通过 String
的源码,可以看到了,底层是通过一个 char[]
数组来存放的。
private final char value[];
那么就知道了,字符传的大小就跟数组的长度有直接关系了,另外在定义数组长度的时候,最多只能定义 int
类型的最大值,也就是Integer.MAX_VALUE = 0x7fffffff;
而且 String
类的 length()
方法的返回值也可以看出来,返回的类型是 int
,数值最大也是Integer.MAX_VALUE = 0x7fffffff;
/**
* Returns the length of this string.
* The length is equal to the number of <a href="Character.html#unicode">Unicode
* code units</a> in the string.
*
* @return the length of the sequence of characters represented by this
* object.
*/
public int length() {
return value.length;
}
所以看到这里,又得出了一个结果,当字符串存放在堆内存的时候,最大的长度为 Integer.MAX_VALUE = 0x7fffffff;
。不过需要注意的是,这个数值是理论上的,其实很多虚拟机会在数组中加入一些字符,所以实际的数值是达不到这么多,另外在 ArrayList
中也可以看到这个验证,这里定义的最大值就是Integer.MAX_VALUE - 8
; 而不直接采用最大值。
此外上面说的最大值是在虚拟机有这么大的内存的前提下,如果说虚拟机配置的内存比这个要小,那也是达不到这么大。可以通过 JVM 参数来配置虚拟机的内存大小,-Xms512m
设置堆内存初始值大小。-Xmx1024m
设置堆内存最大值。下面是在自己的电脑上测试的效果,可以看到,当开始提示Requested array size exceeds VM limit,后面因为电脑内存不够了,所以一直分配失败,达不到最大值,只能降低长度了。
另外还要注意一个点,那就是在这里说的长度针对的都是英文字符。