典型问答

Q:理解Java字符串,String、StringBuffer、StringBuilder有什么区别?

A:
String是Java语言基础和重要的类,提供了构造和管理字符串的各种基本逻辑。类和属性都被声明为final,是典型的Immutable(不可变)类。由于其不可变性,类似拼接、裁剪字符串等操作,都会产生新的String对象。由于字符串操作的普遍性,所以相关操作的效率往往对应用性能有明显影响。
StringBuffer和StringBuilder是为了解决拼接产生过多中间对象的问题而提供的类,可以使用append或insert方法,把字符串添加到已有序列的末尾或者指定位置。StringBuffer是线程安全的可修改字符序列,保证了线程安全,也随之带来额外的性能开销,除非有线程安全需要,否则推荐使用StringBuilder。StringBuilder在能力上和StringBuffer没有本质区别,但是去掉了线程安全的部分,有效减小了开销。**

考点分析

理解字符串的设计和实现以及相关工具类如拼接类的使用
基础知识:

  • String是Immutable的
  • 字符串操作不当可能会产生大量临时字符串
  • 线程安全方面的区别

进阶深入:

  • 通过String和相关类,考察基本的线程安全设计与实现,各种基础编程实践。
  • 考察JVM对象缓存机制的理解以及如何良好地使用
  • 考察JVM优化Java代码的一些技巧
  • String相关类的演进,比如Java 9中实现的巨大变化

知识扩展

字符串设计和实现

  1. String
    (1) String的创建机理
    由于String在Java世界中使用过于频繁,Java为了避免在一个系统中产生大量的String对象,引入了字符串常量池。其运行机制是:创建一个字符串时,首先检查池中是否有值相同的字符串对象,如果有则不需要创建直接从池中刚查找到的对象引用;如果没有则新建字符串对象,返回对象引用,并且将新创建的对象放入池中。但是,通过new方法创建的String对象是不检查字符串池的,而是直接在堆区或栈区创建一个新的对象,也不会把对象放入池中。上述原则只适用于通过直接量给String对象引用赋值的情况。
    举例:String str1 = “123”; //通过直接量赋值方式,放入字符串常量池
    String str2 = new String(“123”);//通过new方式赋值方式,不放入字符串常量池
    注意:String提供了intern()方法。调用该方法时,如果常量池中包括了一个等于此String对象的字符串(由equals方法确定),则返回池中的字符串。否则,将此String对象添加到池中,并且返回此池中对象的引用。
    (2) String的特性
    [A] 不可变。是指String对象一旦生成,则不能再对它进行改变。不可变的主要作用在于当一个对象需要被多线程共享,并且访问频繁时,可以省略同步和锁等待的时间,从而大幅度提高系统性能。不可变模式是一个可以提高多线程程序的性能,降低多线程程序复杂度的设计模式。
    [B] 针对常量池的优化。当2个String对象拥有相同的值时,他们只引用常量池中的同一个拷贝。当同一个字符串反复出现时,这个技术可以大幅度节省内存空间。
  2. StringBuffer/StringBuilder
    StringBuffer和StringBuilder都实现了AbstractStringBuilder抽象类,拥有几乎一致对外提供的调用接口;其底层在内存中的存储方式与String相同,都是以一个有序的字符序列(char类型的数组,JDK9以后是byte数组)进行存储,不同点是StringBuffer/StringBuilder对象的值是可以改变的,并且值改变以后,对象引用不会发生改变;两者对象在构造过程中,首先按照默认大小申请一个字符数组,由于会不断加入新数据,当超过默认大小后,会创建一个更大的数组,并将原先的数组内容复制过来,再丢弃旧的数组。因此,对于较大对象的扩容会涉及大量的内存复制操作,如果能够预先评估大小,可提升性能。
    唯一需要注意的是:StringBuffer是线程安全的,但是StringBuilder是线程不安全的。可参看Java标准类库的源代码,StringBuffer类中方法定义前面都会有synchronize关键字。为此,StringBuffer的性能要远低于StringBuilder。
  3. 应用场景
    [A]在字符串内容不经常发生变化的业务场景优先使用String类。例如:常量声明、少量的字符串拼接操作等。如果有大量的字符串内容拼接,避免使用String与String之间的“+”操作,因为这样会产生大量无用的中间对象,耗费空间且执行效率低下(新建对象、回收对象花费大量时间)。
    [B]在频繁进行字符串的运算(如拼接、替换、删除等),并且运行在多线程环境下,建议使用StringBuffer,例如XML解析、HTTP参数解析与封装。
    [C]在频繁进行字符串的运算(如拼接、替换、删除等),并且运行在单线程环境下,建议使用StringBuilder,例如SQL语句拼装、JSON封装等

字符串缓存

String自身的演化

精选留言

一课一练

字符相关的问题,比如编码相关的问题。可以思考一下,很多字符串操作,比如 getBytes()/String(byte[] bytes) 等都是隐含着使用平台默认编码,这是一种好的实践吗?是否有利于避免乱码?