直接使用运算符

  1. func BenchmarkAddStringWithOperator(b *testing.B) {
  2. hello := "hello"
  3. world := "world"
  4. for i := 0; i < b.N; i++ {
  5. _ = hello + "," + world
  6. }
  7. }

golang里面的字符串都是不可变的,每次运算都会产生一个新的字符串,所以会产生很多临时的无用的字符串,不仅没有用,还会给gc带来额外的负担,所以性能比较差。

fmt.Sprintf()

  1. func BenchmarkAddStringWithSprintf(b *testing.B) {
  2. hello := "hello"
  3. world := "world"
  4. for i := 0; i < b.N; i++ {
  5. _ = fmt.Sprintf("%s,%s", hello, world)
  6. }
  7. }

内部使用[]byte实现,不像直接运算符这种会产生很多临时的字符串,但是内部的逻辑比较复杂,有很多的额外判断,还用到了interface,所以性能也不是很好。

strings.Join()

  1. func BenchmarkAddStringWithJoin(b *testing.B) {
  2. hello := "hello"
  3. world := "world"
  4. for i := 0; i < b.N; i++ {
  5. _ = strings.Join([]string{hello, world}, ",")
  6. }
  7. }

join会先根据字符串数组的内容,计算出一个拼接之后的长度,然后申请对应大小的内存,一个一个字符串填入,在已有一个数组的情况下,这种效率会很高,但是本来没有,去构造这个数据的代价也不小。

buffer.WriteString()

  1. func BenchmarkAddStringWithBuffer(b *testing.B) {
  2. hello := "hello"
  3. world := "world"
  4. for i := 0; i < 1000; i++ { var buffer bytes.Buffer
  5. buffer.WriteString(hello)
  6. buffer.WriteString(",")
  7. buffer.WriteString(world)
  8. _ = buffer.String()
  9. }
  10. }

这个比较理想,可以当成可变字符使用,对内存的增长也有优化,如果能预估字符串的长度,还可以用buffer.Grow()接口来设置capacity。

主要结论

  • 在已有字符串数组的场合,使用strings.Join()能有比较好的性能;

  • 在一些性能要求比较高的场合,尽量使用buffer.WriteString()以获得更好的性能;

  • 性能要求不太高的场合,直接使用运算符,代码更简短清晰,能获得比较好的可读性;

  • 如果需要拼接的不仅仅是字符串,还有数字子类的其他需求的话,可以考虑fmt.Sprintf;


golang 字符串的连接方式 - 图1