Mybatis
数据库使用的是SQLServer,JDK版本1.8,运行在SpringBoot环境下 对比3种可用的方式

  • 反复执行单条插入语句
  • xml拼接sql
  • 批处理执行

先说结论:少量插入请使用反复插入单条数据,方便。数量较多请使用批处理方式。(可以考虑以有需求的插入数据量20条左右为界吧,在测试和数据库环境下耗时都是百毫秒级的,方便最重要)
无论何时都不用xml拼接sql的方式。

代码

拼接SQL的xml

newId()是sqlserver生成UUID的函数,与本文内容无关

  1. <insert id="insertByBatch" parameterType="java.util.List">
  2. INSERT INTO tb_item VALUES
  3. <foreach collection="list" item="item" index="index" separator=",">
  4. (newId(),#{item.uniqueCode},#{item.projectId},#{item.name},#{item.type},#{item.packageUnique},
  5. #{item.isPackage},#{item.factoryId},#{item.projectName},#{item.spec},#{item.length},#{item.weight},
  6. #{item.material},#{item.setupPosition},#{item.areaPosition},#{item.bottomHeight},#{item.topHeight},
  7. #{item.serialNumber},#{item.createTime}</foreach>
  8. </insert>

Mapper接口Mapper 是 mybatis插件tk.Mapper 的接口,与本文内容关系不大

  1. public interface ItemMapper extends Mapper<Item> {
  2. int insertByBatch(List<Item> itemList);
  3. }

Service类

  1. @Service
  2. public class ItemService {
  3. @Autowired
  4. private ItemMapper itemMapper;
  5. @Autowired
  6. private SqlSessionFactory sqlSessionFactory;
  7. //批处理
  8. @Transactional
  9. public void add(List<Item> itemList) {
  10. SqlSession session = sqlSessionFactory.openSession(ExecutorType.BATCH,false);
  11. ItemMapper mapper = session.getMapper(ItemMapper.class);
  12. for (int i = 0; i < itemList.size(); i++) {
  13. mapper.insertSelective(itemList.get(i));
  14. if(i%1000==999){//每1000条提交一次防止内存溢出
  15. session.commit();
  16. session.clearCache();
  17. }
  18. }
  19. session.commit();
  20. session.clearCache();
  21. }
  22. //拼接sql
  23. @Transactional
  24. public void add1(List<Item> itemList) {
  25. itemList.insertByBatch(itemMapper::insertSelective);
  26. }
  27. //循环插入
  28. @Transactional
  29. public void add2(List<Item> itemList) {
  30. itemList.forEach(itemMapper::insertSelective);
  31. }
  32. }

测试类

  1. @RunWith(SpringRunner.class)
  2. @SpringBootTest(webEnvironment = SpringBootTest.WebEnvironment.RANDOM_PORT, classes = ApplicationBoot.class)
  3. public class ItemServiceTest {
  4. @Autowired
  5. ItemService itemService;
  6. private List<Item> itemList = new ArrayList<>();
  7. //生成测试List
  8. @Before
  9. public void createList(){
  10. String json ="{\n" +
  11. " \"areaPosition\": \"TEST\",\n" +
  12. " \"bottomHeight\": 5,\n" +
  13. " \"factoryId\": \"0\",\n" +
  14. " \"length\": 233.233,\n" +
  15. " \"material\": \"Q345B\",\n" +
  16. " \"name\": \"TEST\",\n" +
  17. " \"package\": false,\n" +
  18. " \"packageUnique\": \"45f8a0ba0bf048839df85f32ebe5bb81\",\n" +
  19. " \"projectId\": \"094b5eb5e0384bb1aaa822880a428b6d\",\n" +
  20. " \"projectName\": \"项目_TEST1\",\n" +
  21. " \"serialNumber\": \"1/2\",\n" +
  22. " \"setupPosition\": \"1B柱\",\n" +
  23. " \"spec\": \"200X200X200\",\n" +
  24. " \"topHeight\": 10,\n" +
  25. " \"type\": \"Steel\",\n" +
  26. " \"uniqueCode\": \"12344312\",\n" +
  27. " \"weight\": 100\n" +
  28. " }";
  29. Item test1 = JSON.parseObject(json,Item.class);
  30. test1.setCreateTime(new Date());
  31. for (int i = 0; i < 1000; i++) {//测试会修改此数量
  32. itemList.add(test1);
  33. }
  34. }
  35. //批处理
  36. @Test
  37. @Transactional
  38. public void tesInsert() {
  39. itemService.add(itemList);
  40. }
  41. //拼接字符串
  42. @Test
  43. @Transactional
  44. public void testInsert1(){
  45. itemService.add1(itemList);
  46. }
  47. //循环插入
  48. @Test
  49. @Transactional
  50. public void testInsert2(){
  51. itemService.add2(itemList);
  52. }
  53. }

测试结果

10条 25条数据插入经多次测试,波动性较大,但基本都在百毫秒级别
MyBatis 批量插入的三种方式比较 - 图1
其中 拼接sql方式在插入500条和1000条时报错(似乎是因为sql语句过长,此条跟数据库类型有关,未做其他数据库的测试):com.microsoft.sqlserver.jdbc.SQLServerException: 传入的表格格式数据流(TDS)远程过程调用(RPC)协议流不正确,此RPC请求中提供了过多的参数,最多应为2100

可以发现

  • 循环插入的时间复杂度是 O(n),并且常数C很大
  • 拼接SQL插入的时间复杂度(应该)是 O(logn),但是成功完成次数不多,不确定
  • 批处理的效率的时间复杂度是 O(logn),并且常数C也比较小

    结论

    循环插入单条数据虽然效率极低,但是代码量极少,在使用tk.Mapper的插件情况下,仅需代码:
    1. @Transactional
    2. public void add1(List<Item> itemList) {
    3. itemList.forEach(itemMapper::insertSelective);
    4. }
    因此,在需求插入数据数量不多的情况下肯定用它了。
    xml拼接sql是最不推荐的方式,使用时有大段的xml和sql语句要写,很容易出错,工作效率很低。更关键点是,虽然效率尚可,但是真正需要效率的时候挂了,又有什么用呢?
    批处理执行是有大数据量插入时推荐的做法,使用起来也比较方便。