Java

一、介绍

在实际的业务开发的时候,研发人员往往会碰到很多这样的一些场景,需要提供相关的电子凭证信息给用户,例如网银/支付宝/微信购物支付的电子发票、订单的库存打印单、各种电子签署合同等等,以方便用户查看、打印或者下载。
例如下图的电子发票!
2021-09-15-09-33-23-102052.jpeg
熟悉这块业务的童鞋,一定特别清楚,目前最常用的解决方案是:把相关的数据信息,通过一些技术手段生成对应的 PDF 文件,然后返回给用户,以便预览、下载或者打印。
不太熟悉这项技术的童鞋,也不用着急,一起来详细了解一下在线生成 PDF 文件的技术实现手段!

二、案例实现

在介绍这个代码实践之前,先来了解一下这个第三方库:iText。
iText是著名的开放源码站点sourceforge一个项目,是用于生成PDF文档的一个java类库,通过iText不仅可以生成PDF或rtf的文档,而且还可以将XML、Html文件转化为PDF文件。
iText目前有两套版本,分别是iText5和iText7。iText5应该是网上用的比较多的一个版本。iText5因为是很多开发者参与贡献代码,因此在一些规范和设计上存在不合理的地方。iText7是后来官方针对iText5的重构,两个版本差别还是挺大的。不过在实际使用中,一般用到的都比较简单的 API,所以不用特别拘泥于使用哪个版本。

2.1、添加 iText 依赖包

在使用它之前,先引人相关的依赖包!

  1. <dependencies>
  2. <!-- pdf:start -->
  3. <dependency>
  4. <groupId>com.itextpdf</groupId>
  5. <artifactId>itextpdf</artifactId>
  6. <version>5.5.11</version>
  7. </dependency>
  8. <dependency>
  9. <groupId>com.itextpdf.tool</groupId>
  10. <artifactId>xmlworker</artifactId>
  11. <version>5.5.11</version>
  12. </dependency>
  13. <!-- 支持中文 -->
  14. <dependency>
  15. <groupId>com.itextpdf</groupId>
  16. <artifactId>itext-asian</artifactId>
  17. <version>5.2.0</version>
  18. </dependency>
  19. <!-- 支持css样式渲染 -->
  20. <dependency>
  21. <groupId>org.xhtmlrenderer</groupId>
  22. <artifactId>flying-saucer-pdf-itext5</artifactId>
  23. <version>9.1.16</version>
  24. </dependency>
  25. <!-- 转换html为标准xhtml包 -->
  26. <dependency>
  27. <groupId>net.sf.jtidy</groupId>
  28. <artifactId>jtidy</artifactId>
  29. <version>r938</version>
  30. </dependency>
  31. <!-- pdf:end -->
  32. </dependencies>

2.2、简单实现

先来一个hello world,代码如下:

  1. public class CreatePDFMainTest {
  2. public static void main(String[] args) throws Exception {
  3. Document document = new Document(PageSize.A4);
  4. //第二步,创建Writer实例
  5. PdfWriter.getInstance(document, new FileOutputStream("hello.pdf"));
  6. //创建中文字体
  7. BaseFont bfchinese = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
  8. Font fontChinese = new Font(bfchinese, 12, Font.NORMAL);
  9. //第三步,打开文档
  10. document.open();
  11. //第四步,写入内容
  12. Paragraph paragraph = new Paragraph("hello world", fontChinese);
  13. document.add(paragraph);
  14. //第五步,关闭文档
  15. document.close();
  16. }
  17. }

打开hello.pdf文件,内容如下!
2021-09-15-09-33-23-263021.jpeg

2.3、复杂实现

在实际的业务开发中,因为业务场景非常复杂,而且变化快,往往不会采用上面介绍的写入内容方式来生成文件,而是采用HTML文件转化为PDF文件。
例如下面这张入库单!
使用Java开发在线生成pdf文档 - 图3
应该如何快速实现呢?
首先采用html语言编写一个入库单页面,将其命令为printDemo.html,源代码如下:

  1. <html>
  2. <head></head>
  3. <body>
  4. <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
  5. <title>出库单</title>
  6. <div>
  7. <div>
  8. <table width="100%" border="0" cellspacing="0" cellpadding="0">
  9. <tbody>
  10. <tr>
  11. <td height="40" colspan="2"><h3 style="font-weight: bold; text-align: center; letter-spacing: 5px; font-size: 24px;">入库单</h3></td>
  12. <td width="12%" height="20" rowspan="2">
  13. <img style="width: 105px;height: 105px;" src="data:image/jpeg;base64,iVBORw0KGgoAAAANSUhEUgAAAH0AAAB9AQAAAACn+1GIAAAAqElEQVR42u3VMQ7DMAwDQP6A//8lx24qKRRw0s1yu8Uw4OQGIaHsBHUfLzzwAxCAInoZg6dI9dUUBIOyHEG56CmodAaxwtfbboLTVWpeU9+EDAH37m9CmkTYxDGUE0agMIakk3y4Ut8G37iom02M4bPniHWAtqFDTjjSGLrZvXAOmTnL1124C73r6Yo8Ane61k6eQeVjIM2h482D1RwScrpNjuH5R/0b3s6ZZNyKlt3iAAAAAElFTkSuQmCC" />
  14. </td>
  15. </tr>
  16. <tr>
  17. <td width="50%" height="30">操作人:xxx</td>
  18. <td width="50%" height="30" colspan="2">创建时间:2021-09-14 12:00:00</td>
  19. </tr>
  20. </tbody>
  21. </table>
  22. </div>
  23. <div style="margin-top: 5px; margin-bottom: 6px; margin-left: 4px"></div>
  24. <div>
  25. <table width="100%"
  26. style="border-collapse: collapse; border-spacing: 0;border:0px;">
  27. <tr style="height: 25px;">
  28. <td style="background: #eaeaea; text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;"
  29. width="10%">序号</td>
  30. <td style="background: #eaeaea; text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;"
  31. width="30%">商品</td>
  32. <td style="background: #eaeaea; text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;"
  33. width="30%">单位</td>
  34. <td style="background: #eaeaea; text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000;"
  35. width="30%">数量</td>
  36. </tr>
  37. <tr>
  38. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">1</td>
  39. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">xxx沐浴露</td>
  40. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;"></td>
  41. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000;">3</td>
  42. </tr>
  43. <tr>
  44. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">2</td>
  45. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">xxx洗发水</td>
  46. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;"></td>
  47. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000;">4</td>
  48. </tr>
  49. <tr>
  50. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">3</td>
  51. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">xxx洗衣粉</td>
  52. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;"></td>
  53. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000;">5</td>
  54. </tr>
  55. <tr>
  56. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-bottom: 1px solid #000000;">4</td>
  57. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-bottom: 1px solid #000000;">xxx洗面奶</td>
  58. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-bottom: 1px solid #000000;"></td>
  59. <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000; border-bottom: 1px solid #000000;">5</td>
  60. </tr>
  61. </table>
  62. </div>
  63. </div>
  64. </body>
  65. </html>

接着,将html文件转成PDF文件,源码如下:

  1. public class CreatePDFMainTest {
  2. /**
  3. * 创建PDF文件
  4. * @param htmlStr
  5. * @throws Exception
  6. */
  7. private static void writeToOutputStreamAsPDF(String htmlStr) throws Exception {
  8. String targetFile = "pdfDemo.pdf";
  9. File targeFile = new File(targetFile);
  10. if(targeFile.exists()) {
  11. targeFile.delete();
  12. }
  13. //定义pdf文件尺寸,采用A4横切
  14. Document document = new Document(PageSize.A4, 25, 25, 15, 40);// 左、右、上、下间距
  15. //定义输出路径
  16. PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(targetFile));
  17. PdfReportHeaderFooter header = new PdfReportHeaderFooter("", 8, PageSize.A4);
  18. writer.setPageEvent(header);
  19. writer.addViewerPreference(PdfName.PRINTSCALING, PdfName.NONE);
  20. document.open();
  21. // CSS
  22. CSSResolver cssResolver = new StyleAttrCSSResolver();
  23. CssAppliers cssAppliers = new CssAppliersImpl(new XMLWorkerFontProvider(){
  24. @Override
  25. public Font getFont(String fontname, String encoding, boolean embedded, float size, int style, BaseColor color) {
  26. try {
  27. //用于中文显示的Provider
  28. BaseFont bfChinese = BaseFont.createFont("STSongStd-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
  29. return new Font(bfChinese, size, style);
  30. } catch (Exception e) {
  31. return super.getFont(fontname, encoding, size, style);
  32. }
  33. }
  34. });
  35. //html
  36. HtmlPipelineContext htmlContext = new HtmlPipelineContext(cssAppliers);
  37. htmlContext.setTagFactory(Tags.getHtmlTagProcessorFactory());
  38. htmlContext.setImageProvider(new AbstractImageProvider() {
  39. @Override
  40. public Image retrieve(String src) {
  41. //支持图片显示
  42. int pos = src.indexOf("base64,");
  43. try {
  44. if (src.startsWith("data") && pos > 0) {
  45. byte[] img = Base64.decode(src.substring(pos + 7));
  46. return Image.getInstance(img);
  47. } else if (src.startsWith("http")) {
  48. return Image.getInstance(src);
  49. }
  50. } catch (BadElementException ex) {
  51. return null;
  52. } catch (IOException ex) {
  53. return null;
  54. }
  55. return null;
  56. }
  57. @Override
  58. public String getImageRootPath() {
  59. return null;
  60. }
  61. });
  62. // Pipelines
  63. PdfWriterPipeline pdf = new PdfWriterPipeline(document, writer);
  64. HtmlPipeline html = new HtmlPipeline(htmlContext, pdf);
  65. CssResolverPipeline css = new CssResolverPipeline(cssResolver, html);
  66. // XML Worker
  67. XMLWorker worker = new XMLWorker(css, true);
  68. XMLParser p = new XMLParser(worker);
  69. p.parse(new ByteArrayInputStream(htmlStr.getBytes()));
  70. document.close();
  71. }
  72. /**
  73. * 读取 HTML 文件
  74. * @return
  75. */
  76. private static String readHtmlFile() {
  77. StringBuffer textHtml = new StringBuffer();
  78. try {
  79. File file = new File("printDemo.html");
  80. BufferedReader reader = new BufferedReader(new FileReader(file));
  81. String tempString = null;
  82. // 一次读入一行,直到读入null为文件结束
  83. while ((tempString = reader.readLine()) != null) {
  84. textHtml.append(tempString);
  85. }
  86. reader.close();
  87. } catch (IOException e) {
  88. return null;
  89. }
  90. return textHtml.toString();
  91. }
  92. public static void main(String[] args) throws Exception {
  93. //读取html文件
  94. String htmlStr = readHtmlFile();
  95. //将html文件转成PDF
  96. writeToOutputStreamAsPDF(htmlStr);
  97. }
  98. }

运行程序,打开pdfDemo.pdf,结果如下!
2021-09-15-09-33-23-428025.jpeg

2.4、变量替换方式

上面的html文件,是事先已经编辑好的,才能正常渲染。
但是在实际的业务开发的时候,例如下面的商品内容,完全是动态的,还是xxx-202109入库单的名称,以及二维码,都是动态的。
这个时候,可以采用freemarker模板引擎,通过定义变量来动态填充内容,直到转换出来的结果就是想要的html页面。
当然,还有一种办法,例如下面这个,也可以在html页面里面定义${name}变量,然后在读取完文件之后,将其变量进行替换成想填充的任何值,这其实也是模板引擎最核心的一个玩法。

  1. <html>
  2. <head>
  3. <meta charset="utf-8">
  4. <title></title>
  5. </head>
  6. <body>
  7. <div>您好:${name}</div>
  8. <div>欢迎,登录博客网站</div>
  9. </body>
  10. </html>

三、总结

itext框架是一个非常实用的第三方pdf文件生成库,尤其是面对比较简单的pdf文件内容渲染的时候,它完全满足需求。
但是对于那种复杂的pdf文档,可能需要自己单独进行适配开发。具体的深度玩法,大家可以参阅itext官方API。