Java 转换 HTML 到PDF有许多类库,本日我们先容一下第三方免费的类库OpenPDF。
1. OpenPDFOpenPDF是免费的Java类库 ,屈服LGPL 和 MPL协议,以是基本上能够可以随意利用。OpenPDF是基于iTEXT的,目前来说也是掩护的比较好的Java操作PDF的开源软件。
话不多说,且看所须要的依赖,
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.13.1</version> </dependency><dependency> <groupId>com.openhtmltopdf</groupId> <artifactId>openhtmltopdf-core</artifactId> <version>1.0.6</version></dependency><dependency> <groupId>com.openhtmltopdf</groupId> <artifactId>openhtmltopdf-pdfbox</artifactId> <version>1.0.6</version></dependency>
jsoup可以将html文件转换成输入流等,也可以遍历html的DOM节点,提取元素及样式等。
2. 示例本篇示例将以下html文件转换成pdf
<html><head> <style> .center_div { border: 1px solid #404e94; margin-left: auto; margin-right: auto; background-color: #f6d0ed; text-align: left; padding: 8px; } table { width: 100%; border: 1px solid black; } th, td { border: 1px solid black; } body,html,input{font-family:"msyh";} </style></head><body><div class="center_div"> <h1>Hello java North!</h1> <div> <p>convert html to pdf.</p> </div> <div> <table> <thead> <th>ROLE</th> <th>NAME</th> <th>TITLE</th> </thead> <tbody> <tr> <td>MARKSMAN</td> <td>ASHE</td> <td>THE FROST ARCHER</td> </tr> <tr> <td>MAGES</td> <td>ANNIE</td> <td>THE DARK CHILD</td> </tr> <tr> <td>射手</td> <td>凯塔琳</td> <td>皮城女警</td> </tr> </tbody> </table> </div></div></body></html>
以上html用浏览器打开如下,乱码是由于中笔墨体不识别,下面转换的时候会加载对应的字体来进行转换。
利用Java转换HTML到PDF代码如下:
public class HtmlToPDFOpenSource { public static void main(String[] args) throws IOException { HtmlToPDFOpenSource htmlToPDFOpenSource = new HtmlToPDFOpenSource(); htmlToPDFOpenSource.generatePdfByOpenhtmltopdf(); } private void generatePdfByOpenhtmltopdf() throws IOException { File inputHtml = new File("E:\\javaNorth\\java-study-note\\javaOpenSource\\src\\main\\resources\\test.html"); //加载html文件 Document document = Jsoup.parse(inputHtml, "UTF-8"); document.outputSettings().syntax(Document.OutputSettings.Syntax.html); //引入资源目录,可以单独引入css,图片文件等 String baseUri = FileSystems.getDefault() .getPath("javaOpenSource\\src\\main\\resources") .toUri().toString(); try (OutputStream os = new FileOutputStream("javaOpenSource\\src\\main\\resources\\testOpenLeagueoflegends1.pdf")) { PdfRendererBuilder builder = new PdfRendererBuilder(); builder.withUri("javaOpenSource\\src\\main\\resources\\testOpenLeagueoflegends1.pdf"); builder.toStream(os); builder.withW3cDocument(new W3CDom().fromJsoup(document), baseUri); //引入指定字体,把稳字体名须要和css样式中指定的字体名相同 builder.useFont(new File("javaOpenSource\\src\\main\\resources\\fonts\\msyh.ttf"),"msyh",1,BaseRendererBuilder.FontStyle.NORMAL, true); builder.run(); } }}
利用Java代码转换成PDF如下(示例中利用了微软雅黑中笔墨体):
上述html文件中增加如下外部样式:
<link href="style.css" rel="stylesheet">
并在resources目录下添加style.css文件,重新天生PDF文件如下。
3. 总结
本片先容了利用OpenPDF将html文件转换成PDF文件。同时也利用了自定义字体,外部样式。但是以下几点须要格外把稳。
Java代码中加载的字体名称要和HTML引用的CSS样式中的字体名相同 ({font-family:"msyh";})。HTML文件标签节点必须闭合(<xxx></xxx>).否则解析会失落败。全部示例在此:https://github.com/javatechnorth/java-study-note/tree/master/javaOpenSource/src/main/java/pdf
文章来源:Java技能指北