在项目开发中,尤其是企业的业务系统中,对文档的操作是非常多的,有时几乎给人一种错觉的是”这个系统似乎就是专门操作文档的“。毕竟现在的很多办公中大都是在PC端操作文档等软件,在这些庞大而繁重的业务中,单单依靠人力去做文档的操作需要的代价是巨大的,比如数据统计,数据分析等业务要求。这就需要我们在开发系统时,应该尽量减少使用者的一些工作量,例如将数据直接写入文档,获取网页信息后直接存为PDF保存,以便以后继续查看。软件开发的目地是对使用者便捷,但这一要求未必对开发者来说也是便捷的。

在前面介绍过一款开源免费的组件DocX,这个组件主要是对文档进行操作。另一种对Excel操作的组件NPOI组件。今天介绍一款.NET Office操作组件Spire,这是一个企业级的.NET Office操作组件,但是这是一款不免费也不开源的组件。可能很多人听到这里就不想再读下去了,的确,在国内毕竟免费才可以占用主流市场,因为很多客户希望减少成本,所以希望采用免费的工具。

作为开发者,我也会有这样的观点,不过有的时候也会思考收费与免费的工具到底哪一个好,其实这样的思考到最后似乎是没有意义的,因为事物存在既有价值,免费的可以减少成本,收费的可以获取稳定而安全的支持,各有优势和特点。任何一个软件的生成都是需要成本的,因为任何软件都是人员开发出来的,需要支付对应的成本,此处不收钱,其他的地方也会收费。无论收费与免费的哪一个好,技术总是没有错的,收费的东西,我们也可以了解,做一个技术储备。

今天要介绍的一款组件有收费的部分和免费的部分,但是这款软件的功能的确比较的强大,使用起来也比较简单,因为要收费的东西,毕竟需要做到人性化,不然谁会出钱去买,毕竟便宜而好用的东西很少。此组件的使用方式很简单,官方提供了比较完备的操作demo,所以今天的文章只做为一个引子。

由于Spire的组件较多,今天就用Spire.PDF for .NET做个引子,不一定收费就没有客户会选择,如果需要稳定的服务支持,收费的组件是可以考虑的,或者遇到土豪客户,也可以在项目中使用一下,毕竟使用起来很便捷。

一.Spire.PDF for .NET组件概述:

Spire.PDF for .NET是一个专业的PDF组件,用于在.NET应用程序中创建,编写,编辑,处理和阅读PDF文件,而不需要任何外部依赖。 使用这个.NET PDF库,您可以实现丰富的功能从头开始创建PDF文件或完全通过C#/ VB.NET处理现有的PDF文档,而无需安装Adobe Acrobat。

 .NET PDF API支持许多丰富的功能,例如安全设置(包括数字签名),PDF文本/附件/图像提取,PDF合并/拆分,元数据更新,段,图像/图像绘制和插入,表创建 以及处理和导入数据等。

此外,Spire.PDF for .NET可以应用于使用C#/ VB.NET以高质量轻松地将文本,图像和HTML转换为PDF。

以下是一个官方给出的组件解析图:

Spire.PDF for .NET支持将HTML,RTF,XPS,文本和图像转换为具有高效性能的PDF文档。 开发人员可以将PDF转换为Word,XPS,SVG,EMF,JPG,PNG,BMP,TIFF,文本格式。 此外,随着Spire.Doc for .NET和Spire.XLS for .NET,开发人员可以将Word(Doc / Docx),Excel(Xls / Xlsx)和XML转换为PDF。

此组件的功能还是非常强大的,每个开发人员都知道,产品做得不好,想要客户的钱还是很难的。看一下组件的主要功能:

1.文本格式,多语言支持,文本对齐等。

2.笔和画笔将形状元素,文本,图像绘制成PDF文档。

3.图层,透明图形,颜色空间和条形码创建可以呈现为PDF文档。

4.PDF / A-1b和PDF / x1a:2001合规性,可以应用这两种标准。

5.添加标量/矢量图像和掩码,并将它们放在指定的位置。

6.Spire.PDF for .NET可支持表和表样式

7.插入交互式元素,包括注释,操作,JavaScript,附件,书签和指定地点和外观。

以上对组件的相关背景做了一个简单的介绍,并且对组件的功能和使用情形做了简单的罗列。

二.Spire.PDF for .NET相关类的解析:

在这里主要介绍Spire的Spire.PDF组件部分,此组件有免费的和收费的两个版本,免费的版本在功能没有收费的多,但是稳定性和实用性还是较高的。我们具体看一下此组件的主要的类和方法,这里是主要介绍PDF的操作,就先看一下有关PDF的操作类和方法。

这里看以下命名空间的主要类:

以上的方法中只是操作PDF部分类,由于包含的类较多,过大的介绍篇幅就显得多余,在对PDF的操作中提供了较多的方法,因此在功能上会较为的丰富,使用起来也较为的便捷。

  1.PdfDocument类:声明PDF文档:

(1).PdfDocument类的构造函数:

public PdfDocument();
  public PdfDocument(string filename);
  public PdfDocument(byte[] bytes);
  public PdfDocument(Stream stream);
  public PdfDocument(string filename, string password);
  public PdfDocument(byte[] bytes, string password);
  public PdfDocument(Stream stream, string password);

该类提供了7个构造函数的重载版本,对应的参数类型就不做详细的介绍

(2).PdfDocument.LoadFromHTML():加载HTML页面:

 public void LoadFromHTML(string Url, bool enableJavaScript, bool enableHyperlinks, bool autoDetectPageBreak)
{
  // This item is obfuscated and can not be translated.
  PdfHtmlLayoutFormat format;
  int num;
  goto Label_001E;
Label_008F:
  num = 0;
Label_0002:
  switch (num)
  {
    case 0:
      break;

    case 1:
      if (!autoDetectPageBreak)
      {
        format.Layout = PdfLayoutType.OnePage;
        format.FitToPage = Clip.Width;
        format.FitToHtml = Clip.Height;
        num = 2;
      }
      else
      {
        num = 3;
      }
      goto Label_0002;

    case 2:
      switch ((1 == 1))
      {
        case 2:
          goto Label_008F;
      }
      if (0 != 0)
      {
      }
      break;

    case 3:
      format.Layout = PdfLayoutType.Paginate;
      format.FitToPage = Clip.Width;
      goto Label_008F;

    default:
      goto Label_001E;
      if (1 != 0)
      {
      }
      format = new PdfHtmlLayoutFormat();
      num = 1;
      goto Label_0002;
  }
  this.Sections.Add().LoadFromHTML(Url, enableJavaScript, enableHyperlinks, format);
}

2.HtmlConverter名称空间:Html转换器。

namespace Spire.Pdf.HtmlConverter
{
  public enum AspectRatio

  public enum Clip

  [ToolboxItem(false)]
  public class HtmlConverter : UserControl, sprᰐ, sprᶪ, sprṳ, sprẝ, sprẏ

  public enum ImageType

  public class PdfHtmlLayoutFormat
}

private Metafile ();
  static HtmlConverter();
  public HtmlConverter();
  public int Authenticate(ref IntPtr phwnd, ref IntPtr pszUsername, ref IntPtr pszPassword);
  public HtmlToPdfResult Convert(string url, ImageType type, int width, int height, AspectRatio aspectRatio);
  public HtmlToPdfResult Convert(string html, string baseurl, ImageType type, int width, int height, AspectRatio aspectRatio);
  public HtmlToPdfResult Convert(string url, ImageType type, int width, int height, AspectRatio aspectRatio, string username, string password);
  public Image ConvertToImage(string url, ImageType type);
  public Image ConvertToImage(Stream stream, Encoding encoding, ImageType type);
  public Image ConvertToImage(string url, ImageType type, int width);
  public Image ConvertToImage(Stream stream, Encoding encoding, ImageType type, int width);
  public Image ConvertToImage(string url, ImageType type, int width, int height);
  public Image ConvertToImage(string url, ImageType type, string username, string password);
  public Image ConvertToImage(Stream stream, Encoding encoding, ImageType type, int width, int height);
  public Image ConvertToImage(string url, ImageType type, int width, int height, AspectRatio aspectRatio);
  public Image ConvertToImage(string url, ImageType type, int width, string username, string password);
  public Image ConvertToImage(Stream stream, Encoding encoding, ImageType type, int width, int height, AspectRatio aspectRatio);
  public Image ConvertToImage(string url, ImageType type, int width, int height, string username, string password);
  public Image ConvertToImage(string url, ImageType type, int width, int height, AspectRatio aspectRatio, string username, string password);
  [DispId(-5512)]
  public int CustomizeDownload();
  protected override void Dispose(bool disposing);
  public Image FromString(string html, ImageType type, int width);
  public Image FromString(string html, string baseUrl, ImageType type);
  public Image FromString(string html, ImageType type, int width, int height);
  public Image FromString(string html, string baseUrl, ImageType type, int width);
  public Image FromString(string html, ImageType type, int width, int height, AspectRatio aspectRatio);
  public Image FromString(string html, string baseUrl, ImageType type, int width, int height);
  public Image FromString(string html, string baseUrl, ImageType type, int width, int height, AspectRatio aspectRatio);
  public Image FromString(string html, string baseUrl, ImageType type, int width, int height, AspectRatio aspectRatio, string username, string password);
  public Image[] GetImagesFromString(string html, string baseUrl, ImageType type);
  public int QueryService(ref Guid guidService, ref Guid riid, out IntPtr ppvObject);int sprẏ.GetSecurityId(string pwszUrl, IntPtr pbSecurityId, ref uint pcbSecurityId, ref uint dwReserved);
  int sprẏ.GetSecuritySite(out IntPtr pSite);
  int sprẏ.GetZoneMappings(uint dwZone, out IEnumString ppenumString, uint dwFlags);
  int sprẏ.MapUrlToZone(string pwszUrl, out uint pdwZone, uint dwFlags);
  int sprẏ.ProcessUrlAction(string pwszUrl, uint dwAction, IntPtr pPolicy, uint cbPolicy, IntPtr pContext, uint cbContext, uint dwFlags, uint dwReserved);
  int sprẏ.QueryCustomPolicy(string pwszUrl, ref Guid guidKey, out IntPtr ppPolicy, out uint pcbPolicy, IntPtr pContext, uint cbContext, uint dwReserved);
  int sprẏ.SetSecuritySite(IntPtr pSite);
  int sprẏ.SetZoneMapping(uint dwZone, string lpszPattern, uint dwFlags);
  int sprᶪ.GetContainer(object ppContainer);
  int sprᶪ.GetMoniker(uint dwAssign, uint dwWhichMoniker, object ppmk);
  int sprᶪ.OnShowWindow(bool fShow);
  int sprᶪ.RequestNewObjectLayout();
  int sprᶪ.SaveObject();
  int sprᶪ.ShowObject();

以上是对PDF操作的相关类和方法的查看,由于此软件为商业软件,只能查看部分对外公开的代码,但是从可以查看到的代码就可以看出其内部实现的复杂度。

三.Spire.PDF for .NET实例:

   由于本文主要讲解HTML页面转换为PDF文档,所以先提供一种GET请求HTML页面,以及一种获取页面图片的操作方法。接着介绍创建PDF文档、Text转化为PDF, XPS转换为PDF,Image转换为PDF等操作方法。

1.创建HTTP的GET请求,获取网页信息:

/// <summary>
    /// 指定路径发送GET请求
    /// </summary>
    /// <param name="getUrl"></param>
    /// <returns></returns>
    public static string HttpGet(string getUrl)
    {
      try
      {
        if (string.IsNullOrEmpty(getUrl))
          throw new ArgumentNullException(getUrl);
        var request = WebRequest.Create(getUrl) as HttpWebRequest;
        if (request == null)
          return null;
        var cookieContainer = new CookieContainer();
        request.CookieContainer = cookieContainer;
        request.AllowAutoRedirect = true;
        request.Method = "GET";
        request.ContentType = "application/x-www-form-urlencoded";
        var response = request.GetResponse() as HttpWebResponse;
        if (response != null)
        {
          var instream = response.GetResponseStream();
          if (instream == null)
            throw new ArgumentNullException("getUrl");
          string content;
          using (var sr = new StreamReader(instream, Encoding.UTF8))
          {
            content = sr.ReadToEnd();
          }
          return content;
        }
      }
      catch (Exception er)
      {
        throw new Exception(er.Message);
      }
      return null;
    }

2.取得HTML中所有图片的 URL:

/// <summary>  
    /// 取得HTML中所有图片的 URL。  
    /// </summary>  
    /// <param name="url">HTML代码</param>
    /// <returns>图片的URL列表</returns> 
    public static string HtmlCodeRequest(string url)
    {
      if (string.IsNullOrEmpty(url))
      {
        throw new ArgumentNullException(url);
      }
      try
      {
        //创建一个请求
        var httprequst = (HttpWebRequest)WebRequest.Create(url);
        //不建立持久性链接
        httprequst.KeepAlive = true;
        //设置请求的方法
        httprequst.Method = "GET";
        //设置标头值
        httprequst.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";
        httprequst.Accept = "*/*";
        httprequst.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");
        httprequst.ServicePoint.Expect100Continue = false;
        httprequst.Timeout = 5000;
        //是否允许302
        httprequst.AllowAutoRedirect = true;
        ServicePointManager.DefaultConnectionLimit = 30;
        //获取响应
        var webRes = (HttpWebResponse)httprequst.GetResponse();
        //获取响应的文本流
        string content;
        using (var stream = webRes.GetResponseStream())
        {
          using (var reader = new StreamReader(stream, Encoding.GetEncoding("utf-8")))
          {
            content = reader.ReadToEnd();
          }
        }
        //取消请求
        httprequst.Abort();
        //返回数据内容
        return content;
      }
      catch (Exception ex)
      {
        throw new Exception(ex.Message);
      }
    }

3.创建PDF文档:

PdfDocument doc = new PdfDocument();

      doc.LoadFromHTML(url, false, true, true);

      doc.Close();

以上没有将操作组装为一个方法,由于创建操作较为简单,所以不做详细介绍,url为网页路径地址。

HtmlConverter.Convert
("http://www.wikipedia.org/","HTMLtoPDF.pdf",
 //enable javascript 
 true,
 //load timeout
* 1000,
//page size
new SizeF(612, 792),
//page margins
new PdfMargins(0, 0));

4.Text转化为PDF:

 public static void TextLayout()
    {
      //Create a pdf document.
      PdfDocument doc = new PdfDocument();

      // Create one page
      PdfPageBase page = doc.Pages.Add();
      float pageWidth = page.Canvas.ClientSize.Width;
      float y = 0;

      //page header
      PdfPen pen1 = new PdfPen(Color.LightGray, 1f);
      PdfBrush brush1 = new PdfSolidBrush(Color.LightGray);
      PdfTrueTypeFont font1 = new PdfTrueTypeFont(new Font("Arial", 8f, FontStyle.Italic));
      PdfStringFormat format1 = new PdfStringFormat(PdfTextAlignment.Right);
      String text = "Demo of Spire.Pdf";
      page.Canvas.DrawString(text, font1, brush1, pageWidth, y, format1);
      SizeF size = font1.MeasureString(text, format1);
      y = y + size.Height + 1;
      page.Canvas.DrawLine(pen1, 0, y, pageWidth, y);

      //title
      y = y + 5;
      PdfBrush brush2 = new PdfSolidBrush(Color.Black);
      PdfTrueTypeFont font2 = new PdfTrueTypeFont(new Font("Arial", 16f, FontStyle.Bold));
      PdfStringFormat format2 = new PdfStringFormat(PdfTextAlignment.Center);
      format2.CharacterSpacing = 1f;
      text = "Summary of Science";
      page.Canvas.DrawString(text, font2, brush2, pageWidth / 2, y, format2);
      size = font2.MeasureString(text, format2);
      y = y + size.Height + 6;

      //icon
      PdfImage image = PdfImage.FromFile(@"..\..\..\..\..\..\Data\Wikipedia_Science.png");
      page.Canvas.DrawImage(image, new PointF(pageWidth - image.PhysicalDimension.Width, y));
      float imageLeftSpace = pageWidth - image.PhysicalDimension.Width - 2;
      float imageBottom = image.PhysicalDimension.Height + y;

      //refenrence content
      PdfTrueTypeFont font3 = new PdfTrueTypeFont(new Font("Arial", 9f));
      PdfStringFormat format3 = new PdfStringFormat();
      format3.ParagraphIndent = font3.Size * 2;
      format3.MeasureTrailingSpaces = true;
      format3.LineSpacing = font3.Size * 1.5f;
      String text1 = "(All text and picture from ";
      String text2 = "Wikipedia";
      String text3 = ", the free encyclopedia)";
      page.Canvas.DrawString(text1, font3, brush2, 0, y, format3);

      size = font3.MeasureString(text1, format3);
      float x1 = size.Width;
      format3.ParagraphIndent = 0;
      PdfTrueTypeFont font4 = new PdfTrueTypeFont(new Font("Arial", 9f, FontStyle.Underline));
      PdfBrush brush3 = PdfBrushes.Blue;
      page.Canvas.DrawString(text2, font4, brush3, x1, y, format3);
      size = font4.MeasureString(text2, format3);
      x1 = x1 + size.Width;

      page.Canvas.DrawString(text3, font3, brush2, x1, y, format3);
      y = y + size.Height;

      //content
      PdfStringFormat format4 = new PdfStringFormat();
      text = System.IO.File.ReadAllText(@"..\..\..\..\..\..\Data\Summary_of_Science.txt");
      PdfTrueTypeFont font5 = new PdfTrueTypeFont(new Font("Arial", 10f));
      format4.LineSpacing = font5.Size * 1.5f;
      PdfStringLayouter textLayouter = new PdfStringLayouter();
      float imageLeftBlockHeight = imageBottom - y;
      PdfStringLayoutResult result
        = textLayouter.Layout(text, font5, format4, new SizeF(imageLeftSpace, imageLeftBlockHeight));
      if (result.ActualSize.Height < imageBottom - y)
      {
        imageLeftBlockHeight = imageLeftBlockHeight + result.LineHeight;
        result = textLayouter.Layout(text, font5, format4, new SizeF(imageLeftSpace, imageLeftBlockHeight));
      }
      foreach (LineInfo line in result.Lines)
      {
        page.Canvas.DrawString(line.Text, font5, brush2, 0, y, format4);
        y = y + result.LineHeight;
      }
      PdfTextWidget textWidget = new PdfTextWidget(result.Remainder, font5, brush2);
      PdfTextLayout textLayout = new PdfTextLayout();
      textLayout.Break = PdfLayoutBreakType.FitPage;
      textLayout.Layout = PdfLayoutType.Paginate;
      RectangleF bounds = new RectangleF(new PointF(0, y), page.Canvas.ClientSize);
      textWidget.StringFormat = format4;
      textWidget.Draw(page, bounds, textLayout);

      //Save pdf file.
      doc.SaveToFile("TextLayout.pdf");
      doc.Close();

      //Launching the Pdf file.
      PDFDocumentViewer("TextLayout.pdf");
    }

5.XPS转换为PDF:

public void XPStoPDF()
    {
      //xps file
      String file = @"..\..\..\..\..\..\Data\Sample4.xps";

      //open xps document
      PdfDocument doc = new PdfDocument();
      doc.LoadFromXPS(file);

      //convert to pdf file.
      doc.SaveToFile("Sample4.pdf");
      doc.Close();

      //Launching the Pdf file.
      PDFDocumentViewer("Sample4.pdf");
    }

 6.Image转换为PDF:

 public void ImageToPdf()
    {
      //Create a pdf document.
      PdfDocument doc = new PdfDocument();

      // Create one page
      PdfPageBase page = doc.Pages.Add();

      //Draw the text
      page.Canvas.DrawString("Hello, World!",
                  new PdfFont(PdfFontFamily.Helvetica, 30f),
                  new PdfSolidBrush(Color.Black),
                  10, 10);
      //Draw the image
      PdfImage image = PdfImage.FromFile(@"..\..\..\..\..\..\Data\SalesReportChart.png");
      float width = image.Width * 0.75f;
      float height = image.Height * 0.75f;
      float x = (page.Canvas.ClientSize.Width - width) / 2;

      page.Canvas.DrawImage(image, x, 60, width, height);

      //Save pdf file.
      doc.SaveToFile("Image.pdf");
      doc.Close();

      //Launching the Pdf file.
      PDFDocumentViewer("Image.pdf");
    }

以上提供了对网站发起HTTP请求,获取网站页面信息,以及采用Spire.PDF组件创建PDF文档。如果有需要可以直接将HTTP请求获取到的信息直接加载如Spire.PDF的组件中,

由组件直接将网页信息转化为PDF文件,在这里就不再做更多的赘述,由于官方提供了很完善的demo和操作文档,在这里就不再过多的介绍使用方法。

四.总结:

 以上介绍了一款收费不开源的组件,没有更多的深入的去介绍,由于组件不开源,无法进行反编译,毕竟存在版权问题,如果需要使用到企业级的文档操作组件,并且公司不缺钱的话,可以使用一下此组件,组件的底层方法封装度较高,所以在使用的时候,开发者所需要考虑的是如何去使用组件完成功能。

   个人认为软件收费应该是趋势,毕竟任何软件都是需要投入,无论是人力成本,还是资金和时间成本。本文虽然是一篇介绍技术的文章,但是也提出了一个所有开发者都在想的问题,在项目开发中到底需不需要使用收费的软件,其实这个就是看使用环境。

点赞(0)

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部