葡萄城控件旗下网站葡萄城控件旗下网站

LEADTOOLS PDF SDK

PDF

LEADTOOLS包括综合的PDF读、写和查看技术,它具有以下高级功能,例如支持文本、超链接、书签和元文件的提取以及从现有的PDF文档中更新、分割和合并页面。结合LEADTOOLS高级光栅和图像显示技术,开发者可以利用这些属性,使用动态文档的查看编辑和其他组合特征增强他们的应用程序。此外,程序员可使用LEADTOOLS实现先进的OCR文字识别、ICR、OMR、表单识别、虚拟打印和扫描技术,创建使用PDF格式的、任何类型的文档和医学影像应用程序。

测试了成千上万的PDF文档,LEADTOOLS PDF SDK表现出无可挑剔的准确性,超越了许多市场领先的PDF读取应用程序。

LEADTOOLS对常见错误和PDF文件版本的不同之处做出了解释,给予了程序员内心的平静,最小化了他们的测试阶段,帮助他们开发市场上最好的PDF应用程序。

LEADTOOLS PDF SDK技术概述

PDF文档功能

  • 加载和查看任何PDF文件
  • 提取具有位置和大小的文本(字符、文字和线)、字体、图像、注释、长方形和超链接
  • 全面支持本地PDF注释的读、写和编辑
  • 全面的Unicode支持,包括中文、日语、阿拉伯语和希伯来语
  • 通过读取PDF书签(目录)和内部链接(跳跃)解析文档结构
  • 生成任何页面的光栅图像或缩略图

PDF文件功能

  • 综合的多页面支持包括
    • 将已有的PDF文件合并为一个单独的PDF文件
    • 将一个PDF文件分割成多个PDF文件
    • 提取、删除、插入或替换已有PDF文件中的任何一页
  • 读取和更新已有PDF文件的目录(TOC)
  • 将已有的任意PDF转为PDF/A
  • 线性化(优化网页查看)任何已有的PDF文件
  • 加密/解密文件,并实现任意PDF版本间的互相转换
  • 读、写和更新所有PDF元数据,如作者、标题、主题和关键字
  • 读、写和更新PDF文档的目录
  • 为了电子书、屏幕和印前的优化,转换(提取)附言为PDF格式

PDF注释和标注

LEADTOOLS支持本地PDF注释和标注的读、显示、编辑和写,它可以和Adobe Acrobat以及其他兼容的PDF阅读器无缝工作。注释是文档图像中非常重要的一个功能,它允许用户在文档的顶部通过编写注释和绘制形状进行交流,且不会永久性的改变文档。

  • 所有PDF注释和标注支持的对象
    • 注释
    • 高亮
    • 文本
    • 箭头
    • 线
    • 审查
    • 形状
  • 在PDF注释和及时编辑的LEADTOOLS注释间进行转换
  • 当以支持“无显示流式注释”的光栅加载PDF时,有控制注释绘制的选项
  • 附有源代码的完整功能的示例应用程序,可实现所有PDF的读、写、编辑和注释功能

OCR文字识别 PDF输出

LEADTOOLS允许开发者轻松地将任何图像转化为可搜索的文本PDF。可搜索的PDF文件的大小通常比类似的光栅图像小,嵌入的文字像在一个文字处理器中一样,可以被搜索、索引和编辑。

  • 运用LEADTOOLS SDK OCR文字识别技术只用三行代码,即可将图像转换为可搜索的文本PDF文件
  • 只导出文本或图像上的文本,以保留原始格式
  • 多种PDF版本包括1.2-1.7和PDF/A
  • PDF中图像的多重压缩选项,包括:
    • JPEG
    • JPEG2000
    • LZW
    • CCITT G3/G4
    • JBIG2
    • MRC
  • 转换整个文件或指定的页面
  • 从磁盘、内存、网络或SharePoint中转换图像
  • 预处理图像提高可读性、压缩和识别
  • 创建和更新PDF文档元数据,例如作者、标题和关键字
  • 使用RC4 40位和RC4 128位加密技术加密的PDF文档,可保护敏感数据
  • 使用用户和所有者密码控制PDF文件的访问
  • 在PDF文件中嵌入字体选项
  • 为更快速的网页浏览创建线性化PDF文件选项

光栅图像PDF功能

除了控制基于文本的PDF文件,LEADTOOLS全面支持光栅图像PDF的加载、保存和编辑。包括将任何文本或基于图像的PDF光栅化为缩略图或全尺寸的文档图片,将单页和多页的图像格式(如JPEG和TIFF)转换为基于图像的PDF文件。

  • 在任何PDF文件盒150余种支持的光栅图像格式间进行转换
  • 多种PDF版本包括1.2-1.7和PDF/A
  • 指定RGB或CMYK颜色空间
  • 多重压缩选项包括:
    • JPEG
    • LZW
    • CCITT G3/G4
    • JBIG2
    • MRC
  • 使用RC4 40位和RC4 128位加密技术加密和解密PDF文档
  • 使用用户和所有者密码控制PDF文件的访问
  • 处理整个PDF文件或特定的页面组
  • 从磁盘、内存、网络或SharePoint中加载PDF

PDF光栅化选项

PDF到图像转换的核心是光栅化过程。从本质上来讲,PDF文档由矢量对象组成,例如文本和二维图像。这些对象在物理和印刷尺寸上有一个相对的位置。这意味着PDF是动态文档,在保留高质量显示的基础上可被光栅化为任何像素尺寸。在光栅化PDF文件时LEADTOOLS提供了最大的灵活性,允许开发者控制质量、大小、颜色及更多。

  • 在任何DPI上加载,控制整体的质量和文件大小
  • 以每个像素1、8或24位加载
  • 以2和4位抗锯齿绘制字体,使得图像更有可读性
  • 以2和4位抗锯齿重新调节嵌入的图像,以保留原始图像质量并减少颗粒度
  • 通过检查PDF中的内容,自动检测最好的光栅化选项

PDF压缩

使用LEADTOOLS高级图像分割和压缩技术最大化PDF压缩时保证了质量。压缩过的PDF可在支持标准PDF文件的任何PDF查看器中加载和查看。通过存储复杂混合光栅(MRC)的内容,可创建比标准光栅PDF文件具有更好压缩和质量的PDF文件。

  • 运用优化选项自动分割图像
  • 手动分割图像以便充分控制文件大小和图像质量优化
  • 可自动或手动的选择不同段类型的压缩
  • 多重压缩选项包括:
    • ZIP
    • LZW
    • CCITT G3 /G4
    • JBIG2
    • JPEG
  • 自动背景检测
  • 压缩单页或多页PDF文件
  • 压缩PDF文件的本地32和64位二进制文件
  • 添加PDF压缩到单线程或多线程的应用程序

PDF文件类型的解释

通常情况下,PDF和PDF/A文件可被分为两种基本类型:光栅图像可搜索的文本。光栅图像PDF由一个PDF包装器中的一个完整的光栅图像组成,且支持多重压缩类型包括JPEG,CCITT G3/G4,JBIG2和LZW。光栅图像PDF的最大优点是它们看上去和原文档是一样的。另一方面,可搜索的PDF文件的大小通常更小,文本像在一个文字处理器中一样,可被搜索和编辑。

当将光栅图像转换为可搜索的基于文本的PDF时,原图像的格式经常会被修改。为了缓解这个问题,LEAD实现了一种混合的PDF类型,称为“文本上的图像”。在文本上图像的PDF中,文本会像往常一样被格式化,但是原光栅图像覆盖在文本的顶端。这样不仅保留了原光栅图像的外观,同时允许文本内容被搜索、选择、复制和粘贴。

其他的和PDF相关的LEADTOOLS SDK技术

平台和编程接口

葡萄城成立于1980年,是全球最大的控件提供商,世界领先的企业应用定制工具、企业报表和商业智能解决方案提供商,为超过75%的全球财富500强企业提供服务。葡萄城于1988年在中国设立研发中心,在全球化产品的研发过程中,不断适应中国市场的本地需求,并为软件企业和各行业的信息化提供优秀的软件工具和咨询服务。

邮箱: leadtools.xa@grapecity.com | 电话: 029-88331988-244 | 微博: 葡萄城控件官方微博葡萄城控件

©2017 西安葡萄城