程序员开发实例大全宝库

网站首页 > 编程文章 正文

【教程】Spire.PDF教程:从 PDF 页面的指定区域内提取文本

zazugpt 2024-08-09 12:18:39 编程文章 162 ℃ 0 评论

Spire.PDF是一个专业的PDF组件,能够独立地创建、编写、编辑、操作和阅读PDF文件,支持 .NET、Java、WPF和Silverlight。

有时我们可能需要获取PDF页面中某个区域内的文本而不是全部的文本。本文将介绍如何使用Spire.PDF组件提取PDF页面中指定矩形区域内的文本。

以下是我们所使用的示例文档截图,红色矩形区域是即将提取文本的区域。

代码段:

//创建PdfDocument实例 
PdfDocument pdf = new PdfDocument(); 
//加载PDF文档 
pdf.LoadFromFile("Input.pdf"); 
 
//获取第一页 
PdfPageBase page = pdf.Pages[0]; 
 
//从第一页的指定矩形区域内提取文本 
string text = page.ExtractText(new RectangleF(50, 50, 500, 100) ); 
 
//将文本写入.txt文件 
StringBuilder sb = new StringBuilder(); 
sb.AppendLine(text); 
File.WriteAllText("Extract.txt", sb.ToString()); 

效果图:

查看冰蓝更多产品教程,为你推荐:

Spire.Doc系列教程>>

Spire.XLS系列教程>>

点击“了解更多”,下载产品最新试用版

↓↓↓

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表