中文
 中文

强大的 .NET OCR API 执行文本识别

借助 Aspose 光学字符识别 API for .NET 将高级 OCR 功能集成到您的应用程序中。无缝识别和提取 PNG、JPG、GIF 和 BMP 图像、扫描照片和 PDF 中的文本,或将图像或 PDF 转换为文本。

下载免费试用版查看所有API

.NET OCR 引擎具有卓越的速度和准确性

Aspose.OCR for .NET 是一种先进、高效且准确的光学字符识别 API,可轻松识别图像和 PDF 中的文本。它有助于开发 .NET 应用程序的 OCR 功能,并提供增强的处理速度、准确性和全面的功能集。强大的 .NET OCR 引擎可让您从 PDF 文件以及 JPEG、GIF、PNG、TIFF 和 BMP 图像中执行精确的文本识别和提取。您可以借助适用于 .NET 的 OCR API 构建自动化解决方案,将图像和 PDF 文档转换为文本、Word、Excel、XML 和 JSON 格式。

开发人员可以使用 Aspose.OCR for .NET API 享受跨平台文本提取体验,因为它可以在 Windows、Mac OS 和基于 Linux 的环境中执行相同的操作。该 API 支持 27 种不同的拉丁文和西里尔文语言以及数千个汉字,并能够检测和识别知名字体。此外,您还可以通过内置的处理噪声、倾斜或旋转图像的功能来识别扫描照片中的文本。 Aspose.OCR for .NET 库是一个完整的图像分析和文本提取解决方案,可以增强您现有的应用程序或帮助您从头开始创建专业的 OCR 解决方案。

入门

要正确设置和使用 .NET OCR API,请检查下面给出的详细信息。建议您参考系统要求页面上的先决条件列表,以顺利安装.NET 的光学字符识别 API。

Aspose.OCR for .NET 安装

您可以通过从下载部分下载 MSI 安装程序或 DLL 来安装适用于 C# .NET 的 OCR 库。或者,您可以使用 NuGet 包 进行设置。下面提供了 Visual Studio 包管理器控制台的命令:

PM > Install-Package Aspose.OCR

对 PDF 文档高效执行 OCR 并将图像转换为文本

Aspose.OCR for .NET API 是 .NET 开发人员无缝执行光学字符识别 (OCR) 的绝佳选择。将 OCR 应用于 PDF 文档并将识别的文本转换为 Word 格式只需要几行代码。同样,您可以使用 C# .NET 的文本识别库构建图像到文本转换器解决方案。

在 .NET 中识别并提取 PDF 文档中的文本

借助 Aspose.OCR for .NET,扫描 PDF 文档的光学字符识别变得简单。它是 .NET PDF 文档 OCR API 最受欢迎的功能之一,为使用该 API 的任何人提供了识别、提取 PDF 文档文本并将其转换为多种格式所需的所有工具。让我们看一下对 PDF 文档执行 OCR 并将提取的文本从 PDF 转换为 Word 格式所需的步骤:

  • 实例化 AsposeOcr 类。
  • 创建 DocumentRecognitionSettings 类的对象。
  • 指定 OCR 语言。
  • 调用RecognizePdf()方法获取RecognitionResult。添加文件路径和 DocumentRecognitionSettings 对象作为参数。
  • 使用 SaveMultipageDocument() 方法保存文本。添加输出文件路径、SaveFormatRecognitionResult 对象作为参数
// This code example demonstrates how to OCR PDF documents and save the recognized text as DOCX.
// Initialize the PCR engine
AsposeOcr recognitionEngine = new AsposeOcr();
// Initialize recognition settings
DocumentRecognitionSettings recognitionSettings = new DocumentRecognitionSettings();
// Specify language for OCR. Multi-language by default
recognitionSettings.Language = Language.Eng;
// Recognize text from PDF
List results = recognitionEngine.RecognizePdf("C:\\MyFiles\\test.pdf", recognitionSettings);
// Save the recognized text as Word (DOCX) file
AsposeOcr.SaveMultipageDocument("C:\\Files\\OCR_result.docx", SaveFormat.Docx, results);

在 .NET 中轻松将图像转换为可搜索的 PDF

高性能 .NET OCR API 允许开发人员从不同常用图像格式(例如 GIF、PNG、JPG、BMP 和 TIFF)的扫描图像和照片中提取可搜索文本。如果您希望将 OCR 功能集成到 .NET 应用程序中,图像到文本转换功能可以为它们提供支持。在这里,我们将回顾使用强大的 .NET OCR API 将 JPG 有效转换为 PDF 所需的步骤:

  • 设置文本识别的输入图像文件路径。
  • 创建一个 AsposeOcr 类实例
  • 使用RecognizeImage方法识别所选图像文件中的文本。
  • 使用 Save 方法保存处理后的文件,并添加输出文件名和 SaveFormat 作为参数。
  • 确保使用 SaveFormat 将生成的文件设置为可搜索的 PDF 文档。
// Set path for input image to recognize
string image = "OCR_test.jpg";
// Initialize AsposeOcr class instance
AsposeOcr api = new AsposeOcr();
// Recognize input image with RecognizeImage method
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());
// Save output to searchable PDF file
result.Save("OCR_output.pdf", SaveFormat.Pdf);

适用于 . NET 包含更多工作代码示例,请随时查看。我们还提供免费在线 PDF OCR 和图像到文本转换器、文本识别和提取应用程序。您可以使用移动设备即时使用这些免费的 OCR 应用程序。

易于使用的 .NET OCR 库,用于照片中的文本提取

您在阅读扫描图像和提取文本时遇到困难吗?如果是,请使用 Aspose.OCR for .NET,因为它是用于从扫描照片、智能手机图像等中进行图像分析和文本提取的最佳 OCR API。使用此 API,您可以以编程方式识别图像中的文本并将其转换为不同的文件格式。此外,图像到文本转换 API 还包括拼写检查和视觉缺陷文本的字符替换等高级功能。它可以轻松读取此类文本,检查拼写,并替换图像上拼写错误的文本中的任何扭曲字符。运行图像 OCR 时,您可以提供图像文件的链接作为源。在此过程中,可以从完整图像或仅图像的选定部分中扫描和识别文本。使用 .NET 图像 OCR API 熟练开发功能齐全的图像到文本转换器应用程序,并轻松将 JPEG 转换为文本、PNG 转换为文本、BMP 转换为文本等。

常问问题

1. 如何在.NET 中将图像转换为文本?

使用 .NET OCR API 将图像转换为 .NET 中的文本既快速又简单。只需几行 .NET 编码即可将 JPG、BMP、GIF、PNG、TIFF 和其他图像文件转换为 PDF、Word、Excel、JSON、纯文本和 XML 格式。

2. 将图像或PDF文件转换为文本需要多长时间?

适用于 .NET 的最佳 OCR API 运行速度快,可立即完成您的文本识别、提取和转换请求。

3. 使用.NET API 处理扫描图像和PDF 是否安全?

使用 .NET 光学字符识别 API 处理数据文件时,您可以确保数据文件的安全性。我们确保您的数据隐私,并采取一切必要措施为您提供安全的用户体验。

4. 我可以在 Mac OS、Windows 或 Linux 上处理照片和 PDF 文件吗?

是的,.NET 的文本识别和图像到文本转换 API 可跨不同操作系统、框架和操作环境工作。您可以在您选择的平台上使用它,并且不需要安装任何其他软件即可运行。

寻求帮助?

查看我们的支持渠道,以帮助解决与 Aspose 产品 API 功能和工作相关的问题。

准备好开始了吗?

下载免费试用版 查看所有API