Vietnamese
 Vietnamese

API .NET OCR mạnh mẽ để thực hiện nhận dạng văn bản

Tích hợp các chức năng OCR nâng cao vào ứng dụng của bạn với API nhận dạng ký tự quang học Aspose dành cho .NET. Dễ dàng nhận dạng và trích xuất văn bản từ hình ảnh PNG, JPG, GIF và BMP, ảnh được quét và PDF hoặc chuyển đổi hình ảnh hoặc PDF thành văn bản.

Tải xuống bản dùng thử miễn phíXem tất cả các API

Công cụ .NET OCR với tốc độ và độ chính xác vượt trội

Aspose.OCR dành cho .NET là API nhận dạng ký tự quang học tiên tiến, hiệu quả và chính xác để dễ dàng nhận dạng văn bản trong hình ảnh và PDF. Nó giúp phát triển chức năng OCR cho các ứng dụng .NET và cung cấp tốc độ xử lý nâng cao, độ chính xác và bộ tính năng toàn diện. Công cụ .NET OCR mạnh mẽ cho phép bạn thực hiện nhận dạng và trích xuất văn bản chính xác từ các tệp PDF và hình ảnh JPEG, GIF, PNG, TIFF và BMP. Bạn có thể xây dựng các giải pháp tự động để chuyển đổi hình ảnh và tài liệu PDF sang định dạng văn bản, Word, Excel, XML và JSON với sự trợ giúp của API OCR dành cho .NET.

Các nhà phát triển có thể tận hưởng trải nghiệm trích xuất văn bản đa nền tảng bằng API Aspose.OCR cho .NET, vì nó có thể hoạt động giống hệt nhau trên các môi trường dựa trên Windows, Mac OS và Linux. API hỗ trợ 27 ngôn ngữ khác nhau bằng chữ Latinh và Cyrillic cũng như hàng nghìn ký tự tiếng Trung, đồng thời cho phép phát hiện và nhận dạng các kiểu chữ nổi tiếng. Ngoài ra, bạn có thể nhận dạng văn bản từ ảnh quét của mình với khả năng tích hợp sẵn để xử lý ảnh bị nhiễu, bị lệch hoặc bị xoay. Thư viện Aspose.OCR cho .NET là một giải pháp trích xuất văn bản và phân tích hình ảnh hoàn chỉnh có thể bổ sung cho các ứng dụng hiện có của bạn hoặc giúp bạn tạo các giải pháp OCR chuyên nghiệp ngay từ đầu.

Bắt đầu

Để thiết lập và sử dụng đúng .NET OCR API, vui lòng kiểm tra các chi tiết được cung cấp bên dưới. Bạn nên tham khảo danh sách các điều kiện tiên quyết trên trang Yêu cầu hệ thống để cài đặt suôn sẻ API nhận dạng ký tự quang học cho .NET.

Aspose.OCR để cài đặt .NET

Bạn có thể cài đặt thư viện OCR cho C# .NET bằng cách tải xuống trình cài đặt MSI hoặc tệp DLL từ phần tải xuống. Hoặc bạn có thể sử dụng gói NuGet để thiết lập. Lệnh dành cho bảng điều khiển trình quản lý gói Visual Studio được cung cấp bên dưới:

PM > Install-Package Aspose.OCR

Thực hiện hiệu quả OCR trên tài liệu PDF và chuyển đổi hình ảnh thành văn bản

Aspose.OCR cho .NET API là một lựa chọn tuyệt vời để thực hiện liền mạch nhận dạng ký tự quang học (OCR) cho các nhà phát triển .NET. Áp dụng OCR cho tài liệu PDF và chuyển đổi văn bản được nhận dạng sang định dạng Word chỉ cần một vài dòng mã. Tương tự, bạn có thể xây dựng các giải pháp chuyển đổi hình ảnh thành văn bản bằng cách sử dụng thư viện nhận dạng văn bản cho C# .NET.

Nhận dạng và trích xuất văn bản từ tài liệu PDF trong .NET

Nhận dạng ký tự quang học cho các tài liệu PDF được quét được thực hiện đơn giản với sự trợ giúp của Aspose.OCR dành cho .NET. Đây là một trong những tính năng được yêu thích nhất của API OCR tài liệu PDF .NET và trang bị cho bất kỳ ai làm việc với API này tất cả các công cụ cần thiết để nhận dạng, trích xuất và chuyển đổi văn bản từ tài liệu PDF sang nhiều định dạng. Hãy cùng xem các bước cần thiết để thực hiện OCR trên tài liệu PDF và chuyển đổi văn bản trích xuất từ định dạng PDF sang Word:

  • Khởi tạo lớp AsposeOcr.
  • Tạo một đối tượng của lớp DocumentRecognitionSettings.
  • Chỉ định ngôn ngữ OCR.
  • Gọi phương thức RecognizePdf() để nhận RecognitionResult. Thêm đường dẫn tệp và đối tượng DocumentRecognitionSettings làm đối số.
  • Lưu văn bản bằng phương thức SaveMultipageDocument(). Thêm đường dẫn tệp đầu ra, các đối tượng SaveFormatRecognitionResult làm đối số
// This code example demonstrates how to OCR PDF documents and save the recognized text as DOCX.
// Initialize the PCR engine
AsposeOcr recognitionEngine = new AsposeOcr();
// Initialize recognition settings
DocumentRecognitionSettings recognitionSettings = new DocumentRecognitionSettings();
// Specify language for OCR. Multi-language by default
recognitionSettings.Language = Language.Eng;
// Recognize text from PDF
List results = recognitionEngine.RecognizePdf("C:\\MyFiles\\test.pdf", recognitionSettings);
// Save the recognized text as Word (DOCX) file
AsposeOcr.SaveMultipageDocument("C:\\Files\\OCR_result.docx", SaveFormat.Docx, results);

Dễ dàng chuyển đổi hình ảnh thành tệp PDF có thể tìm kiếm trong .NET

API .NET OCR hiệu suất cao cho phép nhà phát triển trích xuất văn bản có thể tìm kiếm được từ hình ảnh được quét và ảnh ở các định dạng hình ảnh thường được sử dụng khác nhau như GIF, PNG, JPG, BMP và TIFF. Nếu bạn đang muốn tích hợp các khả năng OCR vào các ứng dụng .NET của mình, thì tính năng chuyển đổi hình ảnh thành văn bản có thể hỗ trợ chúng. Tại đây, chúng tôi sẽ xem xét các bước cần thiết để chuyển đổi JPG sang PDF một cách hiệu quả bằng cách sử dụng API OCR mạnh mẽ dành cho .NET:

  • Đặt đường dẫn tệp hình ảnh đầu vào để nhận dạng văn bản.
  • Tạo một phiên bản lớp AsposeOcr
  • Sử dụng phương pháp RecognizeImage để nhận dạng văn bản trong tệp hình ảnh đã chọn của bạn.
  • Lưu tệp đã xử lý bằng phương thức Save và thêm tên tệp đầu ra cũng như SaveFormat làm đối số.
  • Đảm bảo đặt tệp kết quả thành tài liệu PDF có thể tìm kiếm bằng cách sử dụng SaveFormat.
// Set path for input image to recognize
string image = "OCR_test.jpg";
// Initialize AsposeOcr class instance
AsposeOcr api = new AsposeOcr();
// Recognize input image with RecognizeImage method
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());
// Save output to searchable PDF file
result.Save("OCR_output.pdf", SaveFormat.Pdf);

trang ví dụ GitHub của API nhận dạng ký tự quang học Aspose cho . NET bao gồm nhiều mẫu mã hoạt động hơn, vui lòng kiểm tra chúng. Chúng tôi cũng cung cấp Trình chuyển đổi hình ảnh thành văn bản và PDF OCR trực tuyến miễn phí, ứng dụng nhận dạng văn bản và trích xuất. Bạn có thể sử dụng các ứng dụng OCR miễn phí này một cách nhanh chóng bằng các thiết bị di động của mình.

Thư viện .NET OCR dễ sử dụng để trích xuất văn bản trong ảnh

Bạn gặp khó khăn trong việc đọc và trích xuất văn bản từ hình ảnh được quét? Nếu có, hãy sử dụng Aspose.OCR cho .NET, vì đây là API OCR tốt nhất để phân tích hình ảnh và trích xuất văn bản từ ảnh được quét, hình ảnh trên điện thoại thông minh, v.v. Sử dụng API này, bạn có thể lập trình nhận dạng văn bản trong hình ảnh và chuyển đổi văn bản đó sang các định dạng tệp khác nhau. Hơn nữa, API chuyển đổi hình ảnh thành văn bản bao gồm các chức năng nâng cao như kiểm tra chính tả và thay thế ký tự cho các văn bản bị lỗi trực quan. Nó có thể dễ dàng đọc những văn bản như vậy, kiểm tra chính tả và thay thế bất kỳ ký tự bị bóp méo nào từ văn bản sai chính tả trên hình ảnh. Trong khi chạy OCR hình ảnh, bạn có thể cung cấp liên kết tới tệp hình ảnh làm nguồn. Có thể quét và nhận dạng văn bản từ một hình ảnh hoàn chỉnh hoặc chỉ một phần được chọn của hình ảnh cho quá trình này. Phát triển thành thạo các ứng dụng chuyển đổi hình ảnh thành văn bản đầy đủ tính năng bằng API OCR hình ảnh .NET và dễ dàng chuyển đổi JPEG thành văn bản, PNG thành văn bản, BMP thành văn bản, v.v.

Câu hỏi thường gặp

1. Làm cách nào để chuyển đổi hình ảnh thành văn bản trong .NET?

Chuyển đổi hình ảnh thành văn bản trong .NET nhanh chóng và dễ dàng bằng API .NET OCR. Chỉ cần một vài dòng mã hóa .NET để chuyển đổi các tệp JPG, BMP, GIF, PNG, TIFF và các tệp hình ảnh khác sang các định dạng PDF, Word, Excel, JSON, Văn bản thuần túy và XML.

2. Mất bao lâu để chuyển đổi các tệp hình ảnh hoặc PDF thành văn bản?

API OCR tốt nhất cho .NET hoạt động nhanh và hoàn thành các yêu cầu nhận dạng, trích xuất và chuyển đổi văn bản của bạn ngay lập tức.

3. Xử lý hình ảnh và tệp PDF được quét bằng .NET API có an toàn không?

Bạn có thể chắc chắn về tính bảo mật của các tệp dữ liệu của mình trong khi xử lý chúng bằng cách sử dụng API nhận dạng ký tự quang học cho .NET. Chúng tôi đảm bảo quyền riêng tư cho dữ liệu của bạn và thực hiện tất cả các biện pháp cần thiết để cung cấp cho bạn trải nghiệm người dùng an toàn.

4. Tôi có thể xử lý ảnh và tệp PDF trên Mac OS, Windows hoặc Linux không?

Có, API chuyển đổi văn bản và hình ảnh thành văn bản cho .NET hoạt động trên các hệ điều hành, khung và môi trường điều hành khác nhau. Bạn có thể sử dụng nó trên nền tảng mà bạn chọn và nó không yêu cầu bất kỳ cài đặt phần mềm bổ sung nào để hoạt động.

Tim sự giup đơ?

Kiểm tra các kênh hỗ trợ của chúng tôi để được trợ giúp về các câu hỏi của bạn liên quan đến các tính năng và hoạt động của API sản phẩm Aspose.