Svenska
 Svenska

Kraftfullt .NET OCR API för att utföra textigenkänning

Integrera avancerade OCR-funktioner i dina appar med Aspose Optical Character Recognition API för .NET. Känn igen och extrahera text från PNG-, JPG-, GIF- och BMP-bilder, skannade foton och PDF-filer, eller konvertera bilder eller PDF-filer till text.

Ladda ner gratis provversionVisa alla API:er

.NET OCR-motor med överlägsen hastighet och noggrannhet

Aspose.OCR för .NET är ett avancerat, effektivt och exakt API för optisk teckenigenkänning för att enkelt känna igen text i bilder och PDF-filer. Det hjälper till att utveckla OCR-funktioner för .NET-applikationer och erbjuder förbättrad bearbetningshastighet, noggrannhet och en omfattande uppsättning funktioner. Den kraftfulla .NET OCR-motorn låter dig utföra exakt textigenkänning och extrahering från PDF-filer och JPEG-, GIF-, PNG-, TIFF- och BMP-bilder. Du kan bygga automatiserade lösningar för att konvertera bilder och PDF-dokument till text-, Word-, Excel-, XML- och JSON-format med hjälp av OCR API för .NET.

Utvecklare kan njuta av en plattformsoberoende textextraktionsupplevelse med Aspose.OCR för .NET API, eftersom det kan prestera identiskt i Windows, Mac OS och Linux-baserade miljöer. API:et stöder 27 olika språk i latinska och kyrilliska skrifter och tusentals kinesiska tecken och gör det möjligt att upptäcka och känna igen välkända typsnitt. Dessutom kan du känna igen text från dina skannade foton med den inbyggda förmågan att bearbeta brusiga, sneda eller roterade bilder. Aspose.OCR för .NET-bibliotek är en komplett lösning för bildanalys och textextraktion som kan utöka dina befintliga appar eller hjälpa dig att skapa professionella OCR-lösningar från grunden.

Komma igång

För att korrekt ställa in och använda .NET OCR API, kontrollera nedanstående detaljer. Vi rekommenderar att du hänvisar till listan med förutsättningar på sidan Systemkrav för smidig installation av API:et för optisk teckenigenkänning för .NET.

Aspose.OCR för .NET-installation

Du kan installera OCR-biblioteket för C# .NET genom att ladda ner MSI-installationsprogrammet eller DLL:er från nedladdningssektionen. Eller så kan du använda NuGet-paketet för att ställa in det. Kommandot för Visual Studio-pakethanterarens konsol finns nedan:

PM > Install-Package Aspose.OCR

Utför effektivt OCR på PDF-dokument och konvertera bilder till text

Aspose.OCR för .NET API är ett utmärkt val för att sömlöst utföra optisk teckenigenkänning (OCR) för .NET-utvecklare. Att tillämpa OCR på PDF-dokument och konvertera den igenkända texten till Word-format kräver bara några rader kod. På samma sätt kan du bygga bild till text-konverteringslösningar med hjälp av textigenkänningsbiblioteket för C# .NET.

Känna igen och extrahera text från PDF-dokument i .NET

Optisk teckenigenkänning för skannade PDF-dokument görs enkelt med hjälp av Aspose.OCR för .NET. Det är en av de mest omtyckta funktionerna i .NET PDF-dokument OCR API och utrustar alla som arbetar med API med alla nödvändiga verktyg för att känna igen, extrahera och konvertera text från PDF-dokument till flera format. Låt oss ta en titt på stegen som behövs för att utföra OCR på PDF-dokument och konvertera den extraherade texten från PDF till Word-format:

  • Instantiera klassen AsposeOcr.
  • Skapa ett objekt av klassen DocumentRecognitionSettings.
  • Ange OCR-språk.
  • Anropa metoden RecognizePdf() för att få RecognitionResult. Lägg till filsökväg och DocumentRecognitionSettings-objekt som argument.
  • Spara texten med metoden SaveMultipageDocument(). Lägg till utdatafilens sökväg, SaveFormat- och RecognitionResult-objekten som argument
// This code example demonstrates how to OCR PDF documents and save the recognized text as DOCX.
// Initialize the PCR engine
AsposeOcr recognitionEngine = new AsposeOcr();
// Initialize recognition settings
DocumentRecognitionSettings recognitionSettings = new DocumentRecognitionSettings();
// Specify language for OCR. Multi-language by default
recognitionSettings.Language = Language.Eng;
// Recognize text from PDF
List results = recognitionEngine.RecognizePdf("C:\\MyFiles\\test.pdf", recognitionSettings);
// Save the recognized text as Word (DOCX) file
AsposeOcr.SaveMultipageDocument("C:\\Files\\OCR_result.docx", SaveFormat.Docx, results);

Konvertera enkelt bilder till sökbara PDF-filer i .NET

Det högpresterande .NET OCR API tillåter utvecklare att extrahera sökbar text från skannade bilder och foton av olika vanliga bildformat som GIF, PNG, JPG, BMP och TIFF. Om du vill integrera OCR-funktioner i dina .NET-appar kan funktionen för konvertering av bild till text stärka dem. Här kommer vi att granska de steg som krävs för att effektivt konvertera JPG till PDF med det robusta OCR API för .NET:

  • Ställ in sökväg för indatabildfil för textigenkänning.
  • Skapa en AsposeOcr-klassinstans
  • Använd metoden RecognizeImage för att känna igen text i den valda bildfilen.
  • Spara den bearbetade filen med metoden Spara och lägg till utdatafilens namn och SaveFormat som argument.
  • Se till att ställa in den resulterande filen till ett sökbart PDF-dokument med SaveFormat.
// Set path for input image to recognize
string image = "OCR_test.jpg";
// Initialize AsposeOcr class instance
AsposeOcr api = new AsposeOcr();
// Recognize input image with RecognizeImage method
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());
// Save output to searchable PDF file
result.Save("OCR_output.pdf", SaveFormat.Pdf);

GitHub exempelsidan i Aspose Optical Character Recognition API för . NET innehåller fler fungerande kodexempel, kolla gärna in dem. Vi tillhandahåller även gratis online PDF OCR och bild till textkonverterare, textigenkänning och extrahera appar. Du kan använda dessa gratis OCR-appar i farten med dina mobila enheter.

Lätt att använda .NET OCR-bibliotek för textextraktion i foton

Har du svårt att läsa och extrahera text från skannade bilder? Om ja, använd Aspose.OCR för .NET, eftersom det är det bästa OCR API för bildanalys och textextraktion från skannade foton, smartphonebilder och mer. Med detta API kan du programmatiskt känna igen text i bilder och konvertera den till olika filformat. Dessutom innehåller API:et för konvertering av bild till text avancerade funktioner som stavningskontroll och teckenersättning för visuellt defekta texter. Den kunde enkelt läsa sådana texter, kontrollera stavningen och ersätta eventuella förvrängda tecken från den felstavade texten på bilden. När du kör bild OCR kan du tillhandahålla länken till en bildfil som källa. Det är möjligt att skanna och känna igen text från en hel bild eller endast en utvald del av bilden för denna process. Utveckla skickligt fullfjädrade appar för att konvertera bild till text med hjälp av .NET image OCR API och konvertera enkelt JPEG till text, PNG till text, BMP till text och mer.

FAQ

1. Hur kan jag konvertera bilder till text i .NET?

Att konvertera bilder till text i .NET är snabbt och enkelt med hjälp av .NET OCR API. Endast ett fåtal rader med .NET-kodning behövs för att konvertera JPG, BMP, GIF, PNG, TIFF och andra bildfiler till PDF-, Word-, Excel-, JSON-, vanlig text- och XML-format.

2. Hur lång tid tar det att konvertera bild- eller PDF-filer till text?

Det bästa OCR-API:et för .NET fungerar snabbt och slutför din textigenkänning, extrahering och konverteringsförfrågningar på nolltid.

3. Är det säkert att bearbeta skannade bilder och PDF-filer med .NET API?

Du kan vara säker på säkerheten för dina datafiler medan du bearbetar dem med det optiska teckenigenkännings-API:et för .NET. Vi säkerställer integriteten för dina uppgifter och vidtar alla nödvändiga åtgärder för att ge dig en säker användarupplevelse.

4. Kan jag bearbeta foton och PDF-filer på Mac OS, Windows eller Linux?

Ja, API:et för textigenkänning och bild till textkonvertering för .NET fungerar över olika operativsystem, ramverk och operativsystem. Du kan använda den på den plattform du väljer och den kräver ingen ytterligare programvaruinstallation för att fungera.

Letar du efter hjälp?

Kolla in våra supportkanaler för hjälp med dina frågor relaterade till Aspose-produktens API-funktioner och arbete.