Автоматичното обработване на документи може значително да увеличи производителността и точността в различни индустрии, от правни и финансови услуги до здравеопазване и производство. Aspose.OCR for .NET,Този ръководство позволява как да се настройва и използва .NET за .NET за изготвяне на документирани задачи за обработка, включително операции на OCR група и интеграция с системи на трети страни.

Пълно пример

По-долу е пълен пример (добавен като печат) показва как да използвате .NET за OCR на няколко изображения в ръководството и да съхранявате извлечения текст в съответните текстови файлове. Източник на истината на стъпките, които следвате.


Крок за крачка доказателство

الخطوة 1: إطلاق محرك OCR

إنشاء وتكوين محرك OCR. إعداد اللغة المطلوبة (الإنجليزية في هذا المثال).

using Aspose.OCR;
// Step 1: Initialize the OCR Engine
using (AsposeOcr ocrEngine = new AsposeOcr())
{
    // Configure language and other settings as needed
}

Първи стъпка: Изтегляне на снимки

Изберете инструкциите за влизане / излизане, уверете се, че има папка за влизане и класиране на файловете на изображението.

// Step 2: Load Images for Processing
string inputDirectory = @"path\to\input\images";
string outputDirectory = @"path\to\output\text";

if (!Directory.Exists(outputDirectory))
{
    Directory.CreateDirectory(outputDirectory);
}

// Get all files from the input directory (same pattern as the gist)
// TIP: to restrict to specific formats, replace "*.*" with "*.png" or "*.jpg"
string[] imageFiles = Directory.GetFiles(
    inputDirectory,
    "*.*",
    SearchOption.TopDirectoryOnly
);

Реабилитация - Моля, справете се с следните проблеми: грешки (необходимо е да ги коригирате): 1.предната кутия “seoTitle” е открита като “en” (уверен 100%), очаквана “ar”.Погледнете: “Aspose.OCR с AWS S3: Cloud OCR Tutorial” източник текст: стъпка 5: изпълнение на OCR на изтеглените изображения

Изберете файлове и изберете текст, като използвате RecognizeImage(string path).

// Step 3: Perform OCR on Each Image
foreach (string imageFile in imageFiles)
{
    try
    {
        // Recognize text from the image (exactly as in the gist)
        string recognizedText = ocrEngine.RecognizeImage(imageFile);

        // Proceed to Step 4: save text to disk...
    }
    catch (Exception ex)
    {
        Console.WriteLine($"Error processing {imageFile}: {ex.Message}");
    }
}

Стъпка 4: Съхраняване на извлечения текст в файлове

Създаване на обект .txt Снимки за всяка снимка.

// Step 4: Save Extracted Text to Files
string outputFilePath = Path.Combine(
    outputDirectory,
    Path.GetFileNameWithoutExtension(imageFile) + ".txt"
);

File.WriteAllText(outputFilePath, recognizedText);

Console.WriteLine($"Processed: {imageFile} -> {outputFilePath}");

Съвети и Tweaks

  • Филтриране:* Използване на модели като "*.png" или "*.jpg" Изтриване на файлове, които не са изобразени.
  • Рециклиране:• Промяна SearchOption.TopDirectoryOnly към SearchOption.AllDirectories.
  • Изтриване на празни прозорци:Ако string.IsNullOrWhiteSpace(recognizedText),Регистрация на влизане и продължаване.
  • Балансът на баланса:• Използване Parallel.ForEach(imageFiles, file => { ... }) По-бързо от това (или по-бързо от това).

Научете как да обработвате автоматично OCR набор с помощта на .NET. автоматични документи за огънни линии и повишаване на производителността с тази мощна OCR API.

More in this category