يمكن لمعالجة الوثائق الأوتوماتيكية زيادة كبيرة في الإنتاجية والدقة في مختلف الصناعات، من الخدمات القانونية والمالية إلى الرعاية الصحية والتصنيع. Aspose.OCR for .NET,يتيح هذا الدليل كيفية إعداد واستخدام Aspose.OCR ل .NET لتأليف المهام المعالجة المستندة، بما في ذلك عمليات OCR المجموعة والاندماج مع أنظمة الطرف الثالث.
مثال كامل
فيما يلي مثال كامل (مضيف كقلم) يظهر كيفية استخدام Aspose.OCR لـ .NET لتنفيذ OCR على العديد من الصور في دليل وتخزين النص المستخرج إلى ملفات النص المقابلة. مصدر الحقيقة على الخطوات التي تتبعها.
خطوة بخطوة دليل
الخطوة 1: إطلاق محرك OCR
إنشاء وتكوين محرك OCR. إعداد اللغة المطلوبة (الإنجليزية في هذا المثال).
using Aspose.OCR;
// Step 1: Initialize the OCR Engine
using (AsposeOcr ocrEngine = new AsposeOcr())
{
// Configure language and other settings as needed
}
الخطوة الأولى: تحميل الصور
حدد الدليلات الإدخال / الخروج، وتأكد من وجود مجلد الإدخال، وقم بتصنيف ملفات الصورة.
// Step 2: Load Images for Processing
string inputDirectory = @"path\to\input\images";
string outputDirectory = @"path\to\output\text";
if (!Directory.Exists(outputDirectory))
{
Directory.CreateDirectory(outputDirectory);
}
// Get all files from the input directory (same pattern as the gist)
// TIP: to restrict to specific formats, replace "*.*" with "*.png" or "*.jpg"
string[] imageFiles = Directory.GetFiles(
inputDirectory,
"*.*",
SearchOption.TopDirectoryOnly
);
إعادة التأهيل - يرجى التعامل مع المشاكل التالية: الأخطاء (يجب تصحيحها): 1.مربع الأمامية ‘seoTitle’ تم اكتشافه على أنها ’en’ (ثقة 100٪) ، متوقعة ‘ar’.مشاهدة: ‘Aspose.OCR مع AWS S3: Cloud OCR Tutorial’ المصدر النص: الخطوة 5: أداء OCR على الصور التي تم تحميلها
إتصادف الملفات وتحديد النص باستخدام RecognizeImage(string path).
// Step 3: Perform OCR on Each Image
foreach (string imageFile in imageFiles)
{
try
{
// Recognize text from the image (exactly as in the gist)
string recognizedText = ocrEngine.RecognizeImage(imageFile);
// Proceed to Step 4: save text to disk...
}
catch (Exception ex)
{
Console.WriteLine($"Error processing {imageFile}: {ex.Message}");
}
}
الخطوة 4: حفظ النص المستخرج إلى الملفات
إنشاء مرفق .txt الملفات لكل صورة معالجة.
// Step 4: Save Extracted Text to Files
string outputFilePath = Path.Combine(
outputDirectory,
Path.GetFileNameWithoutExtension(imageFile) + ".txt"
);
File.WriteAllText(outputFilePath, recognizedText);
Console.WriteLine($"Processed: {imageFile} -> {outputFilePath}");
نصائح & Tweaks
- تصفية:* استخدام النماذج مثل
"*.png"أو"*.jpg"إلغاء ملفات غير الصورة. - إعادة التدوير: تغيير
SearchOption.TopDirectoryOnlyإلىSearchOption.AllDirectories. - إزالة النوافذ الفارغة:إذا
string.IsNullOrWhiteSpace(recognizedText),تسجيل الدخول والمواصلة. - الموازين الموازين: الاستخدام
Parallel.ForEach(imageFiles, file => { ... })أسرع من ذلك (أو أسرع من ذلك).
تعلم كيفية تلقائي معالجة مجموعة OCR باستخدام Aspose.OCR ل .NET. تلقائي مستندات الخطوط النارية وتعزيز الإنتاجية مع هذا API OCR القوي.