{< figure align=center src=“صور/ocr-pdf-and-extract-text-from-pdf-in-csharp.png” >}}
وثائق PDF ضرورية في العديد من العمليات التجارية، وغالبا ما تتطلب الوصول البرمجي إلى المحتوى المسح الضوئي. استخراج النص من ملفات PDF المسح يمكن أن يكون تحديا، مع التأكيد على الحاجة إلى أدوات فعالة. كيفية إزالة وثائق PDF و استخراج النص من PDF في C# واستخدام الموثوقة Aspose.OCR for .NET API أولاً: إدخال C#، وهو الرائد C# OCR مكتبة استخراج PDF متاحة للتقييم المجاني.
ماذا ستتعلم
في هذه المقالة سوف نغطي الموضوعات التالية:
- نظرة عامة على Aspose.OCR لـ .NET API
- خطوات إلى OCR PDF و استخراج النص
- كيفية تنفيذ OCR على PDF و حفظ النص
- تحويل OCR PDF إلى Word
- تحويل OCR PDF إلى JSON
نظرة عامة على Aspose.OCR لـ .NET API
سوف نستخدمها Aspose.OCR for .NET API إدخال نموذج c# ، قوي .NET PDF OCR API تم تصميمها لتعرف النص من الصور المسجلة، والصور الذكية، وصور الشاشة، وإرجاع النتائج في تنسيقات الوثيقة المختلفة.هذه API لا تحول فقط الصور إلى النص ولكن أيضا يخلق PDFs قابلة للبحث من المسح وتصحيح أي أخطاء التصوير في النص المعترف به، مما يجعلها واحدة من أسرع C# PDF حلول OCR متوفر فقط 99 دولار.
ويحتوي النار على AsposeOcr فئة، التي توفر عدة أساليب لعمليات OCR. RecognizePdf(string, DocumentRecognitionSettings) طريقة هي ضرورية لاستخراج النص من وثيقة PDF المحددة. DocumentRecognitionSettings تتيح الفئة تخصيص عملية التعرف ، بينما RecognitionResult ففي هذه الفئة يتم إدراج نتائج الاعتراف.
يمكنك تحميل DLL من API أو تثبيته من خلال NuGet:
PM> Install-Package Aspose.OCR
خطوات إلى OCR PDF و استخراج النص في C# {#خطوات إلى-ocr-pdf-and-extract-text-in-c}
لتنفيذ OCR على وثائق PDF ocr pdf c# واستخراج النص المعترف به، اتبع هذه الخطوات:
- وخلق مثال من AsposeOcr فئة C# OCR pdf.
- إطلاق موضوع من DocumentRecognitionSettings فئة C# pdf ocr.
- تحديد لغة OCR.
- احصل على RecognitionResult من خلال استدعاء RecognizePdf() طريقة، عبر مسار الصورة و DocumentRecognitionSettings الموضوع .
- يمر عبر RecognitionResult قائمة لتظهر النص المحدد.
وهنا مثال يُظهر كيفية إخراج أوكرو PDF وثائق ونص المعترف به في C#:

كيفية تنفيذ OCR على PDF و حفظ النص في C#
لتنفيذ OCR على مستندات PDF وتخزين النص المعترف به، اتبع هذه الخطوات:
- وخلق مثال من AsposeOcr فئة.
- إطلاق موضوع من DocumentRecognitionSettings فئة.
- تحديد لغة OCR.
- اتصل بـ RecognizePdf() طريقة الحصول على RecognitionResult.
- حفظ النص باستخدام SaveMultipageDocument() الطريقة، والتي تتطلب مسار ملف الإخراج، و SaveFormat,، و هو RecognitionResult موضوع .
وهنا مثال على إظهار كيفية إدخال مستندات OCR PDF وتخزين النص المعترف به في C#:

تحويل OCR PDF إلى Word في C#
لتحويل مستندات PDF المسح الضوئي إلى Word، اتبع نفس الخطوات كما ذكرنا سابقا، ولكن تحديد أرشيف الوسم : Docx في الخطوة الأخيرة.
وهنا مثال يظهر كيفية إدراج PDF في OCR وتخزين النص المعترف به كوثيقة Word في C#:

تحويل OCR PDF إلى JSON في C#
للحفاظ على النص المعترف به من مستندات PDF في ملف JSON، اتبع الخطوات السابقة مع التغيير الوحيد الذي يجب تحديده أرشيف الوسم : json في الخطوة الأخيرة.
وهنا مثال على إظهار كيفية إرسال PDF إلى OCR وتخزين النص المعترف به كملف JSON في C#:
احصل على ترخيص تقييم مجاني
يمكنك الحصول على ترخيص مؤقت مجاني لتقييم Aspose.OCR لـ .NET API دون أي قيود.
استنتاجات
في هذا الدليل، تعلمنا كيفية تنفيذ OCR على مستندات PDF واستخراج النص من PDF في C#. TXT, DOCX,و و JSON لمزيد من المعلومات على Aspose.OCR لـ .NET API، انظر الوثائق.إذا كان لديك أي أسئلة، والقلق حر للوصول إلينا على المنتدى.
انظر أيضا
- تحويل صورة الشاشة إلى نص مع OCR إلى C#
- تصحيح الصورة إلى النص و التصحيح في C#
- تحويل PDF المسح الضوئي إلى PDF قابل للبحث مع OCR في C#
من خلال إخراج Aspose.OCR for .NET API,يمكنك تنفيذ دقة عالية PDF OCR في C# لمختلف التطبيقات، بما في ذلك C# حساب OCR - المعالجة والطريقة المعالجة.هذا حل .NET PDF OCR مثالية للمطورين الذين يرغبون في التكامل OCR PDF وتتميز بقدراتها في التطبيق بشكل فعال، مع مكتبة C# لـ PDF OCR و استخراج النص,يمكنك ضمان نتائج دقيقة في مشاريعك.
وبالإضافة إلى ذلك، إذا كنت بحاجة إلى تحويل PDF إلى نص في C#,هذا التخطيط يقدم حلًا بسيطًا.للذين يهتمون C# OCR PDF إلى النص القدرات، والاندماج هو خالية من الرموز، مما يسمح لاستخراج النص بكفاءة من تنسيقات الوثيقة المختلفة. C# تحويل PDF إلى نص وظائف لتعامل بسهولة استخراج النص من PDFs، مما يجعل عملية التطوير الخاص بك أكثر سلاسة.
إذا كنت تبحث عن Aspose OCR C# مثال, هذا الدليل يخدم كمصدر شامل. وعلاوة على ذلك, لمهام مثيرة مثل C# OCR API استخدام، هذا الدليل يغطي جميع العناصر الأساسية اللازمة لبدء فعالة. استخراج النص من PDF باستخدام C#,، فإن قدرات API Aspose OCR ستعزز تدفقات العمل بشكل كبير.
من يبحث عن تقييم برنامج PDF SDK وشركة معالجة المستندات Aspose على OCR PDF SDK,هذا الدليل يخدم كنقطة انطلاق ممتازة لفهم قدراته. C# OCR DLL من أجل التكامل أو C# OCR التعليمات من أجل التوجيه ، ستجد كل ما تحتاجه لاستخدام API بشكل فعال في مشاريعك.
وبالإضافة إلى ذلك، إذا كنت ترغب في التخلص من C# التعرف على النص أو استخدمها مكتبة C# OCR بالنسبة لمختلف التطبيقات، يمكنك استكشاف الميزات التي تقدمها Aspose لدعم هذه الميزات. C# OCR PDF SDK تقييم هذه فرصة رائعة للتجربة مع قدرات هذه المكتبة، وضمان العثور على الحلول المناسبة لاحتياجات OCR الخاصة بك.
وأخيرًا، إذا كنت بحاجة إلى استخراج النص من PDF في C#,أو استخدم واحد OCR API C#,وَالْمَعْنَى C# OCR PDF تتيح الميزات المتاحة تسريع عملية التطوير الخاصة بك وتحسين وظائف التطبيق الخاص بك. مكتبة C# OCR في مختلف المهام التي يقوم بها OCR، بما في ذلك C# التعرف على النص من الصورة و C# OCR نموذج - تطوير المشاريع الخاصة بك لتعزيز المزيد.