Оптимизирането на предварителната обработка на изображението е критичен етап в подобряването на точността на оптичните системи за разпознаване на характера (OCR). В този урок ще разгледаме как да подобрим представянето на OCR с помощта на Aspose.ocR за .NET, като прилагаме различни техники за предварителна обработване. Тези техники включват намаляване от шума, корекция на контраста, нормализиране на яркостта, обостряне, откриване и коригиране на скеи, перспективна коагулация и бинарност. В края на този ръководство ще имате цялостно разбиране за това как ефективно да се предотвратят изображения за осигуряване на оптимални резултати от ОCR.
Пълният пример
Стъпка 1: Изтеглете изображението
Първата стъпка при предварително обработване на изображение за OCR е да го изтеглите в приложението си. Използвайте Aspose.OCR, за да прочетете и обработите файла с изображението.
Стъпка 2: Използвайте намаляване на шума
Използване на техники за намаляване на шума като медиано филтриране или гаузиан блур за почистване на изображението преди по-нататъшна обработка.
// Step 1: Load the Image
using (var ocrEngine = new AsposeOcr())
{
var image = new Bitmap("path/to/image.png");
}
Стъпка 3: Приспособяване на контраст и яркост
Адаптирането на контраста и яркостта помага да се направи текстът по-различен от фона. Използвайте методите на Aspose.OCR, за да подобрите тези свойства на изображението.
// Step 2: Apply Noise Reduction using Median Filtering
ocrEngine.PreprocessingFilter.AddMedianFilter();
Стъпка 4: Покрийте изображението
Оцветяването може да направи ръбовете на знаците по-ясни, което е полезно за двигателите на OCR. Нанесете оцветителния филтър към изображението си с помощта на Aspose.OCR.
// Step 3: Adjust Contrast and Brightness
var imageProcessing = new ImageProcessing(ocrEngine);
imageProcessing.SetContrast(20); // Adjust contrast level
imageProcessing.SetBrightness(10); // Adjust brightness level
Стъпка 5: Открийте и коригирайте Skew
Използването на алгоритми за откриване и корекция на скеу, за да се гарантира, че текстът е правилно хармонизиран.
// Step 4: Sharpen the Image
using (var image = Aspose.Ocr.ImageProcessing.Image.Load("input.jpg"))
{
var sharpenFilter = new SharpenFilter();
sharpenFilter.Apply(image);
image.Save("sharpened.jpg");
}
Стъпка 6: Провеждане на перспективна корекция
Perspective деформация може да направи текста да изглежда закръглено или скъпо, което засяга точността на OCR. Използвайте Aspose.OCR, за да коригирате перспективата на изображението.
// Step 5: Detect and Correct Skew
var preprocessingFilter = new PreprocessingFilter(PreprocessingFilterType.SkewCorrection);
ocrEngine.PreprocessingFilters.Add(preprocessingFilter);
Стъпка 7: Бинарнизиране на изображението
Binarization превръща изображението в черно-бял формат, който е идеален за OCR обработка.
Най-добрите практики
В заключение, ефективното предварително обработване на изображението е от решаващо значение за постигането на висока точност в задачите на OCR. Следвайки стъпките, изброени по-горе, можете значително да подобрите качеството на вашите входни изображения и да повишите производителността на вашата система на ОКР. Не забравяйте да експериментирате с различни техники за предварителна обработка, за да намерите най-добрата комбинация за конкретния ви случай на употреба.
Няколко допълнителни съвета:
- Винаги тествайте предпроцесиращата ви тръба върху различни типове изображения, за да гарантирате издръжливост.
- Внимавайте за прекомерното обработване, тъй като прекомерен обостряне или корекция на контраста може да доведе до артифакти, които могат да объркат OCR двигателя.
- Редовно актуализирайте библиотеката си на Aspose.OCR, за да се възползват от най-новите подобрения и оптимизации.
Като се придържате към тези най-добри практики, ще бъдете добре оборудвани, за да се справят с широк спектър от предизвикателства на OCR и да предоставят точни резултати в вашите приложения.
More in this category
- Критична валидация за възстановяване - предишния превод има проблеми. Внимавайте внимателно: ERRORS (must fix): 1. [LanguageConsistencyValidator] Скрипт смес открити: 2/12 линии (16.7%) съдържат символи от скрипт несъвместим с 'bg'. Примери: Следващата стъпка включва изтегляне на снимката на фактурата към двигателя Aspose.OCR. метод клас OCR, който приема пътя на ал-апсет преди да се запознае с текста от фактура, трябва да се състави настройките на разпознаване като език, група от знаци, и други параметри.
- Автоматизирайте Batch OCR с Aspose.OCR за .NET
- Автоматично въвеждане на данни с Aspose.OCR за .NET
- Автоматично етикетиране на DMS с Aspose.OCR за .NET
- VALIDATION FEEDBACK - Моля, обърнете внимание на следните въпроси: ERRORS (must fix): 1. Frontmatter поле 'seoTitle' открит като 'mk' (увереност 100%), очаквано 'bg'. Преглед: 'OKR .NET: Автоматична обработка на документи' 2. Frontmatter поле 'summary' открит като 'en' (увереност 71%), очаквано 'bg'. Преглед: 'Разберете как да автоматизирате задачите за обработка на документи с помощта на ' SOURCE TEXT: Автоматична обработка на документи с Aspose.OCR .NET