Ptimisointi kuvan esikäsittely on kriittinen askel parantamalla tarkkuutta optisen merkin tunnistamisen (OCR) järjestelmät. Tässä opetusohjelmassa, me tutkia, miten parantaa OCR suorituskykyä käyttämällä Aspose.OCR .NET soveltamalla erilaisia kuvan esikäsittely tekniikoita. Nämä tekniikat ovat melun vähentäminen, kontrasti säätö, kirkkauden normalisointi, terävöittäminen, vääristymien havaitseminen ja korjaus, näkökulman korjaus, ja binary. Lopussa tämän oppaan, sinulla on kattava käsitys siitä, miten esikäsittely kuvien tehokkaasti varmistaa optimaalisen OCR tuloksia.

Täydellinen esimerkki

Vaihe 1: Lataa kuva

Ensimmäinen vaihe OCR-kuvan esikäsittelyssä on ladata se sovellukseen. Aspose.OCR:n avulla voit lukea ja käsitellä kuvan tiedostoa.

Vaihe 2: Käytä melun vähentämistä

Melu voi vaikuttaa merkittävästi OCR-tarkkuuteen.Tehdään melun vähentämiseen käytettävät tekniikat, kuten mediaani-suodatus tai Gaussian-tummahäiriö, kuvan puhdistamiseksi ennen jatkokäsittelyä.

// Step 1: Load the Image
using (var ocrEngine = new AsposeOcr())
{
    var image = new Bitmap("path/to/image.png");
}

Vaihe 3: Säädä kontrastia ja kirkkautta

Kontrastin ja kirkkauden säätö auttaa tekemään tekstistä selkeämmän taustasta. Aspose.OCR:n menetelmät parantavat kuvan ominaisuuksia.

// Step 2: Apply Noise Reduction using Median Filtering
ocrEngine.PreprocessingFilter.AddMedianFilter();

Vaihe 4: Sharpen kuva

Terävöittämisen avulla merkkien reunat ovat selkeämpiä, mikä on hyödyllistä OCR-moottoreille. Levitä terävöittämissuodatinta kuvaasi käyttäen Aspose.OCR.

// Step 3: Adjust Contrast and Brightness
var imageProcessing = new ImageProcessing(ocrEngine);
imageProcessing.SetContrast(20); // Adjust contrast level
imageProcessing.SetBrightness(10); // Adjust brightness level

Vaihe 5: Tunnista ja korjaa Skew

Tekstin vääristyminen voi johtaa OCR-järjestelmien väärinkäsitykseen.Tarkista vääristymien havaitseminen ja korjaaminen algoritmeilla, jotta teksti on oikein kohdistettu.

// Step 4: Sharpen the Image
using (var image = Aspose.Ocr.ImageProcessing.Image.Load("input.jpg"))
{
    var sharpenFilter = new SharpenFilter();
    sharpenFilter.Apply(image);
    image.Save("sharpened.jpg");
}

Vaihe 6: Suorita perspektiivin korjaus

Perspektiivin vääristyminen voi aiheuttaa tekstin näyttävän kaarevan tai kaarevan, mikä vaikuttaa OCR-tarkkuuteen.

// Step 5: Detect and Correct Skew
var preprocessingFilter = new PreprocessingFilter(PreprocessingFilterType.SkewCorrection);
ocrEngine.PreprocessingFilters.Add(preprocessingFilter);

Vaihe 7: Binary kuva

Binarisaatio muuntaa kuvan mustavalkoiseksi muodoksi, joka on ihanteellinen OCR-käsittelyyn.

parhaat käytännöt

Yhteenvetona voidaan todeta, että tehokas kuvan esikäsittely on ratkaisevan tärkeää OCR-tehtävien korkean tarkkuuden saavuttamiseksi. Edellä kuvattujen vaiheiden avulla voit parantaa merkittävästi syöttökuvien laatua ja parantaa OCR-järjestelmän suorituskykyä.Muista kokeilla eri esikäsittelytekniikoita löytääksesi paras yhdistelmä erityiseen käyttötapaasi.

Muutama lisäviesti:

  • Testaa aina esikäsittelyputkesi erilaisilla kuvan tyypeillä varmistaaksesi lujuuden.
  • Pidä silmällä yliprosessointia, koska liiallinen teroitus tai kontrastin säätö voi tuoda esineitä, jotka voivat hämmentää OCR-moottoria.
  • Päivitä säännöllisesti .OCR-kirjastoasi uusimpien parannusten ja optimointien hyödyntämiseksi.

Noudattamalla näitä parhaita käytäntöjä sinulla on hyvät valmiudet käsitellä monenlaisia OCR-haasteita ja tuottaa tarkkoja tuloksia sovelluksissasi.

More in this category