DF](https://docs.fileformat.com/pdf/) tiedostot ovat suosittuja, koska ne tukevat tekstiä, kuvia, animaatioita, videoita ja erilaisia merkintöjä. Kuitenkin monien asiakirjojen, teksti on tärkein osa. Tämä artikkeli selittää, miten muuntaa PDF-tiedostoja TXT-tiedostoja ja päinvastoin, TXT-tiedostoja PDF: lle C# .NET. Tämä muuntaminen on erityisen hyödyllinen, kun sinun täytyy poimia tai keskittyä yksinomaan teksti sisältöä PDF-asiakirjan, kuten kun tekniikan analysointi tai valmistella sisältöä uudelleenmuodostusta.

Tässä oppaassa käsiteltyihin aiheisiin kuuluvat:

Tyyppi : Saatat myös olla kiinnostunut vapaasta Teksti GIF Converter -muunnin Tämä mahdollistaa animoitujen GIF-kuvien luomisen tekstistä.


C# TXT to PDF tai PDF to TXT Converter

Muuntaa PDF ja TXT-muodot on välttämätöntä, kun pääasiallinen kiinnostus on tekstitiedot asiakirjassa. Tarvitsetko poistaa kaikki muotoilu yksinkertaisen tekstin analysointiin tai säilyttää joitakin jäsennelty ulkoasu, prosessi voidaan toteuttaa muutamalla yksinkertaisella askeleella käyttäen Aspose.PDF for .NET Tämä API on monipuolinen ja tukee sekä C#: tä että VB.NET:tä, joten se on helppo integroida .NET-sovelluksiin.

Jos haluat asentaa API:n sovellukseen, voit joko ladata DLL-tiedostot Lataa tai käytä sitä NuGet Asenna se esimerkiksi Package Manager Console -konsolin kautta:

PM> Install-Package Aspose.PDF

Kun API on asennettu, voit aloittaa muuntoprosessin useilla eri tarpeisiin räätälöidyillä lähestymistavoilla.


C# Muunna PDF TXT ilman muotoilua

Joskus tarvitset vain PDF-dokumentin raaka-tekstiä ilman lisäsovellusta.Tämä menetelmä poistaa tekstin juuri sellaisena kuin se näkyy asiakirjassa, säilyttämättä fontteja, välilyöntejä tai tyylejä.Se on erityisen hyödyllinen tekstin analysoinnissa, hakutuloksissa tai kun asettelu on merkityksetöntä.

Raaka-tekstiä koskevat ohjeet

  1. Lataa PDF tiedosto: Käytä API:tä PDF-tiedoston lataamiseen Document-objektiin.
  2. Aloita StringBuilderin rakentaminen: Luo esimerkki siitä, että StringBuilder Tekstiä kerätään tehokkaasti.
  3. Lataa jokainen PDF-sivu: Käännä kaikki sivut asiakirjassa.Kunkin sivun osalta:
  1. Tallenna tulostustekstisi: Kirjoita kerätty teksti TXT-tiedostoon.

Alla oleva koodi kuvaa, miten muuntaa PDF TXT-tiedostoon käyttämällä Raw-uuttomenetelmää:

Lisätiedot

  • Suorituskyky ja yksinkertaisuus: Raakatekstiä on yleensä nopeampaa, koska se ei yritä analysoida tai soveltaa muotoilusääntöjä.
  • Käytä tapauksia: Ihanteellinen lokitiedostojen poistoon, hakutulosten indeksointiin tai skenaarioihin, joissa tarvitaan vain tekstisisältöä.

Muunna PDF TXT-tiedostoon muotoilurutiineilla C#:n tai VB.NET {#section3} avulla

Muissa tilanteissa tekstin muotoilun säilyttäminen (kuten kappaleet, indentit ja sarakkeet) on ratkaisevan tärkeää.Tämä menetelmä soveltaa muotoilurutiineja kuvastaakseen asiakirjan ulkoasua tuloksena olevaan TXT-tiedostoon.

Vaiheet tekstin poistoon muotoilulla

  1. Lataa PDF tiedosto: Lataa PDF-tiedosto hakemuksesi kanssa.
  2. Aloita string muuttujan: Valmista sarake, jolla kerätään muotoiltu tekstiuloste.
  3. Poista teksti muotoilutilan avulla: Jokaisen sivun kohdalla käytä TekstiäTyylit.fi Tämä tila yrittää toistaa alkuperäisen muotoilun mahdollisimman tarkasti.
  4. Tallenna muotoiltu teksti: Tuota kerätty teksti TXT-tiedostoon, joka säilyttää jäsennellyn muotoilun, kuten rivien taukoja, indentteja ja välilyöntejä.

Seuraava koodimerkki osoittaa, miten muuntaa PDF TXT-tiedostoon tekstin muotoilulla C#:lla:

RAW:n ja puhtaan uuttamisen vertailu

Alla oleva kuva tarjoaa visuaalisen vertailu kahden uuttotilan. Vasemmalla PDF-tiedosto näkyy sen alkuperäisen muotoilun (Pure mode), kun taas oikealla näkyy raaka teksti ilman muotoilua.

Convert PDF TXT csharp

Muunna TXT-tiedosto PDF: ksi ohjelmallisesti C#: n tai VB.NET: n avulla

TXT-tiedoston muuntaminen PDF-tiedostoon on hyödyllistä, kun haluat tuottaa kiillotetun asiakirjan yksinkertaisesta tekstisisällöstä.Tämä prosessi sisältää tekstin lukemisen ja PDF-muotoilun soveltamisen luodaksesi asiakirjan, joka on visuaalisesti houkutteleva ja valmis jakeluun.

TXT to PDF -muunnoksen vaiheet

  1. Luo tekstin lukijaksi: Käytä sitä TextReader luokan lukeminen sisältöä TXT-tiedostosta.
  2. Aloita uusi PDF-asiakirja ja lisää tyhjä sivu: Luo esimerkki siitä, että asiakirja Luokkaa ja lisää uusi sivu.
  3. Tekstiviestin asentaminen objektiin: Käytä sitä TextBuilder Rakentaa tekstisäädöksiä halutulla muotoilulla, kuten fontilla, koolla ja värillä.
  4. Lue ja liitä jokainen teksti: Kierrä TXT-tiedoston rivien läpi liittämällä jokainen rivi TextBuilder-objektiin.
  5. Tallenna PDF tulostus: Käytä sitä Document.Save(String) menetelmä lopullisen PDF-tiedoston kirjoittamiseksi levylle.

Alla oleva koodiosio osoittaa, miten muuntaa TXT-tiedosto PDF-dokumenttiin C#: n avulla:

Tarkasteluja, kun muunnetaan TXT PDF

  • Laajennus ja tyyli: Sinun on ehkä säädettävä reunoja, rivien välilyöntiä ja muita tekstin ominaisuuksia, jotta PDF-tiedostosi on muotoiltu ja luettavissa.
  • Virheellinen käytös : Toteuta virhetarkistukset tiedostojen lukemisen ja kirjoittamisen aikana, jotta voit käsitellä skenaarioita, kuten tiedostojen käyttöongelmia tai koodausvirheitä.

Päätelmää

Tässä artikkelissa esitämme tekniikoita PDF-tiedostojen muuntamiseksi TXT- ja TXT-tiedostoiksi PDF: ksi C#: n tai VB.NET: n avulla .NET Frameworkissa. valitsetpa nopeuden ja yksinkertaisuuden vuoksi raaktekstin uuttamisen tai vaaditko muotoiltua tekstiä säilyttääksesi asiakirjan ulkoasun, Aspose.PDF for .NET API tarjoaa luotettavia ja joustavia ratkaisuja.Nämä muuntomenetelmät ovat arvokkaita tietojenkäsittelyssä, asiakirjojen arkistoinnissa ja sisällön uudelleenkäyttöön.

Jos sinulla on kysyttävää tai tarvitset lisäkysymyksiä, ota yhteyttä Ilmainen tukifoorumi tai tarkastella Tuotedokumentti.


Näe myös

More in this category