Hvordan installerer NLTK?

Følgende artikkel Install NLTK gir en oversikt for installasjon av NLTK. NLTK er et sett med biblioteker for naturlig språkbehandling. Det er en plattform for å bygge Python-programmer for å behandle naturlig språk. NLTK er skrevet på Python programmeringsspråk. Den ble utviklet av Steven Bird og Edward Loper. Den støtter forskning og undervisning i NLP eller nært beslektede områder, inkludert kognitiv vitenskap, empirisk lingvistikk, informasjonsinnhenting, kunstig intelligens og maskinlæring. NLTK gir et brukervennlig grensesnitt.

NLTK (Natural Language Toolkit)

  • Natural Language processing (NLP) er en del av kunstig intelligens som behandler språket som snakkes av mennesker. Dermed hjelper det mennesker å samhandle med datamaskiner selv om de ikke har kunnskap om hvordan de skal brukes. Ved å bruke NLP trenger mennesker bare å diktere kommandoen til datamaskiner. Med kraften fra maskinlæring, blir Natural Language Processing populært og enklere å implementere. Det er i utgangspunktet teknikken for å samhandle med mennesker og utføre handlinger på stemmekommandoer.
  • Dette gjør det mulig å bruke enheter til og med nybegynnere som ikke har kunnskap om teknologi. Men implementeringen av naturlig språkbehandling er ikke lett, da et språk som er talt av mennesker ikke har noen bestemt struktur. Det er tvetydig og avhenger av kontekstord som kan ha en annen betydning.
  • NLTK har mer enn 50 korpora og leksikale kilder som WordNet, Problem Report Corpus, Penn Treebank Corpus, etc. Den kommer også med en guide som forklarer konseptene språkbehandling ved hjelp av verktøysett og programmeringsfundamentene til Python som gjør det enkelt for folket som ikke har noen dyp kunnskap om programmering. Den har et bredt spekter av pakker som gjør det til en av de kraftige verktøysettene for NLP. Tokenization, Lemmatization, Stemming, Parsing, Character count, Tegnsetting, word count er noen av disse pakkene.

Installer NLTK for Windows

Nedenfor er instruksjonene for å installere NLTK i Windows. Disse er basert på antakelsen om at Python ikke er installert i systemet. NLTK krever Python versjoner 2.7, 3.5 og nyere.

Trinn 1: Last ned den nyeste versjonen av Python for Windows fra lenken nedenfor

https://www.python.org/downloads/

Trinn 2: Klikk på nedlastet .exe for å kjøre det.

Trinn 3: Velg tilpasning av installasjon.

Trinn 4: Sjekk for alle funksjonene, spesielt “pip”, da det hjelper å installere NLTK og klikk på Neste.

Trinn 5: I det neste skjermbildet velger du avanserte alternativer, velger banen og klikker på installer.

Trinn 6: Når installasjonen er vellykket nær vinduet.

Trinn 7: Kopier banen til Scripts-mappen for å installere NLTK i samme mappe.

NLTK kan enkelt installeres ved hjelp av et “pip” installasjonsprogram. Vi må også installere “numpy”.

Trinn 8: Å installere NLTK, åpne ledeteksten og skriv inn kommandoen nedenfor.

Forsikre deg om at installasjonen er vellykket.

Etter vellykket installasjon er det nå på tide å bruke NLTK for naturlig språkbehandling.

Trinn9: Åpne Python Shell og skriv inn kommandoen nedenfor.

Hvis den importeres uten feil, betyr det at NLTK er riktig installert.

Installer NLTK for Mac / Linux

I motsetning til i Windows, kommer Linux-systemer med Python installert i den. For å installere NLTK i Linux / Mac brukes Pythons Pip-pakkeinstallasjonsprogram. For å installere pip eller oppdatere skriver du inn kommandoer under ledeteksten.

For å installere python i Linux bruker du kommandoene nedenfor.

Trinn 1: For å oppdatere pakkeindeksen bruker du kommandoen nedenfor.

Trinn 2: For å installere Python i Linux-system bruker du nedenfor.

Trinn 3: Skriv inn kommandoen nedenfor for å installere “pip” for Python 3.

Trinn 4: Etter at “Pip” er installert vellykket, bruk følgende kommandoer for å installere NLTK.

NLTK Datasett

NLTK har mange datasett tilgjengelig for behandling av naturlige språk, for eksempel WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank, etc. Disse datasettene kalles corpora. I utgangspunktet inneholder NLTK datasettet et sett med filer eller dokumenter. Hver fil / dokument inneholder en samling ord, bokstaver eller tekst på et enkelt språk. Dermed er et korpus hovedsakelig biblioteker for å forstå / lære et språk. Den har grammatikkregler og strukturer for et språk.

Etter å ha installert NLTK, kan du importere den og laste ned selskapene med følgende kommando.

NLTK nedlaster åpner et vindu for å laste ned datasettene. Størrelsen på datasettet er stort, og det vil derfor ta tid. For å teste om datasettene er riktig installert, kan du prøve å importere datasettet og bruke det.

Behandling av NLTK

Det er 5 hovedprosesser for Natural Language Processing. Dette er trinnene som er involvert i behandlingen av all tekst.

  1. EOS-deteksjon : Slutt på taledeteksjon bryter teksten i en samling meningsfulle setninger. Den deler den lange teksten i deler som har en viss betydning.
  2. Tokenisering : Dette trinnet deler setningene opp i symboler. Tokens inneholder ikke bare ord, men inkluderer også mellomrom, setningsbrudd.
  3. POS-tagging : POS betyr tale-for-tale. Her blir informasjon tildelt token. Denne informasjonen antyder hvilken type tale det er som anspent, verb, adjektiv, substantiv, etc.
  4. Chunking : Chunking betyr å samle tekstbasert på koder.
  5. Utvinning: Utvinning er en pågående prosess med å gå gjennom biter og merke dem som navngitte enheter som mennesker, lokasjoner, organisasjoner, etc.

Konklusjon:

NLTK brukes til tekstklassifisering, bildeteksting, talegjenkjenning, spørsmålssvar, språkmodellering, dokumentoppsummering og mange andre operasjoner. Det er mange andre verktøy for naturlig språkbehandling. Men NLTK har et bredt spekter av biblioteker som gjør det til et av de kraftige naturlige språkprosesseringsverktøyene. Det er mer nøyaktig enn noe annet verktøy, men på grunn av et stort antall biblioteker, er det litt tregt. Så alt avhenger av brukerens krav. Hvis brukeren vil ha hastighet, kan de også foretrekke andre verktøy, men da må de gå på akkord med nøyaktigheten til innholdet. Men hvis nøyaktighet er en prioritet, bør de absolutt gå for NLTK.

Anbefalte artikler:

Dette har vært en guide for å installere NLTK. Her diskuterer vi grunnleggende konsept og forskjellige trinn for å installere NLTK på Windows og Linux \ Mac. Du kan også se på følgende artikler for å lære mer-

  1. Installer Kubernetes Dashboard
  2. Hvordan installere JDK
  3. Installer Docker
  4. Hvordan installerer Magento?
  5. Magento versjoner | Funksjoner i Magento-versjoner