Ë ¶:Qgw ãóü—UddlmZddlZddlmZddlmZmZmZddl Z ddl m Zddl mZ ddl mZdZd ed <d„Zdd„Ze«d „«Zee¬«dd„«Zee¬«dd„«Zee¬«dd„«Z y)é)ÚannotationsN)Ú lru_cache)ÚFinalÚListÚTuple)Úpos_tag)Ú sent_tokenize)Ú word_tokenizeé€z Final[int]ÚCACHE_MAX_SIZEcó`—tjdd¬«tjdd¬«y)NÚaveraged_perceptron_tagger_engT)ÚquietÚ punkt_tab)ÚnltkÚdownload©óúV/var/www/html/answerous/venv/lib/python3.12/site-packages/unstructured/nlp/tokenize.pyÚdownload_nltk_packagesrs€Ü‡MMÐ2¸$Õ?Ü‡MM+ TÖ*rcó.—g}tjjD]D}|jd«s tjj|d«}|j |«ŒF tj|›d|›|¬«y#ttf$rYywxYw)zEChecks to see if the specified NLTK package exists on the file systemÚ nltk_dataú/)ÚpathsTF) rÚdataÚpathÚendswithÚosÚjoinÚappendÚfindÚLookupErrorÚOSError)Úpackage_nameÚpackage_categoryrrs rÚcheck_for_nltk_packager&s„€à€EÜ— ‘ —‘òˆØ}‰}˜[Ô)Ü—7‘7—<‘< kÓ2ˆDØ ‰TÕðð Ü ‰ Ð%Ð& a¨ ~Ð6¸eÕDØøÜœÐ!òÙðúsÁ%BÂBÂBcóV—tdd¬«}tdd¬«}|r|st«yy)z;If required NLTK packages are not available, download them.Útaggersr)r%r$Ú tokenizersrN)r&r)Útagger_availableÚtokenizer_availables rÚ&_download_nltk_packages_if_not_presentr,%s:€ô.Ø"Ø5ôÐô1Ø%°KôÐñ Ñ)9ÜÕ ð*:r)Úmaxsizecó,—t«t|«S)zFA wrapper around the NLTK sentence tokenizer with LRU caching enabled.)r,Ú_sent_tokenize©Útexts rr r 5ó€ô+Ô,Ü˜$ÓÐrcó,—t«t|«S)zBA wrapper around the NLTK word tokenizer with LRU caching enabled.)r,Ú_word_tokenizer0s rr r <r2rcóŒ—t«t|«}g}|D]'}t|«}|jt |««Œ)|S)z>A wrapper around the NLTK POS tagger with LRU caching enabled.)r,r/r4ÚextendÚ_pos_tag)r1Ú sentencesÚparts_of_speechÚsentenceÚtokenss rrrCsO€ô+Ô,ô˜tÓ$€IØ-/€OØò1ˆÜ Ó)ˆØ×Ñœx¨Ó/Õ0ð1ðÐr)r$Ústrr%r<ÚreturnÚbool)r1r<r=z List[str])r1r<r=zList[Tuple[str, str]])Ú __future__rrÚ functoolsrÚtypingrrrrrr7r r/r r4rÚ__annotations__rr&r,rrrúrCs•ðÞ"ã Ýß%Ñ%ãÝ$Ý0Ý0à € Ó ò+ó ñ"ƒñ!ó ð!ñ>Ô"ò ó#ð ñ>Ô"ò ó#ð ñ>Ô"òó#ñr