๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2024.01.16
Word Tokenization - Morphemes Word-based tokenization - ์ฌ๋์ด ์ฐ๋ ๋จ์ด์ ์๋ฏธ ํฐ ์ฌ์ ์ด ์์ด์ผ ํ๋ค. ์ฌ์ ์ ์๋ ๋จ์ด๊ฐ ์์ผ๋ฉด ์ฒ๋ฆฌ ๋ถ๊ฐ → ํด๊ฒฐํ๋ ค๋ฉด ์ฌ์ ์ด ์์ฒญ ์ปค์ผํด! ๋ณด์ด์ง ์๋ ๋จ์ด๋ ํฌ๊ทํ ๋จ์ด๋ฅผ ์ ์ฒ๋ฆฌํ ์ ์์ ํด๊ฒฐ์ฑ
→ subword tokenization Subword tokenization ๋ณดํต ๋ง๋ญ์น ์ ์์ฃผ ๋ฑ์ฅํ๋ ๋จ์ด๋ค์ ์งํฉ, ๋น๋๊ฐ ๋ฎ์ ๋จ์ด๋ ์ดํ๊ฐ ๋ถ์กฑํ ์๋ ๋จ์ด๋ณด๋ค ๋ ์ชผ๊ฐ. ๊ทธ๋ ๋ค๊ณ ๋จ์ด or ๊ธ์๋ ์๋ , ๊ทธ ์ค๊ฐ์์ ์๋ฅธ๋ค. ๋น๋๊ฐ ๋ฎ์๊ฑด ์ต๋ํ ์๋ฅด๊ณ ์ถ์ ์๊ตฌ์ ์ํ์ฌ ๋ง๋ค์ด์ง ๋ณธ์ ์๋ ๋จ์ด, ํํ์ง ์์ ๋จ์ด ๊ธฐ์กด์ NLP๋ ๊ณ ์ ๋ ์ดํ๋ก ์๋ → ๊ทธ ๋ฐ์ ์๋ ๋ชจ๋ ํ ํฐ์ UNK(์์์์)์ผ๋ก ์ถ์ ..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2024.01.16
ํ๊ตญ์ด ํํ์ ํ๊ตญ์ด๋ ๊ต์ฐฉ์ด / ์ด๊ทผ์ ์ ์ฌ๊ฐ ๋ถ์ด์ ๋ฌธ๋ฒ์ด ๊ฒฐ์ ์ด๊ทผ ๋จ์ด๋ฅผ ๋ถ์ํ ๋ ์ค์ง์ ์๋ฏธ๋ฅผ ๋ํ๋ด๋ ์ค์ฌ ๋ถ๋ถ ex) ์ด๋ฅธ์ค๋ฝ๋ค-> ์ด๋ฅธ ์ ์ฌ ๋ค๋ฅธ ์ด๊ทผ์ ๋ถ์ด ์๋ก์ด ๋จ์ด๋ฅผ ๊ตฌ์ฑ ์ ๋์ฌ, ์ ๋ฏธ์ฌ ex) ๋งจ์, ์ ์๋ ์กฐ์ฌ ๋ฌธ๋ฒ์ , ๊ด๊ณ์ ๋ป์ ๋ํ๋ด๋ ๋จ์ด ex) ์ฒ ์๊ฐ ๋ฐฅ์ ์ด๋ฏธ ํ์ฉํ์ฌ ๋ณํ๋ ๋ถ๋ถ ์ ์ด๋ง ์ด๋ฏธ, ์ด๋ง ์ด๋ฏธ ex) ๋จน๋ ๋ค, ๋ถ์ํ๊ฒ ์ต๋๋ค. ex) ์ด๋จธ๋๊ฐ ์ฑ
์ ์ฝ์ผ์
จ๊ฒ ๋ค์ ์ด๋จธ๋ ๊ฐ ์ฑ
์ ์ฝ ์ผ์ ์ ๊ฒ ๋ค์ ๋ช ๊ฐ์ ๋ฌธ์ฅ์ ํตํด ํํ์ ๋ถ์์ ํด ๋ณด๊ฒ ์ต๋๋ค. ๋ช[๊ดํ์ฌ] / ๊ฐ[๋ช
์ฌ] / ์[์กฐ์ฌ] / ๋ฌธ์ฅ[๋ช
์ฌ] / ์[ํต[์ด๊ทผ] / ํด[ํ[์ ๋ฏธ์ฌ] / ์ผ[์ฌ๋ง์ด๋ฏธ]]/ ๊ฒ [์ ์ด๋ง์ด๋ฏธ] / ์ต๋๋ค[์ด๋ง์ด๋ฏธ] ํํ[๋ช
์ฌ]/ ์[๋ช
์ฌ] / ๋ถ์[๋ช
์ฌ] / ์[์กฐ์ฌ..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2024.01.16
Thematic Roles (์๋ฏธ์ญ) Thematic [ฦ] roles (์๋ฏธ์ญ) : ๋์ฌ์ ์ธ์์ ๋์ฌ๊ฐ ์ค๋ช
ํ๋ ์ํฉ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ํํ Agent: the ‘doer’ of the action ์ด๋ค ํ๋์ ‘์คํ์’ Theme: the ‘undergoer’ of the action ํ๋์ ‘๋ฐ๋จ’ Goal: the endpoint of a change in location or possession ์์น & ์์ ๊ถ ๋ณ๊ฒฝ์ ๋ Source: where the action originates ๋์์ด ๋ฐ์ํ๋๊ณณ Instrument: the means used to accomplish an action ์ด๋ค ์๋จ์ ๊ฐ์ง๊ณ ์์ฑํ๊ฑฐ - key ๊ฐ์ ๊ฐ๋
์ด๋ค ํ๋์ ํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ ์๋จ Experience..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2024.01.16
Lexical Semantics: Reference & Sense Referent (์ง์ ๋์): ๋จ์ด๋ก ์ง์ ๋ ์ค์ ์ฌ๋ฌผํ ๋จ์ด๊ฐ ์ด๋ค ๊ฐ๋ฆฌํค๋ ๋์์ด ์๋ ๊ฒ. ๐ก Example Jack, the happy swimmer, my friend, and that guy can all have the same referent in the sentence Jack swims. -> Jack = the happy swimmer = my friend = that guy ๊ฐ๋จํด ๋ณด์ด์ง๋ง, ๋๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง๊ณ ์๋๊ฑธ ์ง์นญํ๋ ๊ฑด ์ฝ์ง๊ฐ ์๋ค. ์๋ฏธ๋ฅผ ํ์
ํด์ผ ์ฐพ์ ์ ์๋ค. - ์ง์ ๋์์ด ๊ฐ์๋ ์๋ฏธ๊ฐ ๋ค๋ฅด๋ฉด ๊ฐ๋ค๊ณ ํ ์ ์๋ค. ๐ก Example Superman, born Kal-El and legally n..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2024.01.16
Semantics (& Pragmatics) Semantics (& Pragmatics) - The meaning of language When Compositionality Goes Awry: Anomaly Sentential Semantics (๋ฌธ์ฅ ์๋ฏธ๋ก ) ํ์๊ฐ ๋ฌธ์ฅ ์๋ฏธ์ ๋ํด ์๋ ๊ฒ ๐ก Example Truth Entailment and Related Notions Ambiguity Compositional Semantics (๊ตฌ์ฑ ์๋ฏธ๋ก ) When Compositionality Goes Awry ๐ก Example Anomaly Metaphor Idioms Lexical Semantics (Word Meanings) - ์ดํ ์๋ฏธ๋ก (๋จ์ด ์๋ฏธ) ๐ก Example Theories of Wor..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2023.07.26
Syntactic analysis in NLP Parsing - PP & NP์ ๋ฐ๋ณต.. Counsituency Parsing์ ๋จ์ ์ ๋ณด์ํ ๊ฒ์ด Dependency Parsing Counsituency Parsing Structure Tree Dependenxy Parsing Structure Tree Dependent Grammer head๊ฐ dependent ์ผ ๋ ๋ ์๊ณ ์๋ก ๋ฐ๋์ผ ์๋ ์๋ค. ์ข
์์ฑ์ ๊ธฐ๋ฐ Dependency Structure๋ Word(head)์ ๊ทธ๊ฒ์ Dependent๊ณผ์ ๊ด๊ณ์ ์ํด ๊ฒฐ์ ๋๋ค. ์๋ฏธ์ ์ผ๋ก ๊ด๊ณ๊ฐ ์๋๊ฒ ๋ค๋ง ์ฐ๊ฒฐ๋๋ค. - ์๋ฏธ์ ์ผ๋ก๋ง ์ฐ๊ฒฐ๋๋ฉด ๋ฌถ์์ ์์ผ๋ฏ๋ก ๋น๊ต์ ์์ ๋ก์ด๊ฒ์ด ํน์ง ์์ ์ด์(Free word order)์ ์ธ์ด ๋ถ์์ ๋งค์ฐ ์ ํฉ P..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2023.07.26
Sentence Sentence Structure “The child found the puppy” ๋ฌธ์ฅ์ ๋ค์๊ณผ ๊ฐ์ ํ
ํ๋ฆฟ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค๊ณ ๋งํ ์ ์๋ค. Det—N—V—Det—N ์ด๊ฒ์ ๋ฌธ์ฅ์ด ๋ด๋ถ ๊ตฌ์กฐ๊ฐ ์๋ ๋จ์ด์ ๋ฌธ์์ด์ ๋ถ๊ณผํ๋ค๋ ๊ฒ์ ์๋ฏธ ๋ฌธ์ฅ์ ํ์ธต ์ง๋ฆฌ ๋๋ ทํ ๊ตฌ์กฐ๋ก ์ด๋ฃจ์ด์ ธ ์์ง ์๊ณ , ๊ณ์ธต์ ๊ตฌ์กฐ ๋ก ์ด๋ฃจ์ด์ ธ ์๋ค. ์ด ๋ฌธ์ฅ์ ์ค์ ๋ก ์ฌ๋ฌ ๊ทธ๋ฃน์ผ๋ก ๋๋ ์ ์๋ค ์ด๋ป๊ฒ ๊ฒฐํฉํ๋ ์ง์ ๋ฐ๋ผ ๋ง์ ์๋ฏธ๊ฐ ๋ฌ๋ผ์ง๋ค. ๐ก example [the child] [found a puppy] [the child] [found [a puppy]] [[the] [child]] [[found] [[a] [puppy]] ํธ๋ฆฌ ๋ค์ด์ด๊ทธ๋จ์ ๋ฌธ์ฅ์ ๊ณ์ธต ๊ตฌ์กฐ๋ฅผ ๋ณด์ฌ์ฃผ๋ ๋ฐ ์ฌ์ฉ๋๋ค. Syntactic Ca..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2023.07.26
Syntax - ๋ฌธ์ฅ์ pattern ์ฐ๊ตฌ (๋ฌธ๋ฒ) Syntax ๋ชจ๋ ์ธ๊ฐ ์ธ์ด๋ฅผ ๊ตฌ์ฌํ๋ ์ฌ๋์ ๋ฌดํํ ์์ ๊ฐ๋ฅํ ๋ฌธ์ฅ์ ์์ฐํ๊ณ ์ดํดํ ์ ์๋ค. ํ์ง๋ง, ์ฐ๋ฆฌ๋ ๊ฐ๋ฅํ ๋ชจ๋ ๋ฌธ์ฅ๋ค์ ๋ํ mental dictionary์ ๊ฐ์ง ์ ์๋ค. ์คํ๋ ค, ์ฐ๋ฆฌ๋ ์ฐ๋ฆฌ์ ๋์ ์ ์ฅ๋ ๋ฌธ์ฅ์ ํ์ฑํ๊ธฐ ์ํ ๊ท์น์ ๊ฐ์ง๊ณ ์์ต๋๋ค. What Grammaticality Is Not Based On ๋ฌธ๋ฒ์ฑ ์ ์๋ฏธ & ์ง์ค์ฑ์ ๊ธฐ์ด ํ์ง ์๋๋ค. ๐ก example Enormous crickets in pink socks danced at the prom. ๋ฌด๋ํ์์ ๋ถํ์ ์๋ง์ ์ ์ ๊ฑฐ๋ํ ๊ท๋๋ผ๋ฏธ๊ฐ ์ถค์ ์ถ์๋ค. ๊ท๋๋ผ๋ฏธ๊ฐ ์ถค์ ์ถ์๋ค๋๊ฑด → ๋ง์ด ๋์ง ์์. ๋ฌธ๋ฒ์ ๋ง์๋ ๋ง์ด ๋์ง ์๋๋ค. → ๊ทธ๋ ์ง๋ง Di..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2023.07.23
The Words of Language ๋จ์ด๋ ์ธ์ด์ ์ง์์ ์ค์ํ ๋ถ๋ถ & ๋ฌธ๋ฒ์ ๊ตฌ์ฑ ์์๋ฅผ ๊ตฌ์ฑ ์ฐ๋ฆฌ๊ฐ ์๋ ๋ชจ๋ ๋จ์ด๋ mental dictionary๋ฅผ ๊ฐ์ง๊ณ ์๋ค. Pronunciation (๋ฐ์) Meaning (์๋ฏธ) Orthography (Spelling) - ๋ง์ถค๋ฒ Grammatial Category (๋ฌธ๋ฒ ๋ฒ์ฃผ) Morphology (ํํ์) ํํ์ ๋ผ๊ณ ํ๋ ์์ ๋จ์๋ก ๋ณธ๋ค. ์ ํํ ๋ฐ์ดํฐ์์ ๋ง๋ค์ด ๋ด์ง๋ง ์ ํํ ๊ท์น์ด ์๋ค. example) ๋๋ ํ๊ต์ ๊ฐ๋ค, ํ๋์ ๋๋ ์ ์ค์ ๋ก Morphological Persingํ๋ฉด ๋๊ฐ์ ๋๋ ์ด์ง๋ง ๋ → ๋๋ช
์ฌ, ์กฐ์ฌ ์๊ฐ๋ง ๋๋ค. Normalization (ํ์คํ) ๋ฌธ์ฅ์ ๋๋๋ ค๋ฉด ๋ฌธ์ฅ๋ถํธ ๊ฐ ์์ด์ผ ํ๋ค, ๋ถํธ ์์ด๋ ๋๋ ์ผ ..
๐ NLP (์์ฐ์ด์ฒ๋ฆฌ)/๐จ๏ธ Linguistic Engineering
2023.07.23
1. ์ธ์ด๊ณตํ๊ฐ๋ก ์๋ก 1) ๋ฌธ๋งฅ์ ์ค์์ฑ ํ๊ตญ์ด๋ ํ๊ตญ์ด์ ํน์ง, ์์ด๋ ์์ด์ ํน์ง์ด ์๋ค. ํ๊ตญ์ด๋ฅผ ์์ด๋ก ํด์ํ๋ค๊ณ ํด์ 1:1๋ก ๋์ํ์ฌ ๋จ์ด ํ๋ํ๋๋ฅผ ํด์ํ์ง๋ ์์ ๊ฒ์ด๋ค. ๋ฌธ๋งฅ์ ์ค์์ฑ ์ํฉ์ด ๋ฌ๋ผ์ง๋ฉด T, F๊ฐ ๋ฌ๋ผ์ง ์ ์๋ฏ์ด ์ด๋ ํ ๋ช
์ ๋ ์ฐธ์ด๋ผ๊ณ ํ๊ธฐ์ ์ด๋ ค์ฐ๋ ๋ณดํต ๊ทธ๋ฐ ๋ช
์ ๋ค์ ‘์ด์๋ ๋ชจ๋ ์ฌ๋๋ค์ด ์๊ฐํ๋ ๊ณตํต์ ’๊ณผ ๊ฐ์ ๋งฅ๋ฝ์์ ์๊ฐํด์ผํ๋ค. ์๊ฐํด์ผํ ์ฌํญ ์ธ๊ฐ์ด ์ดํดํ๊ธฐ์ ๋น์ฐํ๊ณ ์ฌ์ด ์ผ์ด์ง๋ง, ์ธ๊ฐ์ด ์ธ์ด๋ฅผ ์ดํดํ ๋ ์์ฐ์ค๋ฝ๊ณ ๋น์ฐํ๋ค๊ณ ๋๋ผ๋ ๊ฒ์ด ์ปดํจํฐ์๊ฒ ์ด๋ ต๋ค. ๋ฅ๋ฌ๋์ ์ ์ฉํ๊ธฐ์ ์ด๋ ค์ด ์ธ๊ฐ์ ๊ท์น์ด, ๋ฅ๋ฌ๋์ ํ์ฉํจ์ผ๋ก์จ ์คํ๋ ค ๋ ์ฝ๊ฒ ํ์ฉํ ์ ์๊ธฐ๋ ํ๋ค. ์ฐ๋ฆฌ๊ฐ ์ด๋ป๊ฒ ์ธ์ด๋ฅผ ์ดํดํ๋์ง? (์ปดํจํฐ์ ๋ค๋ฅธ ์ ) ์ปดํจํฐ๊ฐ ์ธ๊ฐ์ ์ธ์ด๋ฅผ ์ดํดํ๋ ๋ฐฉํฅ..