๐Ÿ“ NLP (์ž์—ฐ์–ด์ฒ˜๋ฆฌ)/๐Ÿ—จ๏ธ Linguistic Engineering

[Intro] Introduction to Language Engineering - ์–ธ์–ด๊ณตํ•™๊ฐœ๋ก 

Bigbread1129 2023. 7. 23. 16:42

1. ์–ธ์–ด๊ณตํ•™๊ฐœ๋ก  ์„œ๋ก 

1) ๋ฌธ๋งฅ์˜ ์ค‘์š”์„ฑ

  • ํ•œ๊ตญ์–ด๋Š” ํ•œ๊ตญ์–ด์˜ ํŠน์ง•, ์˜์–ด๋Š” ์˜์–ด์˜ ํŠน์ง•์ด ์žˆ๋‹ค.
  • ํ•œ๊ตญ์–ด๋ฅผ ์˜์–ด๋กœ ํ•ด์„ํ•œ๋‹ค๊ณ  ํ•ด์„œ 1:1๋กœ ๋Œ€์‘ํ•˜์—ฌ ๋‹จ์–ด ํ•˜๋‚˜ํ•˜๋‚˜๋ฅผ ํ•ด์„ํ•˜์ง€๋Š” ์•Š์„ ๊ฒƒ์ด๋‹ค.
  • ๋ฌธ๋งฅ์˜ ์ค‘์š”์„ฑ
    • ์ƒํ™ฉ์ด ๋‹ฌ๋ผ์ง€๋ฉด T, F๊ฐ€ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๋“ฏ์ด ์–ด๋– ํ•œ ๋ช…์ œ๋„ ์ฐธ์ด๋ผ๊ณ  ํ•˜๊ธฐ์—” ์–ด๋ ค์šฐ๋‚˜ ๋ณดํ†ต ๊ทธ๋Ÿฐ ๋ช…์ œ๋“ค์€ ‘์ด์‹œ๋Œ€ ๋ชจ๋“  ์‚ฌ๋žŒ๋“ค์ด ์ƒ๊ฐํ•˜๋Š” ๊ณตํ†ต์ ’๊ณผ ๊ฐ™์€ ๋งฅ๋ฝ์—์„œ ์ƒ๊ฐํ•ด์•ผํ•œ๋‹ค.
    • ์ƒ๊ฐํ•ด์•ผํ•  ์‚ฌํ•ญ
      • ์ธ๊ฐ„์ด ์ดํ•ดํ•˜๊ธฐ์—” ๋‹น์—ฐํ•˜๊ณ  ์‰ฌ์šด ์ผ์ด์ง€๋งŒ, ์ธ๊ฐ„์ด ์–ธ์–ด๋ฅผ ์ดํ•ดํ•  ๋•Œ ์ž์—ฐ์Šค๋Ÿฝ๊ณ  ๋‹น์—ฐํ•˜๋‹ค๊ณ  ๋Š๋ผ๋Š” ๊ฒƒ์ด ์ปดํ“จํ„ฐ์—๊ฒ ์–ด๋ ต๋‹ค.
      • ๋”ฅ๋Ÿฌ๋‹์— ์ ์šฉํ•˜๊ธฐ์—” ์–ด๋ ค์šด ์ธ๊ฐ„์˜ ๊ทœ์น™์ด, ๋”ฅ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•จ์œผ๋กœ์จ ์˜คํžˆ๋ ค ๋” ์‰ฝ๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๊ธฐ๋„ ํ•˜๋‹ค.
      • ์šฐ๋ฆฌ๊ฐ€ ์–ด๋–ป๊ฒŒ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•˜๋Š”์ง€? (์ปดํ“จํ„ฐ์™€ ๋‹ค๋ฅธ ์ )
        • ์ปดํ“จํ„ฐ๊ฐ€ ์ธ๊ฐ„์˜ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•˜๋Š” ๋ฐฉํ–ฅ
          1. ๊ทœ์น™ (Rule) : ๋งŽ์€ ๊ทœ์น™์„ ์•Œ๋ ค์ค˜๋„ ์ปดํ“จํ„ฐ๋Š” ๋งŽ์ด ๋งž์ถ”์ง€ ๋ชปํ•จ.
            (๊ทœ์น™์˜ ์‹ค์ƒ์€ ๋ณต์žกํ•˜๊ธฐ๋•Œ๋ฌธ)
          2. ๋จธ์‹ ๋Ÿฌ๋‹ (Machine Learning) : - based on Statistical approach
            == ๋‹ค์Œ์— ํ•  ๋ง์„ ํ†ต๊ณ„์ ์œผ๋กœ ์˜ˆ์ธกํ•˜๊ณ  ์ถ”์ธก
          3. ๋”ฅ๋Ÿฌ๋‹( Deep Learning) : ๋Œ€๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•˜๋‹ค.
            ํ•™์Šตํ•˜๋Š”๋ฐ ์‹œ๊ฐ„์ด ์˜ค๋ž˜๊ฑธ๋ฆฐ๋‹ค.
        • ํ˜„์—…์—์„œ๋Š” rule-based, statistical, neural ๋ชจ๋‘ ์„ž์–ด์„œ ์‚ฌ์šฉํ•œ๋‹ค.
          ⇒ ๋ฌด์กฐ๊ฑด ๋”ฅ๋Ÿฌ๋‹์ด ์ข‹์€ ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค. (๋Œ€๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ, ์‹œ๊ฐ„ ์˜ค๋ž˜๊ฑธ๋ฆผ์˜ ๋‹จ์ ์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ)

2) ์ธ๊ฐ„์˜ ์™„๋ฒฝํ•œ ๋Šฅ๋ ฅ์— ๋Œ€ํ•œ ๊ณ ์ฐฐ

์‚ฌ๋žŒ์˜ ์–ธ์–ด๋Š” ๊ณผ์—ฐ ์™„๋ฒฝํ•˜๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?

๊ต์ˆ˜๋‹˜์˜ ๋งํ•˜๋Š” ๋‚ด์šฉ์„ ๋…น์Œํ•˜์—ฌ ์žฌ์ƒํ•˜๋ฉด ๋ฌธ์žฅ์˜ ํ˜ธ์‘, ๋ฐœ์Œ ๋“ฑ๋“ฑ ์—‰๋ง์ผ ์ˆ˜ ์žˆ๋‹ค. (ํ•œ๊ตญ์–ด ๊ทœ์น™์— ๋Œ€ํ•ด ์•Œ๊ธฐ๋„ ์–ด๋ ต๊ณ , ์™„๋ฒฝํ•˜๊ฒŒ ๋ฐฐ์šด ์ ์ด ์—†์–ด ์™„๋ฒฝํ•˜๊ฒŒ ๊ตฌ์‚ฌํ•˜๊ธฐ์—๋Š” ์–ด๋ ค์›€์ด ์žˆ๋‹ค.)

⇒ ์ปดํ“จํ„ฐ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€!!

3) Tunning Test

์ธ๊ฐ„์˜ ์–ธ์–ด๋ฅผ ๋ฐฐ์šฐ๊ณ , ์™„๋ฒฝํ•˜๊ฒŒ ๊ตฌ์‚ฌํ•œ๋‹ค๊ณ  ํ‰๊ฐ€ํ•˜๋Š” ๊ธฐ์ค€ ์ค‘ ํ•˜๋‚˜์ด๋‹ค.

  • NLP & AI : ๊ฐ•์ธ๊ณต์ง€๋Šฅ(Strong AI) vs ์•ฝ์ธ๊ณต์ง€๋Šฅ(Weak AI)

2. NLP & Language Technology

1) Natural Language + Data Progressing (์–ธ์–ดํ•™+์ปดํ“จํ„ฐ๊ณผํ•™)

  • ์–ธ์–ด์— ๋Œ€ํ•œ ์ดํ•ด + (๊ธฐ์ˆ ์— ๋Œ€ํ•œ ์ดํ•ด, ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ๋”ฅ๋Ÿฌ๋‹, ์ˆ˜ํ•™&ํ†ต๊ณ„ํ•™, ์ฒ ํ•™&์‹ฌ๋ฆฌํ•™..)
  • NLP๋Š” ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์˜ ๊ต์ง‘ํ•ฉ์ด๊ณ , ํŠนํžˆ ์–ธ์–ด์— ๋Œ€ํ•œ ์ดํ•ด๋„๊ฐ€ ์ค‘์š”ํ•œ ํ•™๋ฌธ์ด๋‹ค.
๐Ÿ’ก **์ตœ์ข… ๋ชฉํ‘œ : ์ธ๊ฐ„์ฒ˜๋Ÿผ ์ดํ•ดํ•˜๊ณ , ์ธ๊ฐ„์ฒ˜๋Ÿผ ๋งํ•˜๊ธฐ** ์ธ๊ฐ„์ฒ˜๋Ÿผ ์ดํ•ดํ•˜๊ณ  ⇒ ์ธ๊ฐ„์ฒ˜๋Ÿผ ์ •๊ตํ•˜๊ฒŒ ์ดํ•ดํ•˜๊ธฐ (input) ์ธ๊ฐ„์ฒ˜๋Ÿผ ๋งํ•˜๊ณ  ⇒ ์ธ๊ฐ„์ฒ˜๋Ÿผ ๋…ผ๋ฆฌ์ •์—ฐํ•˜๊ฒŒ ๋งํ•˜๊ธฐ (output)
  • NLP๋Š” AI ์—ฐ๊ตฌ์˜ ํ•œ ๋ถ„์•ผ์ด์ง€๋งŒ ์ธ๊ณต์ง€๋Šฅ์—์„œ๋„ ํฐ ๋ถ€๋ถ„์„ ์ฐจ์ง€ํ•˜๊ณ ์žˆ๋‹ค.
    ( ์ƒ๊ฐ์˜ input - output์ด ๋ชจ๋‘ ์–ธ์–ด์ด๊ธฐ์— ์–ธ์–ด๋ฅผ ์ œ์™ธํ•˜๊ณ  ์ƒ๊ฐํ•˜๊ธฐ๋Š” ์–ด๋ ต๋‹ค.)

2) ํ™œ์šฉ

  • ๊ทธ๋ ‡๋‹ค๋ฉด ์–ธ์–ด๋ฅผ ์ปดํ“จํ„ฐ์—๊ฒŒ ์ž˜ ๊ฐ€๋ฅด์น˜๋ฉด ๋˜๋Š”๊ฐ€…?
  • ์–ธ์–ด์˜ ์–ด๋ ค์šด ์˜ˆ์‹œ
์˜ค๋Š˜ ์—ฌ๊ธฐ์—์„œ ์—ฌ๋Ÿฌ๋ถ„๊ณผ ํ•จ๊ป˜ <b>์ˆ˜์—…<b>์„ ํ•˜๊ฒŒ ๋˜์–ด ๊ธฐ๋ป์š”!
์˜ค๋Š˜ ์—ฌ๊ธฐ์—์„œ ์—ฌ๋Ÿฌ๋ถ„๊ณผ ํ•จ๊ป˜ <b>์ˆ˜์˜<b>์„ ํ•˜๊ฒŒ ๋˜์–ด ๊ธฐ๋ป์š”!

<!--๋ฌธ๋ฒ•์ ์œผ๋กœ ์˜ค๋ฅ˜๊ฐ€ ์—†์ง€๋งŒ, ์˜๋ฏธ์ ์œผ๋กœ ์ดํ•ดํ•˜๊ธฐ ์–ด๋ ต๋‹ค-->
๋‚˜ ์„๋ฅ˜๋ž‘ ์—๋ฒ„๋žœ๋“œ ๊ฐˆ๊ฑฐ์•ผ <!--์„๋ฅ˜๊ฐ€ ์‚ฌ๋žŒ์ธ๊ฐ€? ๋จน๋Š”๊ฑด๊ฐ€?-->
๋‚˜ ์˜ˆ์œ ์„๋ฅ˜๋ž‘ ์ง€์€์ด๋ž‘ ์—๋ฒ„๋žœ๋“œ ๊ฐˆ๊ฑฐ์•ผ <!--'์˜ˆ์œ' ์ˆ˜์‹์–ด๋ฅผ ๋ฐ›๋Š” ๋ช…์‚ฌ๋Š” ๋ˆ„๊ตฌ์ง€?-->
๋‚˜ ์†์„๊ตฌ๋ž‘ ์—๋ฒ„๋žœ๋“œ ๊ฐˆ๊ฑฐ์•ผ <!--์œ ๋ช…์ธ๊ณผ ์นœ๋ถ„์ด ์žˆ๋‚˜? ์†์„๊ตฌ๊ฐ€ ๋ˆ„๊ตฌ์ง€?-->
๐Ÿ’ก ๋ง์˜ ์˜๋ฏธ ๊ทธ ์ž์ฒด๋ฅผ ์ดํ•ดํ•˜๋Š” ๊ฒƒ๋„ ์–ด๋ ต์ง€๋งŒ ์–ธ์–ด๋Š” ๋‹จ์ˆœํžˆ ์–ธ์–ด๋กœ๋งŒ ๋งŒ๋“ค์–ด์ง„ ๊ฒƒ์ด ์•„๋‹ˆ๋‹ค. (๋งฅ๋ฝ์— ์˜์กดํ•˜๋Š” ๋ง์„ ํ›จ์”ฌ ๋งŽ์ด ์‚ฌ์šฉํ•˜๊ฒŒ ๋œ๋‹ค.)
  • ์‹ค์ œ๋กœ, ์‚ฌ๋žŒ์˜ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•œ๋‹ค๋Š” ๊ฒƒ์€ ์–ธ์–ด ๊ทธ ์ž์ฒด์— ๋Œ€ํ•œ ์ง€์‹๋ณด๋‹ค๋„ ์„ธ์ƒ์— ๋Œ€ํ•œ ์ง€์‹์ด ์žˆ์–ด์•ผํ•œ๋‹ค.
    • ์–ธ์–ด๋ฅผ ๋ฐฐ์šธ ๋•Œ ๊ทœ์น™ ๊ทธ ์ž์ฒด๋กœ ๋ฐฐ์šฐ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ
    • ํ•™๊ต์—์„œ, tv์—์„œ, ์นœ๊ตฌ์™€ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์˜์‹์ ์œผ๋กœ ๋ฐฐ์šด๋‹ค. (๋งฅ๋ฝ์ )
  • Common Language
    • ์–ธ์–ด๋Š” ์˜ค๋žœ ์‹œ๊ฐ„๋™์•ˆ ๊ฒฝ์ œ์„ฑ์„ ์ค‘์‹ฌ์œผ๋กœ ์ตœ์ ํ™”๋˜์—ˆ๋‹ค.
๐Ÿ’ก ์ƒ์‹์€ ๋ณด์—ฌ์ง€๋Š” ์ •๋ณด๊ฐ€ ์•„๋‹ˆ๋‹ค. ์ด๋Š” ์ปดํ“จํ„ฐ๊ฐ€ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•˜๊ธฐ ์–ด๋ ค์šด ์š”์†Œ์ด๋‹ค.
    • ํ˜•ํƒœ ๋ฐ ๊ตฌ์กฐ์˜ ๋ณ€ํ™”, ๋นˆ๋ฒˆํ•œ ๊ตฌ์กฐ์˜ ์ƒ๋žต ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ผญ ํ•„์š”ํ•œ ์š”์†Œ๋“ค๋งŒ ๋‚จ๋Š”๋‹ค.
    • ์–ธ์–ด์˜ ๊ฒฝ์ œ์„ฑ ; ๋งฅ๋ฝ์— ์˜์กดํ•˜๊ธฐ์— ์ค‘์˜์„ฑ(ambiguity)์ด ์ƒ๊ธฐ๊ณ , ๋ช…๋ฃŒ์„ฑ์€ ๋–จ์–ด์ง„๋‹ค.
      • ์ค‘์˜์„ฑ : ๊ฐ€์Šด์„ ์—ด์–ด๋ผ
        • ์‹ ์ฒด์ ์œผ๋กœ ๊ฐ€์Šด์„ ํŽด๋ผ?
        • ๋งˆ์Œ์„ ์—ด์–ด๋ผ
    • ์˜์–ด : ์ €๋งฅ๋ฝ ์–ธ์–ด
      ํ•œ๊ตญ์–ด : ๊ณ ๋งฅ๋ฝ ์–ธ์–ด (๋ฌธ๋งฅ์˜ ์˜ํ–ฅ์ด ํฌ๋‹ค.)
    • ํŠนํžˆ ์˜๋ฏธ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋‹จ๊ณ„(semantics, pragmatics)์—์„œ๋ถ€ํ„ฐ ์ƒ์‹ ์ •๋ณด๋ฅผ ๋งŽ์ด ํ™œ์šฉํ•œ๋‹ค.
  • What is worse…
    • ์—ฐ๊ตฌ ์ˆ˜์ค€๊ณผ ์ƒ์šฉํ™” ์ˆ˜์ค€์˜ GAP ; ๋ฌธ์ œ์ 
      • ๋ถ€์ •ํ™•ํ•œ ์ž…๋ ฅ(์ƒ๋žต, ๋น„๋ฌธ, ์‹ ์กฐ์–ด, ์š•์„ค ๋“ฑ ๋‹ค์–‘ํ•œ ๊ตฌ์–ด์ฒด์  ํ˜„์ƒ)
      • ํ•™์Šต๋ฐ์ดํ„ฐ์˜ ๋ถ€์žฌ ๋“ฑ
  • ๊ธฐํƒ€
    • Entity Resolution : ์„œ๋กœ ๋‹ค๋ฅธ ๋งฅ๋ฝ์—์„œ ๊ฐ™์€ ์‚ฌ๋žŒ์ธ์ง€ ํŒŒ์•…ํ•ด์•ผํ•œ๋‹ค.
    • Anaphora resolution : ๊น€์œ ์ • == ‘๊ทธ’ == ‘๊ทธ๋…€’
    • Coreference resolution : John smith == Mr.smith

Diversity & Creativity

  • ์–ธ์–ด๋Š” ์ด์งˆ์ ์ด๋ฉด์„œ๋„ ์œ ์—ฐํ•˜๋‹ค.
๐Ÿ’ก `๊ฐ•์ธ๊ณต์ง€๋Šฅ(Strong AI)`์„ ๋งŒ๋“ค๋ ค๋ฉด ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋“ค์„ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์–ด์•ผํ•œ๋‹ค.

3. Phonetics & Phonology (๋ง์†Œ๋ฆฌ)

1) Natural Language Processing์˜ ์ฒซ ์‹œ์ž‘

2) Both deal with speech sounds

  • Phonetics : The sounds of Language (์†Œ๋ฆฌ ๊ทธ ์ž์ฒด)
  • Phonology : The sound of Patterns of Language (์†Œ๋ฆฌ๊ฐ€ ๊ทœ์น™์œผ๋กœ ๋ณ€ํ•˜๋Š” ์„ฑ์งˆ)
    • ์ ์šฉ๋˜์ง€ ์•Š์€ ์ดˆ์ฐฝ๊ธฐ AI๋Š” ๋ฐœ์Œ์ด ์–ด์ƒ‰ํ–ˆ๋‹ค. (๊ธฐ๊ณ„์Œ)
<!--์†Œ๋ฆฌ๊ฐ€ ๋‚˜์˜ค๋Š” ๊ตฌ๊ฐ„์˜ ์„ž์—ฌ์žˆ๋Š” ๊ตฌ๊ฐ„์ด ์กด์žฌํ•œ๋‹ค.-->
๋ฌผ๊ณ ๊ธฐ์˜ '๋ฌผ' : ใ…-ใ…œ-ใ„น (๋”ฑ๋”ฑ ๋Š๊ฒจ์žˆ๋Š” ๋“ฏ ํ•˜์ง€๋งŒ, ์†Œ๋ฆฌ๊ฐ€ ์„ž์—ฌ์žˆ๋Š” ๊ตฌ๊ฐ„์ด ์กด์žฌํ•œ๋‹ค.)
๋”ฐ๋ผ์„œ, 'ใ…'๊ณผ 'ใ…œ' ์‚ฌ์ด์˜ ๋ฐœ์Œ ๊ตฌ๊ฐ„์„ ์ •ํ™•ํ•˜๊ฒŒ ๋Š์–ด๋‚ด๊ธฐ ์–ด๋ ต๋‹ค.
๊ตฌ๊ฐ„์˜ ์˜ํ–ฅ์ด ์ ์€ ๊ฒฝ์šฐ, ๋งŽ์€ ๊ฒฝ์šฐ๊ฐ€ ์žˆ๋‹ค.

<!--๊ฐ™์€ ๋ฌธ์ž๋ผ๋„ ๋‹ค๋ฅด๊ฒŒ ๋‚˜์˜ค๋Š” ์†Œ๋ฆฌ-->
๋ฐ” : 'ใ…‚' **๋ฌด์„ฑ์Œ**
๋ณด : 'ใ…‚' **์œ ์„ฑ์Œ**

<!--'ใ„น'์˜ ๋‹ค์–‘ํ•œ ์†Œ๋ฆฌ-->
****๋‹ค๋ฆฌ : 'ใ„น' ํ˜€์œ„ ์œ„์น˜ : **๊ณต์ค‘์— ๋– ์žˆ๋‹ค.
** ๋‹ฌ : 'ใ„น' ํ˜€์˜ ์œ„์น˜ : **์œ—๋‹ˆ**
๐Ÿ’ก ๋‹ค์–‘ํ•œ ์ƒํ™ฉ์— ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ฃผ๋ฉด, ํ‘œํ˜„ ๊ฐ€๋Šฅํ•œ ๋ง์†Œ๋ฆฌ๊ฐ€ ๋‹ค์–‘ํ•ด์ง„๋‹ค.
  • Speech segmentation
  • Speech sound identification
    • ์ปดํ“จํ„ฐ๋Š” ์‚ฌ๋žŒ์˜ ๋ง์†Œ๋ฆฌ๋ฅผ ์•Œ์ง€ ๋ชปํ•œ๋‹ค.
  • ์†Œ๋ฆฌ๊ฐ€ ์–ด๋–ค ์œ„์น˜์—์„œ ๋‚˜๋Š”์ง€, ๊ตฌ๊ฐ•๊ตฌ์กฐ์˜ ๊ฐœํ, ํ˜€์˜ ์œ„์น˜์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์ง€๋Š”๋ฐ, ์ด์— ๋Œ€ํ•ด ๋” ์ž์„ธํžˆ ์•Œ์•„๋ณด์ž.

4. Sounds

1) ์†Œ๋ฆฌ์˜ ํŠน์ง•

  • ์ „๋‹ฌ ๋งค๊ฐœ(๊ณต๊ธฐ, ์‹ค์ „ํ™”๊ธฐ ๋“ฑ)๊ฐ€ ์—†์œผ๋ฉด ๋“ค๋ฆฌ์ง€ ์•Š๋Š”๋‹ค.
    • ์šฐ์ฃผ๋Š” ์ง„๊ณต์ƒํƒœ์ด๊ธฐ ๋•Œ๋ฌธ์— ์†Œ๋ฆฌ๊ฐ€ ๋“ค๋ฆฌ์ง€ ์•Š๋Š”๋‹ค.
    • ์‡  : ์†Œ๋ฆฌ๋ฅผ ์ „๋‹ฌํ•˜๋Š” ๋งค๊ฐœ์— ๊ฐ€์žฅ ์ตœ์ ํ•˜๋‹ค.
  • ์ฃผ์š” 4๊ฐ€์ง€ ํŠน์ง•
    1. Pitch (๋†’๋‚ฎ์ด)
    2. Loudness (ํฌ๊ธฐ)
    3. Quality (์†Œ๋ฆฌ์˜ ๊ตฌ๋ถ„ - ๋ฐ”์ด์˜ฌ๋ฆฐ์†Œ๋ฆฌ, ์ฒผ๋กœ ์†Œ๋ฆฌ, ๋ชฉ์†Œ๋ฆฌ… ๋“ฑ)
    4. Length
  • ์†Œ๋ฆฌ๋ฅผ ๋ฌผ๋ฆฌ์ ์œผ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ•

1. Waveform 

  • x์ถ• : ์‹œ๊ฐ„

  • ์†Œ๋ฆฌ๋ฅผ ๋ฌผ๋ฆฌ์ ์œผ๋กœ ํ‘œํ˜„ํ•œ ๊ฒƒ์ด๋‹ค.
  • type
    • Pure Tones
      • ์˜ค์ง 1๊ฐœ์˜ frequency
    • Complex waves : ๋Œ€๋ถ€๋ถ„์˜ ์†Œ๋ฆฌ
      • ์„œ๋กœ ๋‹ค๋ฅธ frequency, complexity๋ฅผ ๊ฐ€์ง„ pure tone์ด ์„ž์—ฌ์žˆ๋Š” ์†Œ๋ฆฌ์ด๋‹ค.
        • Pure tone์„ ์—ฌ๋Ÿฌ๊ฐœ ์„ž๋Š”๋‹ค๊ณ  ํ•ด์„œ ๋†’๋‚ฎ์ด๊ฐ€ ๋” ๋†’์•„์ง€๊ฑฐ๋‚˜, quality๊ฐ€ ์ผ์ •ํ•˜์ง€ ์•Š๋Š”๋‹ค.
    • type
      • Repetitive wave : ์Œ์•… ์•…๊ธฐ์†Œ๋ฆฌ(๊ฑฐ์˜), ์ˆ˜ํ•™์ ์œผ๋กœ ๋งŒ๋“ค์–ด์ง„ sine์›จ์ด๋ธŒ
      • non-repetitive wave : ์†Œ์Œ, ์ฒœ๋‘ฅ, …

2. Spectrum

  • waveform์„ ํ™•๋Œ€ํ•œ ๊ฒƒ์ด๋‹ค.
  • x์ถ• : ์‹œ๊ฐ„์ด ์•„๋‹ˆ๋‹ค.
  • waveform์„ ์žฌ๋ฃŒ๋กœ ์‚ผ์•„์„œ ๋ณ€ํ™˜ํ•œ๊ฒƒ

3. Spectrogram

    1. ์†Œ๋ฆฌ์˜ ์‹œ๊ฐ„์„ x์ถ•์œผ๋กœ ๋ด๊ฟ” ๋†“์€๊ฒƒ, Spectrum์— ๋น„ํ•ด ๋ณด๊ธฐ๊ฐ€ ํŽธ๋ฆฌํ•˜๋‹ค.
    2. waveform์„ ์žฌ๋ฃŒ๋กœ ์‚ผ์•„์„œ ๋ณ€ํ™˜ํ•œ๊ฒƒ


2) Simple Wave : ๊ธฐ๊ณ„๊ฐ€ ๋‚ด๋Š” ์†Œ๋ฆฌ

  • ๊ธฐ๊ณ„ ๋‚ด๋Š” ์†Œ๋ฆฌ๋Š” ์ •ํ˜•, ๊ทœ์น™์ ์ธ ๊ทœ์น™์ด ์žˆ๋‹ค.
    • ์ฃผ๊ธฐ์— ๋”ฐ๋ผ ํ—ค๋ฅด์ธ ๋ฅผ ๊ฒฐ์ •ํ•œ๋‹ค.
    • ์Œ์˜ ๋†’๋‚ฎ์ด๊ฐ€ ๊ฒฐ์ •๋œ๋‹ค
  • ์‚ฌ๋žŒ์ด ๋‚ด๋Š” ์†Œ๋ฆฌ๋Š” ๋น„์ •ํ˜•

3) Frequency

  • ๋–จ๋ฆผ์˜ ์ฃผ๊ธฐ → ์ง„๋™ ํšŸ์ˆ˜๋ฅผ ๊ฒฐ์ • → ๋†’๋‚ฎ์ด ๊ฒฐ์ •
  • ์‚ฌ๋žŒ์˜ ๊ฒฝ์šฐ, ์—ฐ๋ น๊ณผ ์„ฑ๋ณ„์— ๋”ฐ๋ผ์„œ ๋ง์†Œ๋ฆฌ์˜ ๋†’๋‚ฎ์ด๊ฐ€ ๋‹ค๋ฅด๋‹ค.
    • ์•„์ด > ์—ฌ์ž > ๋‚จ์ž (์ˆœ์œผ๋กœ ๋†’๋‚ฎ์ด๊ฐ€ ๋†’๊ณ  - ๋‚ฎ๋‹ค.)
    • ๋†’๋‚ฎ์ด๋Š” ์†Œ๋ฆฌ์˜ ์ง„๋™ ํšŸ์ˆ˜์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์ง€๊ธฐ ๋•Œ๋ฌธ์— (sound source vibration)
      ๋‚ฎ์€ ์—ฐ๋ น์˜ ๊ฒฝ์šฐ ์šธ๋ฆผํ†ต์ด ์ž‘๊ณ , ์—ฌ์„ฑ์ด ๋‚จ์„ฑ์— ๋น„ํ•ด ์šธ๋ฆผํ†ต์ด ์ž‘๊ธฐ ๋•Œ๋ฌธ์— ์†Œ๋ฆฌ์˜ ์ง„๋™ ํšŸ์ˆ˜๊ฐ€ ๋งŽ์ด ๋†’์€ ๋ชฉ์†Œ๋ฆฌ๊ฐ€ ๋‚˜์˜จ๋‹ค.
  • ์ „ํ™”ํ•  ๋•Œ
    • 2๋งŒ ํ—ค๋ฅด์ธ ๊นŒ์ง€ ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ๋”๋ผ๋„ ๋น„์šฉ๊ณผ ์—๋„ˆ์ง€๊ฐ€ ๋งŽ์ด ์“ฐ์ด๊ธฐ ๋•Œ๋ฌธ์— ์ „ํ™”๋กœ ๋Œ€ํ™”ํ• ๋•Œ๋Š” 8์ฒœํ—ค๋ฅด์ธ ๊นŒ์ง€๋งŒ Limit์„ ๊ฑธ์–ด ๋ถˆํ•„์š”ํ•œ ๋น„์šฉ๊ณผ ์—๋„ˆ์ง€๋ฅผ ์ค„์ธ๋‹ค.
    • 4์ฒœ ํ—ค๋ฅด์ธ ๊นŒ์ง€๋งŒ ๋˜์–ด๋„ ๋ฏผ๊ฐํ•˜๊ฒŒ ๋ฐ›์•„๋“ค์ผ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ ์ด์ƒ์œผ๋กœ ๊ฐ€๋ฉด ๋ฐ›์•„๋“ค์ผ ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๊ฐ€ ์—†๋‹ค. (๋ฏผ๊ฐ๋„๊ฐ€ ๋–จ์–ด์ ธ ์†Œ๋ฆฌ๋ฅผ ๋“ค์„ ์ˆ˜ ์—†๋‹ค.)
  • ๋“ค์„ ์ˆ˜ ์žˆ๋Š” ์†Œ๋ฆฌ
    • ์‚ฌ๋žŒ๊ณผ ๊ฐ•์•„์ง€์˜ ๊ฐ€์ฒญ์ฃผํŒŒ์ˆ˜๋Š” ๊ฒน์นœ๋‹ค.
    • ์‚ฌ๋žŒ๊ณผ ๋ฐ•์ฅ์˜ ๊ฐ€์ฒญ์ฃผํŒŒ์ˆ˜๋Š” ๊ฒน์น˜์ง€ ์•Š๋Š”๋‹ค.

4) Phases

  • ๊ฐ€๋ น, ‘๋ฐ”๋ณด๋ฐ”๋ณด’์™€ ‘๋ณด๋ฐ”๋ณด๋ฐ”’๋ผ๊ณ  ํ• ๋•Œ ์‚ฌ๋žŒ์€ ๊ตฌ๋ถ„ํ•˜์ง€ ๋ชปํ•œ๋‹ค.


5) ํ•œ๊ธ€์˜ ๋ชจ์Œ

  • ์†Œ๋ฆฌ์˜ ๋†’๋‚ฎ์ด (pitch) : ํ•œ๊ธ€์˜ ๋ชจ์Œ์ด ๊ฒฐ์ •ํ•œ๋‹ค.
  • ์†Œ๋ฆฌ์˜ ํฌ๊ธฐ (volume) : ๋ชจ์Œ์ด ๊ฒฐ์ •ํ•œ๋‹ค.
  • ์ž์Œ์˜ ๊ฒฝ์šฐ noise ์ฒ˜๋Ÿผ ํŒŒ๋™์ด ์ฐํžŒ๋‹ค. (์ง€์ง€์ง-)

6) Vowel cues - ๋ชจ์Œ์†Œ๋ฆฌ

  • energy๊ฐ€ boost๊ฐ€ ๋˜์–ด์žˆ๋Š” F!, F2์„ ์ด์šฉํ•˜์—ฌ ๋ชจ์Œ์„ ๊ตฌ๋ถ„
  • ์ค‘์š”ํ•œ ๋‹จ์„œ: Formant frequencies(์ฃผํŒŒ์ˆ˜), ํŠนํžˆ F1, F2
  • F1: Height
    • high vowel: F1 ์ด ๋‚ฎ๋‹ค. - low vowel ์ด๋ฉด F1์ด ๋†’๋‹ค.
  • F2: Backness ๋ฐœ์Œ: (์šฐ,์—)
    • back vowel: F2 ๊ฐ€ ๋‚ฎ๋‹ค.
    • ๋Œ€๋ถ€๋ถ„ F1, F2๋งŒ ๋ด๋„ ๋ชจ์Œ ๊ตฌ๋ถ„ ํ•˜๋Š” ๊ฒŒ ๊ฐ€๋Šฅํ•˜๋‹ค.
  • F3: Backness, ์ž…์ˆ ์˜ ๋ชจ์–‘ (๋™๊ทธ๋ž€์ง€ ์•„๋‹Œ์ง€)

- Examples of formant frequencies of English monophthongs

  • ํ•˜๋‚˜๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์žก๊ณ , high front vowel ๋ณด๋ฉด์„œ ํŒ๋‹จ? - ์•„๋‹์ˆ˜๋„
  • ex) ์•„์ดํฐ ์ฒซ ์„ค์ •์‹œ “์‹œ๋ฆฌ์•ผ”๋ผ๊ณ  ๋งํ•˜๋Š”๊ฒƒ

7) Consonant cues - ์ž์Œ ์†Œ๋ฆฌ

  • Stop sound - ์ž…์„ ์—ฌ๋Š” ์ˆœ๊ฐ„ ๊ณต๊ธฐ๊ฐ€ ํ„ฐ์ง„๋‹ค. ์ž…์„ ๋‹ซ๊ณ  ์—ฌ๋Š” ์†Œ๋ฆฌ ex) ํŒŒํŒŒํŒŒํŒŒ, ์Šค์Šค์Šค์Šค
    • ์„ธ๋กœ๋กœ ํŒก ํ„ฐ์ง€๋Š” ํŠน์ง•์ด ์žˆ๋‹ค. - vertical line์œผ๋กœ ๋ณด์ธ๋‹ค.
    • vertical line์ด ์ŽŒ์ˆ˜๋ก ๋ฌด์„ฑ์Œ ์ด๋‹ค.
    • ์ž์Œ ์ค‘์—์„œ ๊ตฌ๋ถ„ํ•˜๊ธฐ๊ฐ€ ์ œ์ผ ์‰ฝ๋‹ค.
    • ๋ฌด์„ฑ์Œ ์€ ๊ณต๊ธฐ๊ฐ€ ๋‚˜์˜ค๋Š” ์‹œ๊ฐ„์ด ๊ฑธ๋ฆฐ๋‹ค. ๋ชจ์Œ์„ ๋งŒ๋“ค๊ธฐ ์œ„ํ•˜์—ฌ ์„ฑ๋Œ€๊ฐ€ ์ง„๋™์„ ํ•ด์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ.

8) Fricatives - ๋งˆ์ฐฐ์Œ

  • ๊ณต๊ธฐ์˜ ๋งˆ์ฐฐ์ด ๋งŽ์ด ์ผ์–ด๋‚œ๋‹ค.
  • ์œ ์„ฑ์Œ VS ๋ฌด์„ฑ์Œ
    • ์œ ์„ฑ์Œ์ด ์—ฐํ•˜๊ณ , ๋ฌด์„ฑ์Œ์ด ์ง„ํ•˜๋‹ค.

9) Affricates

  • F2 & Frcative๊ฐ€ ์„ž์—ฌ ์žˆ๋‹ค.

10) Nasals

  • ์ž์Œ์ด๊ธด ํ•˜์ง€๋งŒ ์ž์Œ ์ค‘์—์„œ ๊ณต๋ช…์ด ์ œ์ผ ์Žˆ ์†Œ๋ฆฌ
  • ๋ชจ์Œ๋ณด๋‹ค๋Š” ์†Œ๋ฆฌ์˜ ํฌ๋ฏธํ•˜๋‹ค
  • ๋ชจ์Œ์—์„œ ๋ชจ์Œ์œผ๋กœ ์ด์–ด์ง€๋Š” ๋ถˆ์—ฐ์†์  ์†Œ๋ฆฌ

11) Liquids & glides

  • ์ž์Œ์ค‘์—์„œ ๊ณต๋ช…ํ•˜๋Š” ์†Œ๋ฆฌ, ์ด์ค‘๋ชจ์Œ ๋งŒ๋“ค๋•Œ ๋‚œ๋‹ค.
  • ๋ชจ์Œ๊ณผ ๋น„์Šทํ•˜์ง€๋งŒ ๋” ํฌ๋ฏธํ•œ ํ˜•ํƒœ

12) Prosody (suprasegmental features ์ดˆ๋ถ„์ ˆ์ ์š”์†Œ)

  • ๊ฐ•์„ธ, ์–ต์–‘๊ฐ™์€๊ฑด ๋งŽ์€ ์ •๋ณด๋ฅผ ์ „๋‹ฌํ•œ๋‹ค.

13) Intonation as a phonemic feature

  • variation์ด ๋งŽ๋‹ค.
  • ์„ธ๊ทธ๋จผํŠธ ๋ฌธ์ž์—ด์€ ์˜๋ฏธ๊ฐ€ ๋ชจํ˜ธํ•  ์ˆ˜ ์žˆ๋‹ค. → ์–ต์–‘์— ๋”ฐ๋ผ ๋ง์˜ ์˜๋ฏธ๋ฅผ ๋ชจํ˜ธํ•˜๊ฒŒ ํ• ์ˆ˜๋„
  • pitch๋กœ ๋ณด๋ฉด ์Œ์˜ ๋†’๋‚ฎ์ด๋ฅผ ์•Œ ์ˆ˜ ์žˆ๋‹ค.
  • Intonation์ด ์‹ค์ œ๋กœ ์Œ์„ฑ์—์„œ ํฐ ์—ญํ• 

14) Intonation typology

  • Falling - ์˜์–ด
  • Risimg - ํ•œ๊ตญ์–ด

15) Phonology (์Œ์šด๋ก )

  • Phonology๋Š” ์–ด๋–ค ์†Œ๋ฆฌ์˜ ์กฐํ•ฉ์ด ์‹ค์ œ ๋‹จ์–ด๊ฐ€ ๋  ์ˆ˜ ์žˆ๋Š”์ง€, ๊ทธ๊ฒƒ์ด ์‚ฌ์‹ค์ธ์ง€ ์•„๋‹Œ์ง€, ๊ทธ๋ฆฌ๊ณ  ์–ด๋–ค ์†Œ๋ฆฌ์˜ ์กฐํ•ฉ์ด ์‹ค์ œ ๋‹จ์–ด๊ฐ€ ๋  ์ˆ˜ ์—†๋Š”์ง€๋ฅผ ์•Œ๋ ค์ค€๋‹ค.
  • sound: ๋ฐ”๋ณด (2๋ฒˆ ‘ใ…‚’ ์€ ์•ž์— ๋ชจ์Œ ์†Œ๋ฆฌ - ๋ชจ์Œ์†Œ๋ฆฌ๋Š” ๋‹ค ์œ ์„ฑ์Œ)
  • 1๋ฒˆ ‘ใ…‚’์€ ์•ž์—๋งŒ ์œ ์„ฑ์Œ, ๋‚˜๋จธ์ง€๋Š” ์—†์Œ.
    • ์œ ์„ฑ์Œ์ด ์‹คํ˜„๋˜๋ ค๋ฉด ์†Œ๋ฆฌ ๋‘๊ฐœ๋‹ค ์œ ์„ฑ์Œ์ด์—ฌ์•ผ ํ•œ๋‹ค.

โœ“ black

โœ“ blick: lexical (accidental) gap - blick - ์˜์–ด์—์„œ ์กฐํ•ฉ ๊ฐ€๋Šฅํ•œ ์†Œ๋ฆฌ (์‹ค์ œ๋กœ๋Š” ์—†์Œ-๋‹จ์–ด)

โœ“ lbick: impossible word - ์กฐํ•ฉ ๋ถˆ๊ฐ€๋Šฅํ•œ ๋‹จ์–ด