한국어가 고맥락어라고 하는데...
발화와 크게 상관없는 맞춤법조차도 맥락 이해가 필요합니다.

예를 들자면:
잘살다 - 부유하게 살다
잘 살다 - 멀쩡하게/평화롭게/행복하게... 살고 있다

안되다 (동사) - 잘되다의 반댓말
안되다 (형용사) - 불쌍하다의 뜻
안 되다 - 뭐가 실제로 실행 불가능

트랙터가 안 돼서 농사가 안됐지, 참 안된 이야기야
(트랙터가 동작하지 않아서 농사가 흉작이 되었으므로 불쌍하다)

근데 놀랍게도 의미 상관없이 적용되는 맞춤법도 있습니다. (예시: “잘 안되다” 구성)

극악이에요 극악
한국어 맞춤법/띄어쓰기 검사의 완전한 자동화는 과연 가능할까요?

"생각밖에있는것을생각밖에둘수는없다"라는 문장을 "생각밖에 있는 것을 생각밖에 둘 수는 없다"라고 쓴다면 네이티브 한국어 화자는 직관적으로 이상한데? 할텐데, 기계는 그렇지 않지요. 나라인포테크, 네이버, 다음 모두 잘못된 결과를 보여주고 있습니다. 한국어 맞춤법/띄어쓰기는 문장의 의미를 정확히 이해/유추한 다음에야 적용할 수 있도록 만들어졌기 때문에, 의미를 이해하지 못하고 앞뒤 단어와 용례에만 의지하는 기계에게는 굉장히 어려운 작업일 수밖에 없습니다.

Comments