자연언어처리 분야에서 표준은 서로 다른 주체가 생성한 언어 자원을 공유하기 위한 상호호환성을 보장하기 위해 필요하다. 새로운 언어 자원을 구축하는 기준이 되기도 하지만 기구축된 언어 자원을 재사용하거나 병합하는데에도 표준은 중요한 역할을 하게 된다. 공개된 언어 자원이 누구에게나익숙하고 접근 가능한 표준적인 형식으로 되어 있다면 연구의 재연성이 보장되고 개인과 기관, 대학 등에서 산발적으로 구축한 언어 자원이 연구의 신뢰도를 높일 만한 수준의 규모로 재구성될 수 있다.
형태 주석과 관련한 국제 표준은 ‘Morpho-syntactic annotation framework’ 이고 ‘Word segmentation of written text’은 동북아 언어의 단어 분할 단위설정을 위해 따로 만든 국제 표준이다. 한국정보통신기술협회에서 관리하는국내 표준은 최근 21세기 세종계획의 형태 분석 지침을 바탕으로 갱신되었는데 내적 일관성과 언어 단위의 적용 면에서 개선이 필요하다. 국제 표준을현지화하기 위해서는 한국어 기준 표준 모형, 가이드라인이 개발되어야 하고, 언어 자원에 표준을 일관되게 적용하기 위해서는 지침의 기계가독화 노력이 필요하다.