반응형
말뭉치
-
AI, 자연어처리(NLP) 등에 활용 위해 10억 어절 '국어 말뭉치' 내년 구축·보급된다NEWS SUMMARY 2018. 12. 12. 07:03
10년 전 구축한 세종말뭉치 2억 어절에 신규로 8억 어절을 구축, 모두 10억 어절의 말뭉치를 인공지능(AI)과 언어처리 산업에 필요한 기초자료로 제공하게 된다정부도 자연어처리 등 AI의 핵심기술 개발을 위한 국어 자료 구축이 필요하다고 판단해 내년도 국립국어원 예산 중 연간 사업비 140억원 외에 말뭉치 구축만을 위한 예산 204억원을 별도로 책정했으며, AI 기술 개발을 위해 올해 3100만 어절로 이뤄진 말뭉치’를 새롭게 구축했으며, 내년까지 10억 어절을 말뭉치로 구축하고 이를 관련 기술 개발 등을 추진하는 기관이나 기업 등에 제공한다고 밝혔다이에 따라 각국은 국가 경쟁력 차원에서 사업을 추진, 일본의 경우 150억 어절, 중국은 300~800억 어절, 미국은 300억 어절을 구축, AI 개발에..