-
AI, 자연어처리(NLP) 등에 활용 위해 10억 어절 '국어 말뭉치' 내년 구축·보급된다NEWS SUMMARY 2018. 12. 12. 07:03반응형
10년 전 구축한 세종말뭉치 2억 어절에 신규로 8억 어절을 구축, 모두 10억 어절의 말뭉치를 인공지능(AI)과 언어처리 산업에 필요한 기초자료로 제공하게 된다
정부도 자연어처리 등 AI의 핵심기술 개발을 위한 국어 자료 구축이 필요하다고 판단해 내년도 국립국어원 예산 중 연간 사업비 140억원 외에 말뭉치 구축만을 위한 예산 204억원을 별도로 책정했으며, AI 기술 개발을 위해 올해 3100만 어절로 이뤄진 말뭉치’를 새롭게 구축했으며, 내년까지 10억 어절을 말뭉치로 구축하고 이를 관련 기술 개발 등을 추진하는 기관이나 기업 등에 제공한다고 밝혔다
이에 따라 각국은 국가 경쟁력 차원에서 사업을 추진, 일본의 경우 150억 어절, 중국은 300~800억 어절, 미국은 300억 어절을 구축, AI 개발에 쓰고 있다
반응형'NEWS SUMMARY' 카테고리의 다른 글
마이크로소프트, 개발자 위한 최신 AI 서비스 및 개발 툴 대거 발표 (0) 2018.12.13 안면 인식 기술 규제, 이제는 행동을 취해야 할 때... (0) 2018.12.12 미국 웹사이트에서 개인 정보 자주 노출돼 (0) 2018.11.15 개인정보보호법 개정안, 내년까지 2단계로 입법 (0) 2018.11.15 심층 콘볼루션 신경망으로 저화질 비디오를 고화질 비디오로 시청한다 (0) 2018.10.30