닫기

학교공지

A.I(인공지능) 학습용 데이터 구축 사업 참가자 모집

  • 분류산학협력단
  • 작성자산학협력단
  • 등록일2020-10-23
  • 조회수231

 

A.I(인공지능) 학습용 데이터 구축 사업 참가자 모집

- 주요 내용

방언을 사용하는 일상 대화를 인식하여 음성을 문자로 실시간으로 변환하고, 텍스트를 방언 음성으로 합성 할 수 있는 기술 개발을 위한 방언 발화 데이터셋 구축

- 데이터 구축량

조용한 환경에서 2,000명 이상의 화자가 발화한 성별, 연령별 지정 길이의 3,000시간 이상의 음성 데이터 셋

원본 표준어 텍스트 및 방언 특성을 고려하여 그대로 전사한 텍스트 50만건

- 데이터 형식

원본형태 : 화자가 구분된 담회 텍스트 말뭉치

학습용 데이터 형태 : 방언 발화된 음성 데이터가 맵핑된 텍스트와 음성 데이터 셋

 

전라도 방언 수행과제 참가자 모집

음성수집

- 두 사람이 특정주제 및 분야로 자유롭게 대화

- 대화내용을 녹음하고 정제(각 도별 3,000시간, 대화당 15분 이하)

- 해당 녹음 자료에 대한 저작원 이용 허락 계약서 체결

- 여러 분야에서 활용할 수 있는 범용적인 문장

 

전사작업

- 화자를 통해 녹음된 음성자료를 대상으로 작업 지침에 따라 전사작업을 수행하고 교차 검수를 진행

- 전사 가이드라인 지침

- 발화된 그대로 전사하는 발음전사와 한글 맞춤법 및 표준어 규정에 따른 철자전사를 병행하여 전사하는 것을 기본 원칙으로 함

- 그 외 화자 표시, 전사단위, 발화겹침, 불완전한 발화, 띄어쓰기 등 세부 내용은 국립국어원이 제시한 전사 지침을 따름

 

 

1. 음성수집 화자모집

- 두 사람이 특정주제 및 분야로 자유롭게 대화

- 대화내용을 녹음하고 정제(각 도별 3,000시간, 대화당 15분 이하)

- 인건비 측정 : 대면(1시간당 2,5000), 비대면(1시간당 20,000)

- 화자모집 인력 : 20~60대 연령대별, 남성/여성 발화자는 각각 100명 이상 필요

- 문의 : kimjh@saltlux.com 또는 010-3341-3069

 

 

 

 

2. 전사작업 참가자 모집

- 화자를 통해 녹음된 음성자료를 대상으로 가이드라인 지침에 따라 전사 작업을 수행

- 인건비 : 1,800,000(월 기준) / 정해진 전사 작업량을 모두 완료하였을 경우 지급

· 작업량 : 하루 작업건수는 4~5

 

3. 품질검수 참가자 모집

- 전사한 내용에 대하여 품질검수 수행

- 인건비 : 1,800,000(월 기준) / 정해진 품질검수 작업량을 모두 완료하였을 경우 지급

· 작업량 : 하루 작업건수는 4~5

 

 
비밀번호 :