학교공지
A.I(인공지능) 학습용 데이터 구축 사업 참가자 모집
- 분류산학협력단
- 작성자산학협력단
- 등록일2020-10-23
- 조회수231
A.I(인공지능) 학습용 데이터 구축 사업 참가자 모집
- 주요 내용
방언을 사용하는 일상 대화를 인식하여 음성을 문자로 실시간으로 변환하고, 텍스트를 방언 음성으로 합성 할 수 있는 기술 개발을 위한 방언 발화 데이터셋 구축
- 데이터 구축량
∙ 조용한 환경에서 2,000명 이상의 화자가 발화한 성별, 연령별 지정 길이의 3,000시간 이상의 음성 데이터 셋
∙ 원본 표준어 텍스트 및 방언 특성을 고려하여 그대로 전사한 텍스트 50만건
- 데이터 형식
∙ 원본형태 : 화자가 구분된 담회 텍스트 말뭉치
∙ 학습용 데이터 형태 : 방언 발화된 음성 데이터가 맵핑된 텍스트와 음성 데이터 셋
□ 전라도 방언 수행과제 참가자 모집
○ 음성수집
- 두 사람이 특정주제 및 분야로 자유롭게 대화
- 대화내용을 녹음하고 정제(각 도별 3,000시간, 대화당 15분 이하)
- 해당 녹음 자료에 대한 저작원 이용 허락 계약서 체결
- 여러 분야에서 활용할 수 있는 범용적인 문장
○ 전사작업
- 화자를 통해 녹음된 음성자료를 대상으로 작업 지침에 따라 전사작업을 수행하고 교차 검수를 진행
- 전사 가이드라인 지침
- 발화된 그대로 전사하는 발음전사와 한글 맞춤법 및 표준어 규정에 따른 철자전사를 병행하여 전사하는 것을 기본 원칙으로 함
- 그 외 화자 표시, 전사단위, 발화겹침, 불완전한 발화, 띄어쓰기 등 세부 내용은 국립국어원이 제시한 전사 지침을 따름
1. 음성수집 화자모집
- 두 사람이 특정주제 및 분야로 자유롭게 대화
- 대화내용을 녹음하고 정제(각 도별 3,000시간, 대화당 15분 이하)
- 인건비 측정 : 대면(1시간당 2,5000원), 비대면(1시간당 20,000원)
- 화자모집 인력 : 20대~60대 연령대별, 남성/여성 발화자는 각각 100명 이상 필요
- 문의 : kimjh@saltlux.com 또는 010-3341-3069
2. 전사작업 참가자 모집
- 화자를 통해 녹음된 음성자료를 대상으로 가이드라인 지침에 따라 전사 작업을 수행
- 인건비 : 총 1,800,000원(월 기준) / 정해진 전사 작업량을 모두 완료하였을 경우 지급
· 작업량 : 하루 작업건수는 4개~5개
3. 품질검수 참가자 모집
- 전사한 내용에 대하여 품질검수 수행
- 인건비 : 총 1,800,000원(월 기준) / 정해진 품질검수 작업량을 모두 완료하였을 경우 지급
· 작업량 : 하루 작업건수는 4개~5개
- 첨부파일
- 전라도 방언 수행 계획1022.hwp
- 다음글
- 강의제작 운영지원 온라인 원격도우미 사업 정책연구 공모 안내(한국대학교육협의회)
- 2020-10-26
- 이전글
- 코로나19 위기 극복, 응급혈액 확보를 위한 헌혈 행사실시 안내
- 2020-10-19