본 서비스를 이용할 수 있는 브라우저는 Internet Explorer, Chrome, Microsoft Edge, FireFox, Opera, Naver Whale 등 입니다. 단, 낮은 버전의 Internet Explorer에서는 일부 기능이 동작하지 않을 수 있으며, Apple Safari는 사용할 수 없습니다.
본 서비스는 '인공지능 한자 문자인식 모델'을 활용하여 한자 고문헌 이미지 속의 한자를 인식하여 디지털 한자 텍스트로 출력해줍니다.
본 서비스에서 활용하는 '인공지능 한자 문자인식 모델'은 고도서, 고문서 등의 한자 고문헌 이미지를 학습하여 개발되었습니다.
'‘인공지능 한자 문자인식 모델'의 문자인식 결과는 정확하지 않을 수 있으므로, 문자인식 결과를 활용할 때는 반드시 유의해야 합니다.
판본(인쇄본, 필사본) 명칭으로 구분된 탭을 선택하여 보다 전문화된 문자인식 기능을 이용할 수 있습니다. ①<인쇄본> : 해서체(정자체) 또는 행서체(해서체와 초서체의 중간)로 작성된 한자 자료의 문자인식 ②<필사본> : 초서체로 작성된 한자 자료의 문자인식 ※전서체나 예서체로 작성된 한자 자료는 인식하지 못하거나, 인식률이 낮을 수 있습니다.
입력한 이미지 속의 한자를 인식하는 방향을 선택할 수 있습니다. ● 세로읽기 : 우종서(右縱書). 오른쪽 줄부터 왼쪽으로. 위에서 아래로. 한자 고문헌의 일반적 읽기/쓰기 형태 ● 가로읽기 : 좌횡서(左橫書). 왼쪽에서 오른쪽으로, 윗 줄부터 아래로. 현대의 일반적 읽기/쓰기 형태
1회에 최대 10개의 이미지를 입력(업로드) 하여 문자인식을 실행할 수 있습니다.
[선택영역 인식] 기능을 이용하면 업로드한 이미지 속에서 사용자가 원하는 특정 영역만 선택하여 문자인식을 할 수 있으며, [선택영역 인식] 기능을 이용하려면 1개의 이미지만을 업로드 해야 합니다.
문자인식에는 이미지 1개 당 평균 3초 이내의 시간이 소요되지만, 인터넷 이용 환경에 따라 시간이 더 소요될 수 있습니다.
문자인식 대상 이미지가 왜곡(기울어짐, 돌아감 등)되지 않고, 밝고 선명할수록 인식률이 더 좋아집니다. ①원본을 정면에서 정확하게 촬영하거나 스캐닝한 이미지가 가장 좋습니다. ②금석문(金石文. 금속성 재료나 석재에 새겨진 글)을 촬영한 이미지나 탁본 이미지는 인식률이 떨어질 수 있습니다.
문자인식이 가능한 이미지 파일의 포맷은 JPEG, PNG이며 컬러보다는 흑백 이미지를 더 잘 인식합니다.
이미지 주소를 입력하는 방법으로 웹서비스 상의 이미지를 바로 불러와 입력(업로드)하여 문자인식을 이용할 수도 있습니다. 이때는 이미지가 제공되는 웹서비스의 주소가 아니라, 해당 이미지만의 고유 주소를 찾아서 입력해야 합니다. ※웹서비스 상에서의 이미지 고유 주소는 해당 이미지 위에서 마우스를 우클릭 했을 때, 브라우저에 따라 '이미지 주소 복사', '이미지 링크 복사' 등의 기능으로 확인할 수 있습니다.
문자인식을 1회 실행한 후에는 [새작업] 버튼을 클릭해야만 새로운 시도를 할 수 있습니다.
<원문 텍스트> 창에는 인식된 한자 텍스트가 출력됩니다. ①창 우측 하단의 더하기(+), 빼기(-) 버튼을 클릭하여 텍스트의 크기를 확대하거나 축소할 수 있습니다. ②인식된 한자 텍스트는 마우스로 드래그 후 키보드에서 Ctrl+C 키를 누르거나, 화면의 [복사] 버튼을 클릭하여 복사할 수 있습니다. ②[내려받기] 버튼을 클릭하면, 문장분절 결과를 내 컴퓨터에 다운로드 할 수 있습니다. (txt 파일)
화면에서 제공되는 한자의 음·훈 정보는 '유니코드 한자'를 기반으로 합니다. 음·훈 정보가 출력되지 않는 한자는 유니코드에 음훈 정보가 존재하지 않는 경우입니다.
<원문 텍스트> 창에 출력된 인공지능 문자인식 결과인 한자 텍스트는 마우스를 좌클릭하여 수정할 수 있습니다.
<원문 텍스트> 창에서의 사용자 수정내역은 추후 더 나은 '인공지능 한자 문자인식 모델'의 개발을 위한 학습용 데이터로 사용될 수 있습니다.
본 서비스는 이미지수를 기준으로 하루에 최대 10장까지 이용할 수 있습니다. 한 번에 10장의 이미지를 입력(업로드)하여 문자인식을 실행할 경우, 당일 이용이 완료됩니다.
인공지능 문자인식 학습용 데이터의 원시데이터 제공기관 : 한국국학진흥원, 서울대학교 규장각한국학연구원, 한국학중앙연구원