PDF, 영수증, 문서 이미지에서 표 데이터를 자동으로 추출합니다. OCR 기술로 텍스트를 인식하고 CSV, JSON 형식으로 구조화하여 다운로드할 수 있습니다. 경비 정리, 데이터 입력, 문서 디지털화에 활용하세요.
PDF 또는 이미지를 드래그하거나 클릭하여 업로드
PDF, JPG, PNG 지원 (최대 20MB)PDF 파일이나 영수증, 문서 이미지(JPG, PNG)를 업로드하세요. 표가 포함된 문서라면 어떤 형식이든 처리할 수 있습니다. 이미지는 선명할수록 더 정확한 결과를 얻을 수 있습니다.
문서에 사용된 언어를 선택하세요. 한국어, 영어, 일본어를 지원하며, 혼합된 경우 자동 감지를 사용하세요. 언어를 정확히 선택할수록 텍스트 인식 정확도가 높아집니다.
"표 추출하기" 버튼을 클릭하면 OCR이 실행됩니다. PDF는 먼저 이미지로 변환된 후 텍스트를 인식합니다. 진행 상황이 실시간으로 표시됩니다.
추출된 표를 미리보기에서 직접 편집할 수 있습니다. 셀을 클릭하여 수정하고, 행/열을 추가하거나 삭제할 수 있습니다. 완성된 데이터는 CSV나 JSON 파일로 다운로드하거나 클립보드에 복사할 수 있습니다.
식당, 마트, 온라인 쇼핑 영수증을 촬영하여 업로드하면 항목, 수량, 금액이 자동으로 표로 추출됩니다. 경비 보고서 작성 시간을 대폭 단축할 수 있습니다.
PDF로 된 은행 거래내역이나 카드 명세서를 업로드하여 거래 데이터를 CSV로 추출하세요. 엑셀이나 회계 소프트웨어에 바로 붙여넣어 분석할 수 있습니다.
종이 문서의 가격표, 일정표, 성적표 등 표 형식 데이터를 디지털화합니다. 수작업 입력 없이 자동으로 구조화된 데이터를 얻을 수 있어 업무 효율이 크게 향상됩니다.
논문이나 보고서 PDF에서 연구 데이터 표를 추출하여 재분석에 활용하세요. 이미지로 삽입된 표도 OCR로 텍스트 데이터로 변환할 수 있습니다.
PDF, JPG, PNG 형식을 지원합니다. PDF의 경우 각 페이지가 이미지로 변환된 후 OCR 처리됩니다. 스캔된 PDF와 디지털 생성 PDF 모두 처리 가능하지만, 디지털 PDF에서 더 높은 정확도를 얻을 수 있습니다. 최대 파일 크기는 20MB입니다.
선명한 인쇄 문서에서는 95% 이상의 정확도를 달성합니다. 손글씨나 저화질 이미지는 인식률이 낮아질 수 있습니다. 표 구조 인식은 표 선이 명확하고 셀 구분이 뚜렷한 문서에서 가장 잘 작동합니다. 추출 후 편집 기능으로 오류를 바로 수정할 수 있습니다.
모든 처리는 브라우저 내에서 이루어지며 서버로 파일이 전송되지 않습니다. 영수증, 명세서 등 개인정보가 포함된 문서도 안전하게 처리할 수 있습니다. 페이지를 새로고침하면 업로드된 파일과 추출 데이터가 모두 삭제됩니다.
CSV는 엑셀, 구글 스프레드시트 등 스프레드시트 프로그램에서 바로 열 수 있어 데이터 분석이나 편집 용도에 적합합니다. JSON은 웹 개발자나 프로그래밍으로 데이터를 처리할 때 적합합니다. 일반 사용자에게는 CSV를 추천합니다.
이미지 품질을 개선하거나 OCR 언어를 바꿔서 다시 시도해보세요. 추출된 표는 직접 편집할 수 있으며, 행과 열을 추가하거나 셀 내용을 수정할 수 있습니다. 표 구조가 복잡하거나 비정형인 경우에는 수동 편집이 필요할 수 있습니다.
현재 버전은 PDF의 첫 번째 페이지를 처리합니다. 여러 페이지를 처리하려면 PDF 분할 도구로 페이지를 나눠서 개별 처리하거나, PDF를 이미지로 변환한 후 각 페이지를 순서대로 업로드하세요.
OCR(광학 문자 인식) 기술과 PDF 렌더링을 결합하여 문서 이미지에서 표 데이터를 자동 추출합니다. 브라우저에서 완전히 처리되므로 개인정보가 외부로 유출되지 않으며, CSV와 JSON 형식으로 손쉽게 내보낼 수 있습니다.
OCR 기반 표 추출은 이미지 내 문자를 인식한 후 위치 정보를 분석하여 행과 열 구조를 재구성합니다. Tesseract OCR 엔진은 구글이 개발한 오픈소스 엔진으로, 100개 이상의 언어를 지원하고 딥러닝 기반의 LSTM 신경망을 활용하여 높은 정확도를 제공합니다. PDF.js는 Mozilla가 개발한 PDF 렌더링 라이브러리로, 브라우저에서 직접 PDF를 이미지로 변환할 수 있습니다. 두 기술의 결합으로 다양한 문서 형식의 표를 효율적으로 추출할 수 있습니다.
표 추출 기술은 재무 데이터 자동화, 문서 디지털화, 데이터 마이그레이션 등 다양한 비즈니스 프로세스에서 핵심 역할을 합니다. 경비 관리 부서에서는 수백 장의 영수증을 자동으로 처리하여 데이터 입력 시간을 90% 이상 단축할 수 있습니다. 회계 팀은 은행 명세서나 카드 내역을 자동으로 구조화하여 회계 소프트웨어에 직접 가져올 수 있습니다. 연구자들은 논문의 데이터 표를 손쉽게 추출하여 메타 분석에 활용할 수 있습니다.
최상의 추출 결과를 위해서는 이미지 품질이 가장 중요합니다. 300DPI 이상의 해상도로 스캔하거나 촬영한 이미지, 표 선이 명확하게 보이는 문서, 배경과 텍스트 간의 명확한 대비가 필요합니다. 또한 문서의 기울기가 없이 수평으로 정렬된 이미지, 얼룩이나 번짐이 없는 깨끗한 인쇄물이 최상의 결과를 만듭니다. 추출 후에는 편집 기능을 활용하여 인식 오류를 수정하고, 필요한 경우 행과 열을 추가하여 완성도를 높이세요.