제품개요
MIR-Clipper는 사용자가 원하는 영역만을 선택하여 자동으로 추출하고 선택정보를 구조화시켜 저장하는 수집 로봇으로써, 다양한 형태로 제작된 웹페이지의 컨텐츠를 빠르고 정확하게 수집할 수 있는 웹 문서 수집 엔진입니다.
특징
① 강력한 수집 기능 자동 또는 수동 수집 Rule 지정을 통한 다양한 웹 문서 및 Web2.0(Ajax 페이지, RSS 등) 문서 수집이 가능하며, JavaScript 및 인증이 필요한 페이지 수집도 가능합니다. 또한 수집 화면을 저장할 수 있어 다양한 서비스가 가능합니다. ② 편리한 관리 도구 관리기 내에서 로봇의 구동 상태 점검 및 수집 통계 조회 기능을 제공하며, 정보원 등록 마법사 기능 제공, 완벽한 테스트 환경(시뮬레이션 도구)을 지원합니다. 또한 수집, 누적수집, 에러, 수집원등록 수, 수집원 종류별 일/월/년 단위의 통계기능을 제공합니다. ③ 편리하고 강력한 프로그램 도구 반복되는 스크립트를 공통으로 관리하기 위한 라이브러리 기능, 웹문서 분석 기능, 작성된 스크립트의 테스트(수집 시뮬레이션) 기능 등 편리하고 강력한 스크립트 작성 도구를 제공합니다.
Architecture
다양한 형태로 제작된 웹페이지의 컨텐츠를 빠르고 정확하게 수집할 수 있는 웹 문서 수집엔진 MIR-Clipper의 시스템 구성입니다.