지식 베이스 생성 및 관리

이 가이드는 지식 베이스 생성, 설정, 관리를 다룹니다.

참고: 지식 베이스 개요

지식 베이스 보기

  1. 워크스페이스 → 지식으로 이동
  2. 접근 가능한 모든 지식 베이스가 표시됩니다

이름, 소유자, 접근 수준, 파일을 보여주는 지식 베이스 목록

각 지식 베이스는 다음을 표시합니다:

  • 이름 — 지식 베이스 식별자
  • 소유자 — 만든 사람
  • 접근 — 공개 (모든 사용자) 또는 비공개 (그룹 제한)
  • 생성 — 생성 날짜
  • 파일 — 업로드된 문서 수

지식 베이스 만들기

1단계: "지식 추가" 클릭

지식 페이지의 "+ 지식 추가" 버튼을 클릭하세요. 이름, 소유자, 접근 수준, 파일을 보여주는 지식 베이스 목록

2단계: 기본 정보 입력

입력:

  • 이름 (필수) — 이 지식 베이스의 고유 식별자
  • 설명 (선택) — 포함된 문서에 대한 간략한 설명 이름, 소유자, 접근 수준, 파일을 보여주는 지식 베이스 목록

3단계: 설정 구성 (선택 사항)

생성 전에 설정을 클릭하여 구성:

접근, 파서, 청킹, 검색 옵션이 있는 지식 베이스 설정

설정목적
접근공개 (모든 사용자에게 표시) 또는 비공개 (그룹 제한)
파서콘텐츠 추출 엔진 URL
청킹문서를 세그먼트로 분할하는 방법
검색하이브리드 검색, 리랭킹, 랭킹 설정

팁: 확실하지 않으면 기본 설정을 사용하세요. 나중에 변경할 수 있습니다.

4단계: 만들기 클릭

지식 베이스가 생성되고 파일 업로드를 시작할 수 있습니다.

지식 베이스 설정 편집

생성 후 지식 베이스를 사용할 준비가 됩니다. 지식 베이스 내부의 설정 (오른쪽 상단)을 클릭하여 수정:

파일 업로드를 위해 준비된 지식 베이스

수정 가능한 항목:

  • 이름 — 지식 베이스 이름 변경
  • 설명 — 설명 업데이트
  • 접근 — 공개에서 비공개로 변경
  • 접근 그룹 — 특정 그룹으로 제한
  • 파서 — 추출 엔진 변경
  • 청킹 — 청크 전략 및 크기 조정
  • 검색 — 하이브리드 검색 및 리랭킹 조정

고급 설정

청킹 및 검색을 위한 지식 베이스 고급 설정

청킹 전략

고정 크기 (전략 A)

  • 문서를 고정 크기 세그먼트로 분할
  • 간단하고 안정적
  • 최적: 균일한 콘텐츠

부모-자식 (전략 E)

  • 더 큰 컨텍스트의 부모 청크 생성
  • 세부 검색을 위한 자식 청크
  • 최적: 복잡한 계층적 문서

HTML 인식 (전략 H)

  • HTML 구조 존중 (제목, 섹션 등)
  • 최적: 웹 스크랩된 콘텐츠
  • 문서 계층 구조 보존

검색 설정

하이브리드 검색

  • 벡터 유사성과 BM25 키워드 검색 결합
  • 벡터 검색만으로 보다 정확
  • BM25 가중치 조정 필요 (0 = 순수 벡터, 1 = 순수 키워드)

리랭킹

  • 검색된 청크를 관련성에 따라 재순위 지정
  • 더 정확하지만 느림
  • 선택 사항; 정확도보다 성능이 중요하면 생략

Top K 및 Top K 리랭커

  • Top K — 벡터 DB에서 검색할 청크 수
  • Top K 리랭커 — 재순위 지정할 수
  • Top K=10, Top K 리랭커=5로 시작