지식 설정

문서 처리 방법에 대한 시스템 전체 기본값을 구성하세요. 개별 지식 베이스는 이 설정을 재정의할 수 있습니다.

참고: 글로벌 설정 개요

지식 설정 접근

파서, 청킹, 검색, 임베딩 구성 패널이 있는 지식 설정 페이지

콘텐츠 추출 엔진 URL — 문서를 텍스트로 파싱하는 서비스.

이 엔진은:

구성:

문서를 세그먼트로 분할하는 방법에 대한 글로벌 기본값:

팁: 프로덕션 기본값을 변경하기 전에 플레이그라운드에서 설정을 테스트하세요.

문서를 찾는 방법에 대한 글로벌 기본값:

임베딩 모델과 엔진 구성:

설정	목적
엔진	openai, ollama, 또는 azure_openai
모델	임베딩 모델 이름
배치 크기	한 번에 임베딩할 청크 수
공급자 URL	임베딩 서비스 엔드포인트

청킹: 고정 크기
  - 청크 크기: 1000 토큰
  - 겹침: 200 토큰
  - 최소 크기: 200 토큰

검색:
  - 하이브리드 검색: 활성화
  - Top K: 10
  - BM25 가중치: 0.5
  - 리랭킹: 비활성화 (정확도가 중요하지 않은 경우)

청킹: HTML 인식 또는 부모-자식
  - 청크 크기: 1500 토큰
  - 컨텍스트 창: 500 토큰

검색:
  - 하이브리드 검색: 활성화
  - Top K: 15
  - BM25 가중치: 0.3 (더 많은 벡터 검색)
  - 리랭킹: 활성화

청킹: HTML 인식
  - 청크 크기: 800 토큰
  - 제목 계층 구조 존중

검색:
  - 하이브리드 검색: 활성화
  - BM25 가중치: 0.4

플레이그라운드를 사용하여 설정 테스트:

개별 지식 베이스는 이 글로벌 설정을 재정의할 수 있습니다:

더 알아보기: