API DocsGlobal SettingsKnowledge

지식

지식 베이스 검색, 청킹, 검색 설정 구성

개요

지식 설정은 지식 베이스에서 문서를 검색, 청킹, 검색하는 방법을 제어합니다. 성능을 최적화하기 위해 검색 파라미터, 청킹 전략, 임베딩 모델, 검색 동작을 설정합니다.

기본 URL:

검색 설정

GET /api/v1/retrieval/config

현재 검색, 청킹, 파싱, 웹 검색 설정을 반환합니다.

GETAdmin only

검색 설정을 가져옵니다 (관리자 전용).

응답 200 (선택된 주요 필드)

json
{
"EXTERNAL_DOCUMENT_LOADER_URL": "http://parser:8000/api/v1/documents",
"CONTENT_EXTRACTION_ENGINE": "external",
"ENABLE_CHUNKING_SERVER": true,
"CHUNKING_SERVER_URL": "http://chunking-server:8000",
"CHUNKING_STRATEGY": "A",
"CHUNK_SIZE": 1000,
"CHUNK_OVERLAP": 200,
"TEXT_SPLITTER": "character",
"ENABLE_RAG_HYBRID_SEARCH": true,
"RAG_EXTERNAL_RERANKER_URL": "http://reranker:11436/rerank",
"RAG_RERANKING_MODEL": "BAAI/bge-reranker-v2-m3",
"RAG_RERANKING_ENGINE": "external",
"TOP_K": 20,
"TOP_K_RERANKER": 10,
"RELEVANCE_THRESHOLD": 0.05,
"HYBRID_BM25_WEIGHT": 0.5
}

POST /api/v1/retrieval/config/update

검색, 청킹, 검색 설정을 업데이트합니다.

POSTAdmin only

검색 설정을 업데이트합니다 (관리자 전용).

요청 본문

json
{
"EXTERNAL_DOCUMENT_LOADER_URL": "http://parser:8000/api/v1/documents",
"CONTENT_EXTRACTION_ENGINE": "external",
"ENABLE_CHUNKING_SERVER": true,
"CHUNKING_SERVER_URL": "http://chunking-server:8000",
"CHUNKING_STRATEGY": "A",
"CHUNK_SIZE": 1000,
"CHUNK_OVERLAP": 200,
"TEXT_SPLITTER": "character",
"ENABLE_RAG_HYBRID_SEARCH": true,
"RAG_EXTERNAL_RERANKER_URL": "http://reranker:11436/rerank",
"RAG_RERANKING_MODEL": "BAAI/bge-reranker-v2-m3",
"RAG_RERANKING_ENGINE": "external",
"TOP_K": 20,
"TOP_K_RERANKER": 10,
"RELEVANCE_THRESHOLD": 0.05,
"HYBRID_BM25_WEIGHT": 0.5
}

응답 200

업데이트된 설정 객체.

청킹 전략

전략설명사용 사례
A고정 크기 청크범용, 단순 문서
E부모-자식 계층복잡한 문서, 계층 구조 보존
HHTML 인식 청킹웹 페이지, HTML 문서

전략 A (고정) 설정

필드타입설명
CHUNK_SIZEinteger토큰/문자 단위 청크 크기
CHUNK_OVERLAPinteger인접 청크 간 겹침
TEXT_SPLITTERstringcharacter 또는 token

전략 E (부모-자식) 설정

필드타입설명
PARENT_CHUNK_SIZEinteger부모 청크 크기
PARENT_CHUNK_OVERLAPinteger부모 청크 겹침
CHILD_CHUNK_SIZEinteger자식 청크 크기
CHILD_CHUNK_OVERLAPinteger자식 청크 겹침

전략 H (HTML) 설정

필드타입설명
HTML_CHUNK_SIZEintegerHTML의 최대 청크 크기
HTML_MIN_CHUNK_SIZEintegerHTML의 최소 청크 크기
HTML_CHUNK_OVERLAPintegerHTML 전략의 겹침
HTML_CONTEXT_WINDOWintegerHTML의 컨텍스트 윈도우

임베딩 설정

GET /api/v1/retrieval/embedding

현재 임베딩 모델 및 엔진 설정을 반환합니다.

GETAdmin only

임베딩 설정을 가져옵니다 (관리자 전용).

응답 200

json
{
"embedding_engine": "openai",
"embedding_model": "bge-m3",
"embedding_batch_size": 100,
"openai_config": { "url": "http://embedding-server:11435" },
"ollama_config": { "url": "" },
"azure_openai_config": { "url": "", "key": "", "version": "" }
}

POST /api/v1/retrieval/embedding/update

임베딩 모델 설정을 업데이트합니다.

POSTAdmin only

임베딩 설정을 업데이트합니다 (관리자 전용).

요청 본문

json
{
"embedding_engine": "openai",
"embedding_model": "bge-m3",
"embedding_batch_size": 100,
"openai_config": { "key": "", "url": "http://embedding-server:11435" },
"ollama_config": { "key": "", "url": "" },
"azure_openai_config": { "key": "", "url": "", "version": "" }
}

응답 200

업데이트된 임베딩 설정.

검색 설정

필드타입기본값설명
ENABLE_RAG_HYBRID_SEARCHbooleantrue하이브리드 BM25 + 벡터 검색 활성화
TOP_Kinteger5검색할 문서 수
TOP_K_RERANKERinteger10리랭킹 후 유지할 상위 결과 수
RELEVANCE_THRESHOLDfloat0.7최소 관련성 점수 (0-1)
HYBRID_BM25_WEIGHTfloat0.5BM25 가중치 (0 = 완전 시맨틱, 1 = 완전 어휘)
RAG_EXTERNAL_RERANKER_URLstring-외부 리랭킹 서비스 URL
RAG_RERANKING_MODELstring-리랭커 모델 이름