메뉴 여닫기
개인 메뉴 토글
로그인하지 않음
만약 지금 편집한다면 당신의 IP 주소가 공개될 수 있습니다.

그래프 DB(Graph Database) 와 벡터 DB(Vector Database)

{틀:핵심 |제목=* 그래프 DB:

    • “누가 누구와 어떻게 연결되어 있는가” 를 빠르게 찾는 DB
  • 벡터 DB:
    • “이 데이터와 가장 비슷한 것은 무엇인가” 를 찾는 DB

} ⸻

핵심 개념 비교

핵심 개념
구분 그래프 DB 벡터 DB
핵심 목적 관계 탐색 유사도 검색
데이터 형태 노드 + 엣지(관계) 고차원 벡터(숫자 배열)
주요 질문 A와 B는 어떤 관계인가? 이것과 가장 비슷한 것은?
쿼리 방식 관계 기반 탐색 거리 기반 검색
주 사용 분야 관계 분석, 네트워크 AI, 검색, 추천

데이터 구조 차이

  • 그래프 DB
    • 노드(Node): 사람, 상품, 계정 등
    • 엣지(Edge): 친구, 구매, 팔로우 같은 관계
    • 관계 자체가 1급 시민
예:

(사용자A) -[FRIEND]-> (사용자B)


  • 벡터 DB
    • 데이터는 임베딩(embedding) 으로 변환된 벡터
    • 예: 문장 → [0.12, -0.88, 0.34, ...]
    • 의미적 유사성을 수학적으로 계산
예:

"나는 고양이를 좋아해" → 벡터 → 가장 비슷한 문장 검색

검색(쿼리) 방식 차이

  • 그래프 DB 쿼리 예
    • “A의 친구의 친구는 누구인가?”
    • “이 상품을 산 사람들은 또 뭘 샀나?”
  • → 경로 탐색, 다중 홉 관계 조회
  • 벡터 DB 쿼리 예
    • “이 질문과 가장 비슷한 질문 5개”
    • “이 이미지와 가장 유사한 이미지”
  • → Cosine Similarity, Euclidean Distance 같은 거리 계산

대표적인 사용 사례

  • 그래프 DB가 적합한 경우
    • SNS 친구 관계
    • 추천 시스템(관계 기반)
    • 사기 탐지 (계좌/거래 연결 분석)
    • 권한·조직 구조
    • 네트워크 토폴로지

👉 관계가 복잡할수록 강력

  • 벡터 DB가 적합한 경우
    • LLM + RAG 검색
    • 문서 / FAQ 의미 검색
    • 이미지·음성 검색
    • 챗봇 지식 검색
    • 개인화 추천(콘텐츠 유사도)

👉 의미적 유사성이 중요할수록 필수

대표 DB 예시

  1. 그래프 DB
    1. • Neo4j
    2. • Amazon Neptune
    3. • TigerGraph
  2. 벡터 DB
    1. • Pinecone
    2. • Milvus
    3. • Weaviate
    4. • FAISS (라이브러리)

함께 쓰는 경우도 많다

  • 요즘 실무에서는 그래프 DB + 벡터 DB를 같이 사용하는 경우도 많습니다.

예:
	•	벡터 DB → “비슷한 문서 찾기”
	•	그래프 DB → “이 문서를 누가 만들었고, 어떤 서비스와 연결됐는지”

👉 의미 검색 + 관계 분석 조합

정리 표

핵심 개념
항목 그래프 DB 벡터 DB
중심 개념 관계 유사도
강점 복잡한 연결 탐색 의미 기반 검색
약점 의미 유사도 검색 약함 관계 표현 약함
AI/LLM 보조적 핵심 인프라