Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Conversation

greencode-99
Copy link
Contributor

@greencode-99 greencode-99 commented Jan 7, 2025

 [N-1] 03-GraphDB / 06-RealTimeQA

Draft Code Commit 입니다.

{PR Message - Write freely, remove this bracket if unnecessary}

Author Checklist

  • PR Title Format: I have confirmed that the PR title follows the correct format. (e.g., [N-2] 07-Text Splitter / 07-RecursiveCharacterTextSplitter)

  • Committed Files: I have ensured that no unnecessary files (e.g., .bin, .gitignore, poetry.lock, pyproject.toml) are included. These files are not allowed.

  • (Optional) Related Issue: If this PR is linked to an issue, I have referenced the issue number in the PR message. (e.g., Fixes Update 01-PromptTemplate.ipynb #123)

  • ❌ Do not include unnecessary files (e.g., .bin, .gitignore, poetry.lock, pyproject.toml) or other people's code. If included, close the PR and create a new PR.

Review Template (Intial PR)

🖥️ OS: Win/Mac/Linux   
✅ Checklist      
 - [ ] **Template**: Tutorials follows the required template. 
 - [ ] **Table of Contents(TOC) Links**: All Table of Contents links work. ((Yes/No)
 - [ ] **Image**: Image filenames follow guidelines.
 - [ ] **Imports*: All import statements use the latest versions. Ensure "langchain-teddynote" is not used. 
 - [ ] **Code Execution**: Code runs without errors.
 - Comments: {Write freely, 한국어 기술 가능}     

If no one reviews your PR within a few days, please @-mention one of teddylee777, musangk, BAEM1N

 [N-1] 03-GraphDB / 06-RealTimeQA

draft code 커밋 입니다.
@Taylor0819
Copy link
Contributor

안녕하세요 종철님~! 게시물 잘보았습니다! 내용 전체로 흐름까지 아주좋습니다~!
다음주에 pr 한번 더 하니 그때는 포맷이나 번역 기타 준수사항에 대해 한번 더 확인하겠습니다 ¨̮ 고생하셨습니다

@MoonHeesun
Copy link
Contributor

안녕하세요! 내용이 따라가기 쉽게 잘 작성된 것 같습니다 :)
2차 때는 review checklist에 따라 다시 확인하겠습니다!
고생 많으셨습니다.

[N-1] 03-GraphDB / 06-RealTimeQA

[변경사항]
1. 단계별 설명 정보 추가 및 수정
2. neo4j sandbox 사용법 추가
3. pdf 문서 다운로드 정보 추가
4. 표준 템플릿 적용
@greencode-99
Copy link
Contributor Author

2차 commit 완료 하였습니다.
@Taylor0819 @MoonHeesun 님, 리뷰 부탁 드립니다.

[수정 사항]

  1. 단계별 설명 정보 추가 및 수정
  2. neo4j sandbox 사용법 추가
  3. pdf 문서 다운로드 정보 추가
  4. 표준 템플릿 적용

@Taylor0819
Copy link
Contributor

Taylor0819 commented Jan 15, 2025

🖥️ OS: Mac
✅ Checklist

  • Template: Tutorials follows the required template.
  • Table of Contents(TOC) Links: All Table of Contents links work. (Yes)
  • Image: Image filenames follow guidelines.
  • *Imports: All import statements use the latest versions. Ensure "langchain-teddynote" is not used.
  • Code Execution: Code runs without errors.
  • Comments:
  1. .env sample 에 따라 NEO4J_URLNEO4J_URI 로 수정

  2. Neo4j sandbox setup url설명

Pasted Graphic 1 사진이나 설명에 링크 어느부분을 복사해서 connection하면 될지 표기 해주시면 좋을것같습니다. + ip address 부분이랑 bolt url 쪽 ip 주소나오는건 블러처리나 안보이게끔 하느건 어떠실까요? 혹시나해서 .. 요건 제 의견입니다 ㅎㅎ
  1. Image file name 수정필요
    디스코드에 이미지 파일 가이드 링크 첨부드립니다~!
    imame_filename_guide

  2. Output 외국어 + dataset

Multiplel 아래 두 쿼리는 불어처럼 보이는데 data를 확인해보니 동일 페이지를 각 나라말 번역본 이더라구요. prompt에 영어로만 답변을 하라는 instruction을 추가 필요해보입니다. 혹은 dataset 자체를 바꾸거나 영어 한페이지만 사용하셔도 무방할거같긴한데 .. qa 답변을 보고 아래 디버깅과 비교했을때 영어가 아니라서 매칭이 어렵습니다..
  1. 사용되지않는 함수
    index = create_vector_index() 정의는 하지만 쓰고있지않습니다.
    추가로 create_vector_index 에서 사용하는 embedding 또한 유사도 검색을 위한것일텐데 overview에서 부터 언급은 되지만 유사도검색을 하지않고 현재 로직은 base_query를 이용한 조회 → 안되면 text to cypher 형태입니다. search_type="hybrid” 또한 유사도 검색 시 사용되는 파라미터입니다.
    이부분은 아예 빼실거면 Vector Index Creation 에도 벡터스토어 생성해서 하이브리드 서치한다는 설명도 수정하셔야할거같습니다.

  2. References 에서 언급된 Graphy v1 에 대한 내용 없음

  3. dataset과 관련없어보이는 node_label="Patient” , 혹시 관련이있다면 설명이 필요할거같습니다.

  4. Data 경로
    현재 pdf_path = "data/bluetooth_notebook_mouse_5000.pdf" 이지만
    data 디렉토리도 동일하게 assets 과 같은 위치에 있어서 “./data” or “../data” 경로로 나중에 수정해야합니당! (아직 assets과 data에 대한 디렉토리 경로는 팀내 미결정)

[Note]
전체적으로, “Graph + Vector” 기반 QA라고 소개했으나, 실제로는 “Graph + LLM” 중심입니다 ㅠㅠ… 설명과 코드 플로우에 대한 매칭을 다시 확인해보셔야할것같습니다!

고생많으셨습니다 ㅠㅠ 제가 꼼꼼히보려고 하다보니 내용이 뭐가 많아졌네요.....

[N-1] 03-GraphDB / 06-RealTimeQA

[수정사항]
- [x] NEO4J_URL → NEO4J_URI 로 수정
- [x] Neo4j sandbox setup url설명
- [x] Image file name 수정필요
- [x] Output 외국어 + dataset
  - 데이터 셋을 교체하였습니다.
- [x] 사용되지않는 함수
  - 불필요한 코드 삭제
- [x] References 에서 언급된 Graphy v1 에 대한 내용 없음
  - 코드 작성시 참고한 사이트이나 불필요하다고 판단되어 삭제
- [x] dataset과 관련없어보이는 node_label="Patient” , 혹시 관련이있다면 설명이 필요할거같습니다.
  - 불필요한 코드 삭제
- [x] Data 경로
  - 최종 결정된 버전으로 반영 완료
@greencode-99
Copy link
Contributor Author

@Taylor0819 지현님, 상세하고 친절하게 리뷰 해주셔서 감사합니다.
전체적으로 검토 하면서 지현님께서 요청주신 부분 수정 및 개선 하였습니다!
다시 한번 리뷰 부탁 드립니다:)

@MoonHeesun
Copy link
Contributor

MoonHeesun commented Jan 17, 2025

[Review Checklist]

  • Review OS:

    • Windows
  • Template Rule 준수 여부:

    • Template Rule 가이드를 준수하였는가?
  • Table of Contents 링크 확인:

    • Table of Contents의 링크가 원활하게 동작하는지 확인하였는가?
    • No. Vector Index Creation 의 경우 존재하지 않는 content이지만 TOC에는 존재합니다. 이 부분 확인 부탁드립니다!
  • 이미지 파일명 검토:

    • 이미지가 포함되어 있다면, 이미지의 파일명이 가이드를 준수하였는가?
  • 최신 import 방식 사용 여부:

    • import 구문이 예전 legacy 방식이 아닌 최신 버전을 따르는가?
  • 코드 동작 확인:

    • 모든 코드가 오류 없이 동작하는가?
    • Warning 발생 시 코멘트에 적어주세요.
  • 제출 파일 확인:

    • 꼭 필요한 파일들만 제출되었는가?
      • 튜토리얼 외 설정 파일이나 다른 분이 작업한 파일이 포함되었는지 Files Changed에서 확인 부탁드립니다. (Check 표기)
  • 기타 의견:
    추가적인 의견이나 수정 사항을 기재해주세요.

    • 앞서 지현님께서 언급해주신 부분들까지 반영되었음을 확인했습니다! 다만, TOC에서 아직 제거되지 않은 부분이 있는 것 같습니다. 이 부분만 확인해주시면 좋을 것 같습니다. 고생 많으셨습니다!

@Taylor0819
Copy link
Contributor

Taylor0819 commented Jan 17, 2025

1차 peer review checklist

  • neo4j 변수 수정  NEO4J_URL → NEO4J_URI
  • Neo4j sandbox url 설명 혹은 이미지 및 ip 주소 블러 처리
  • image 파일 이름 수정
  • Output 외국어 이슈로 데이터 수정
  • 사용되지 않는 함수 지우기
  • references 미사용 항목 제거 → [Graphy v1] 요게 아직 존재하네요!
  • node_label = “Patient” 제거
  • data 경로

데이터 수정한게 훨씬 좋습니다!! 최고 ㅎㅎ 수정사항이 많으셨을텐데도 불구하고 금방해주셨네요! 아래 쪼그만 수정사항만 해주시면 될것같습니다!!

  1. GitHub, colab 링크 수정 필요

  2. 임베딩 함수는 사용하지 않으니 빼도 될것같습니다~! 그거에 따라서 overview에도 text-ada-002도 임베딩모델이니 지워도될것같습니다!

import os
  1. 희선님 리뷰처럼 Vector index creation은 TOC에서 지워주심 될거같네용
• Environment Setup
  1. 마지막 debugging 용 cypher 조회한게 result 가 안나오네요..? 아마 그 전 데이터일때 cypher 그대로 인거같아서 이부분만 확인 및 수정 부탁드립니다 ¨̮
Pasted Graphic 14

[N-1] 03-GraphDB / 06-RealTimeQA

- [x] GitHub, colab 링크 수정
- [x] 임베딩 함수 삭제 및 overview(text-ada-002) 수정
- [x] Reference 수정 -> [Graphy v1] 삭제
- [x] TOC 수정 -> [Vector Index Creation] 삭제
- [x] debugging 용 cypher 조회 쿼리 수정
@greencode-99
Copy link
Contributor Author

@Taylor0819 @MoonHeesun
여러번 Review를 요청 드려서 죄송합니다ㅠ
아래 내용 수정 하였습니다.
최종(?) 확인 요청 드립니다:)

  • GitHub, colab 링크 수정
  • 임베딩 함수 삭제 및 overview(text-ada-002) 수정
  • Reference 수정 -> [Graphy v1] 삭제
  • TOC 수정 -> [Vector Index Creation] 삭제
  • debugging 용 cypher 조회 쿼리 수정

Copy link
Contributor

@Taylor0819 Taylor0819 left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

수정사항 전부 반영되어있네요 ¨̮ 고생하셨습니다!

Copy link
Contributor

@MoonHeesun MoonHeesun left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

고생 많으셨습니다! :)

@teddylee777 teddylee777 merged commit 3e35767 into LangChain-OpenTutorial:main Jan 18, 2025
1 of 2 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

4 participants