Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Conversation

johnny9210
Copy link
Contributor

  1. 다른 파일 제목이 좋을 것 같습니다. 튜토리얼에서 TokenTextSplitter보다 더 많은 내용을 다루고 있는 좋은 점이 잘 드러나지 않고, 사실 TokenTextSplitter 세션에서는 설명이 전무하여 의아하게 느낄 수 있습니다.
  2. KoNLPy는 한국어 데이터로 적용 필요합니다. [최초 컨트리뷰터의 PR] (https://github.com/langchain-ai/langchain/pull/16003)을 참조해주세요. 저희가 사용하는 한국어 튜토리얼은 랭체인의 How-to를 번역해 작성한 것으로 보입니다. 때문에 직역한 영어 표기보다 공식 가이드를 레퍼런싱하는 것이 나을 듯 하고 활용 데이터만 교체하면 될 듯 합니다.
  3. NLTK의 대체 활용으로 spaCy가 소개된 만큼 튜토리얼 순서를 변경하면 좋겠습니다.
  4. 소제목을 다르게 사용하는 것을 제안 드립니다. 번역 관점으로 판단하였을 때 tiktokentokentextsplitter, sentencetransformers은 예시 사용인 것 같고 NLTKspaCy소개할 내용과 다른 것 같습니다. 제가 모델과 코드사용에 대해 아직 모르는 부분들이 많기 때문에 hugging face 부분도 번역가 관점으로 다음과 같이 수정 제시 드려봅니다.

Table of Contents

  1. 설명 단락이 코드 전개와 일치해야 합니다. 예를 들어 NLTKTextSplitter에서 chunk_size =200를 봐주세요. 만약에 작업 여유가 조금 더 있으시다면 저희 목적이 튜토리얼이기 때문에 서로 다른 예시 파라미터가 소개될 때 설명을 추가해주시면 좋겠습니다. 예를 들어 chunk_overlap가 어떤 사례에서는 0으로 다른 사례에서는 50으로 사용했다면 특별한 이유가 있는 것일까요?
  2. API 레퍼런스 추가 여부 확인 부탁드립니다.

  1. 기존 파일의 경우에 TokenTextSplitter로 되어 있었는데, TextSplittingMethods로 변경하였습니다.
    -> 의견 부탁드립니다.
  2. 데이터 추가하여 업로드 하였습니다.
  3. 변경하였습니다.
  4. 소제목의 경우 다루는 내용들이 어떻게 라이브러리를 사용하여 텍스트를 분할하는지에 다루기 때문에 Example Usage 형식으로 통일 하였습니다.
  5. chunk_size, chunk_overlap 파라미터 통일하였고, 해당 파라미터에 대한 설명을 처음 사용되는 부분에 작성하였습니다.
  6. API 레퍼런스 추가하였습니다.

@teddylee777 파일명을 변경해서 PR을 하는경우 기존파일의 경우 어떻게 삭제를 진행 해야하는지 궁금합니다. 현재 파일 삭제한 후 pr 올렸는데, 따로 commit에는 내용이 없는 것 같아 질문드립니다.

늦어서 죄송합니다.

@chaeyoonyunakim chaeyoonyunakim added the proofreading 번역/검수팀 제안사항 반영 label Jan 19, 2025
@johnny9210 johnny9210 changed the title 검수 피드백 반영 07-TextSplitter/03-TokenTextSplitter Jan 19, 2025
@johnny9210 johnny9210 changed the title 07-TextSplitter/03-TokenTextSplitter [N-2] 07-TextSplitter/03-TokenTextSplitter Jan 19, 2025
Copy link
Contributor

@BokyungisaGod BokyungisaGod left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

수고하셨습니다~

Copy link
Contributor

@BokyungisaGod BokyungisaGod left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

수고하셨습니다~

@teddylee777 teddylee777 merged commit afcc0c6 into LangChain-OpenTutorial:main Jan 20, 2025
0 of 2 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
proofreading 번역/검수팀 제안사항 반영
Projects
None yet
Development

Successfully merging this pull request may close these issues.

4 participants