Thanks to visit codestin.com
Credit goes to Github.com

Skip to content

auto-paper-digest: An automated pipeline that tracks Hugging Face weekly AI papers, downloads PDFs, imports them into NotebookLM, generates video overviews, and archives everything into a searchable weekly digest.

Notifications You must be signed in to change notification settings

wenxj/auto-paper-digest

ย 
ย 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

ย 

History

14 Commits
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 

Repository files navigation

๐Ÿš€ Auto Paper Digest (APD)

่‡ชๅŠจ่Žทๅ– AI ๅ‰ๆฒฟ่ฎบๆ–‡ โ†’ ไธ‹่ฝฝ PDF โ†’ ็”Ÿๆˆ่ง†้ข‘่ฎฒ่งฃ โ†’ ๅ‘ๅธƒๅˆฐ HuggingFace/ๆŠ–้Ÿณ โ†’ ้—จๆˆท็ฝ‘็ซ™ๅฑ•็คบ

Python NotebookLM HuggingFace Douyin License

๐ŸŽฅ ๅœจ็บฟไฝ“้ชŒ๏ผš https://huggingface.co/spaces/brianxiadong0627/paper-digest


๐Ÿ“ฑ ๅ…ณๆณจๆŠ–้Ÿณ๏ผŒ่Žทๅ–ๆœ€ๆ–ฐ AI ่ฎบๆ–‡่งฃ่ฏป่ง†้ข‘๏ผ

ๆŠ–้ŸณไบŒ็ปด็ 

๐Ÿ”ฅ ๆœ€ๆ–ฐAI่ฎบๆ–‡๏ผŒๆฏๅ‘จๆ›ดๆ–ฐ
ๆ‰ซ็ ๅ…ณๆณจ๏ผŒ็ฌฌไธ€ๆ—ถ้—ด่Žทๅ–็ฒพๅฝฉๅ†…ๅฎน


โœจ ๅŠŸ่ƒฝไบฎ็‚น

ๅŠŸ่ƒฝ ่ฏดๆ˜Ž
๐Ÿ“š ่ฎบๆ–‡่Žทๅ– ่‡ชๅŠจๆŠ“ๅ– Hugging Face ๆฏๅ‘จ็ƒญ้—จ AI ่ฎบๆ–‡๏ผˆๆ”ฏๆŒๅ‘จ URL๏ผ‰
๐Ÿ“„ PDF ไธ‹่ฝฝ ไปŽ arXiv ไธ‹่ฝฝ่ฎบๆ–‡ PDF๏ผˆๅน‚็ญ‰ๆ“ไฝœ๏ผŒSHA256 ๆ ก้ชŒ๏ผ‰
๐ŸŽฌ ่ง†้ข‘็”Ÿๆˆ ้€š่ฟ‡ NotebookLM ่‡ชๅŠจ็”Ÿๆˆ่ฎบๆ–‡่ง†้ข‘่ฎฒ่งฃ
๐Ÿ“ค ่‡ชๅŠจๅ‘ๅธƒ ไธŠไผ ่ง†้ข‘ๅˆฐ HuggingFace Dataset
๐Ÿ“ฑ ๆŠ–้Ÿณๅ‘ๅธƒ ่‡ชๅŠจๅ‘ๅธƒ่ง†้ข‘ๅˆฐๆŠ–้Ÿณๅˆ›ไฝœ่€…ๅนณๅฐ
๐ŸŒ ้—จๆˆท็ฝ‘็ซ™ Gradio ้—จๆˆท็ฝ‘็ซ™๏ผŒๅœจ็บฟๆ’ญๆ”พ่ง†้ข‘
๐Ÿ’พ ๆ–ญ็‚น็ปญไผ  SQLite ็Šถๆ€่ฟฝ่ธช๏ผŒๆ”ฏๆŒไธญๆ–ญๅŽ็ปง็ปญ
๐Ÿ” ็™ปๅฝ•ๅค็”จ Google/ๆŠ–้Ÿณ็™ปๅฝ•็Šถๆ€ๆŒไน…ๅŒ–๏ผŒไธ€ๆฌก็™ปๅฝ•้•ฟๆœŸไฝฟ็”จ

๐Ÿ“ ๆžถๆž„่ฎพ่ฎก

โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”
โ”‚                        Auto Paper Digest                             โ”‚
โ”œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ค
โ”‚                                                                      โ”‚
โ”‚   Phase 1: Upload            Phase 2: Download      Phase 3: Publish โ”‚
โ”‚   โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”    โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”    โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”    โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”‚
โ”‚   โ”‚   HF    โ”‚โ”€โ”€โ”€โ–ถโ”‚  arXiv  โ”‚โ”€โ”€โ”€โ–ถโ”‚ NotebookLM  โ”‚โ”€โ”€โ”€โ–ถโ”‚  HuggingFace โ”‚ โ”‚
โ”‚   โ”‚ Papers  โ”‚    โ”‚  PDFs   โ”‚    โ”‚   Videos    โ”‚    โ”‚   Dataset    โ”‚ โ”‚
โ”‚   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜    โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜    โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜    โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ”‚
โ”‚        โ”‚               โ”‚               โ”‚                   โ”‚         โ”‚
โ”‚        โ–ผ               โ–ผ               โ–ผ                   โ–ผ         โ”‚
โ”‚   โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”   โ”‚
โ”‚   โ”‚                    SQLite Database                           โ”‚   โ”‚
โ”‚   โ”‚      (status: NEW โ†’ PDF_OK โ†’ NBLM_OK โ†’ VIDEO_OK)            โ”‚   โ”‚
โ”‚   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜   โ”‚
โ”‚                              โ”‚                                       โ”‚
โ”‚              โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”                       โ”‚
โ”‚              โ–ผ               โ–ผ               โ–ผ                       โ”‚
โ”‚   โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”               โ”‚
โ”‚   โ”‚ Portal Website  โ”‚ โ”‚   Douyin    โ”‚ โ”‚   Other     โ”‚               โ”‚
โ”‚   โ”‚  (HF Spaces)    โ”‚ โ”‚  Creator    โ”‚ โ”‚  Platforms  โ”‚               โ”‚
โ”‚   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜               โ”‚
โ”‚                                                                      โ”‚
โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜

๐Ÿš€ ๅฟซ้€Ÿๅผ€ๅง‹

1. ๅฎ‰่ฃ…

# ๅ…‹้š†ไป“ๅบ“
git clone https://github.com/brianxiadong/auto-paper-digest.git
cd auto-paper-digest

# ๅฎ‰่ฃ…ไพ่ต–
pip install -e .

# ๅฎ‰่ฃ…ๆต่งˆๅ™จ
playwright install chromium

2. ้…็ฝฎ็Žฏๅขƒๅ˜้‡

# ๅคๅˆถ้…็ฝฎๆจกๆฟ
cp .env.example .env

# ็ผ–่พ‘ .env ๅกซๅ…ฅ HuggingFace ้…็ฝฎ
# HF_TOKEN=hf_xxx
# HF_USERNAME=your-username
# HF_DATASET_NAME=paper-digest-videos

3. ้ฆ–ๆฌก็™ปๅฝ• Google

apd login

ๆต่งˆๅ™จไผšๆ‰“ๅผ€ NotebookLM ็™ปๅฝ•้กต้ข๏ผŒๅฎŒๆˆ Google ็™ปๅฝ•ๅŽ๏ผŒไผš่ฏๅฐ†่ขซไฟๅญ˜ใ€‚


๐Ÿ“– ไธ‰้˜ถๆฎตๅทฅไฝœๆต

Phase 1: ไธŠไผ ๅนถ่งฆๅ‘่ง†้ข‘็”Ÿๆˆ

apd upload --week 2026-01 --headful --max 10

่ฏฅๅ‘ฝไปคไผš๏ผš

  • โœ… ่Žทๅ– HuggingFace ๆœฌๅ‘จ่ฎบๆ–‡๏ผˆไฝฟ็”จ /week/YYYY-WXX URL๏ผ‰
  • โœ… ไธ‹่ฝฝ arXiv PDF๏ผˆๆ”ฏๆŒ็ผ“ๅญ˜๏ผŒๅทฒไธ‹่ฝฝ็š„่ทณ่ฟ‡๏ผ‰
  • โœ… ไธŠไผ ๅˆฐ NotebookLM
  • โœ… ่งฆๅ‘่ง†้ข‘็”Ÿๆˆ๏ผˆไธ็ญ‰ๅพ…ๅฎŒๆˆ๏ผ‰

Phase 2: ไธ‹่ฝฝ็”Ÿๆˆ็š„่ง†้ข‘

็ญ‰ๅพ…ๅ‡ ๅˆ†้’ŸๅŽ๏ผˆ่ง†้ข‘็”Ÿๆˆ้œ€่ฆๆ—ถ้—ด๏ผ‰๏ผŒ่ฟ่กŒ๏ผš

apd download-video --week 2026-01 --headful

ๆ”ฏๆŒ็ผ“ๅญ˜๏ผๅทฒไธ‹่ฝฝ็š„่ง†้ข‘ไผš่‡ชๅŠจ่ทณ่ฟ‡๏ผŒไฝฟ็”จ --force ๅผบๅˆถ้‡ๆ–ฐไธ‹่ฝฝใ€‚

Phase 3: ๅ‘ๅธƒๅˆฐ HuggingFace

apd publish --week 2026-01

่ฏฅๅ‘ฝไปคไผš๏ผš

  • โœ… ไธŠไผ ่ง†้ข‘ๅˆฐ HuggingFace Dataset
  • โœ… ๆ›ดๆ–ฐ metadata.json
  • โœ… ็”Ÿๆˆ Markdown ๆ‘˜่ฆ

Phase 3b: ๅ‘ๅธƒๅˆฐๆŠ–้Ÿณ๏ผˆๅฏ้€‰๏ผ‰

้ฆ–ๆฌกไฝฟ็”จ้œ€่ฆๅ…ˆ็™ปๅฝ•ๆŠ–้Ÿณ๏ผš

apd douyin-login

ๆต่งˆๅ™จไผšๆ‰“ๅผ€ๆŠ–้Ÿณๅˆ›ไฝœ่€…ไธญๅฟƒ็™ปๅฝ•้กต้ข๏ผŒไฝฟ็”จๆŠ–้Ÿณ APP ๆ‰ซ็ ็™ปๅฝ•๏ผŒ็™ปๅฝ•็Šถๆ€ๅฐ†่ขซไฟๅญ˜ใ€‚

็„ถๅŽๅ‘ๅธƒ่ง†้ข‘ๅˆฐๆŠ–้Ÿณ๏ผš

apd publish-douyin --week 2026-01 --headful

่ฏฅๅ‘ฝไปคไผš๏ผš

  • โœ… ่‡ชๅŠจไธŠไผ ่ง†้ข‘ๅˆฐๆŠ–้Ÿณๅˆ›ไฝœ่€…ๅนณๅฐ
  • โœ… ๅกซๅ†™่ง†้ข‘ๆ ‡้ข˜๏ผˆ่ฎบๆ–‡ๆ ‡้ข˜๏ผ‰
  • โœ… ๆทปๅŠ ่ฏ้ข˜ๆ ‡็ญพ๏ผˆAIใ€่ฎบๆ–‡่งฃ่ฏป็ญ‰๏ผ‰
  • โœ… ่‡ชๅŠจ็‚นๅ‡ปๅ‘ๅธƒ

๐Ÿ’ก ๆ็คบ๏ผš้ฆ–ๆฌกไฝฟ็”จๅปบ่ฎฎๆทปๅŠ  --headful ๅ‚ๆ•ฐ่ง‚ๅฏŸๅ‘ๅธƒ่ฟ‡็จ‹๏ผŒ็กฎ่ฎคๆ— ่ฏฏๅŽๅฏๅŽปๆމ่ฏฅๅ‚ๆ•ฐใ€‚


๐Ÿ“… ๆŒ‰ๆ—ฅๅค„็†๏ผˆๅฏ้€‰๏ผ‰

้™คไบ†ๆŒ‰ๅ‘จๅค„็†ๅค–๏ผŒไนŸๆ”ฏๆŒๆŒ‰ๆ—ฅๆœŸๅค„็†่ฎบๆ–‡๏ผš

# ่Žทๅ–ๆŒ‡ๅฎšๆ—ฅๆœŸ็š„่ฎบๆ–‡
apd fetch --date 2026-01-08 --max 10

# ไธŠไผ ๅนถ็”Ÿๆˆ่ง†้ข‘
apd upload --date 2026-01-08 --headful --max 10

# ไธ‹่ฝฝ่ง†้ข‘
apd download-video --date 2026-01-08 --headful

# ๅ‘ๅธƒๅˆฐๆŠ–้Ÿณ
apd publish-douyin --date 2026-01-08 --headful

โš ๏ธ ๆณจๆ„๏ผšๅ‘จๆœซๅ’Œ่Š‚ๅ‡ๆ—ฅๆฒกๆœ‰่ฎบๆ–‡๏ผŒ็ณป็ปŸไผšๆ็คบ้”™่ฏฏ่€Œ้ž็ปง็ปญๅค„็†ใ€‚

ๆ–‡ไปถๅคน็ป“ๆž„

ๆŒ‰ๆ—ฅๅ’ŒๆŒ‰ๅ‘จ็š„ๆ•ฐๆฎๅˆ†ๅผ€ๅญ˜ๆ”พ๏ผš

  • data/pdfs/weekly/2026-01/ - ๆŒ‰ๅ‘จๅค„็†็š„ PDF
  • data/pdfs/daily/2026-01-08/ - ๆŒ‰ๆ—ฅๅค„็†็š„ PDF
  • data/videos/weekly/2026-01/ - ๆŒ‰ๅ‘จๅค„็†็š„่ง†้ข‘
  • data/videos/daily/2026-01-08/ - ๆŒ‰ๆ—ฅๅค„็†็š„่ง†้ข‘

๐ŸŒ ้—จๆˆท็ฝ‘็ซ™

่ง†้ข‘ๅ‘ๅธƒๅŽ๏ผŒๅฏๅœจ HuggingFace Spaces ้—จๆˆท็ฝ‘็ซ™็›ดๆŽฅ่ง‚็œ‹๏ผš

https://huggingface.co/spaces/your-username/paper-digest

๐Ÿ“– ๅ‘ฝไปคๅคงๅ…จ

ๅ‘ฝไปค ่ฏดๆ˜Ž
apd login ๆ‰“ๅผ€ๆต่งˆๅ™จๅฎŒๆˆ Google ็™ปๅฝ•๏ผˆNotebookLM๏ผ‰
apd douyin-login ๆ‰“ๅผ€ๆต่งˆๅ™จๅฎŒๆˆๆŠ–้Ÿณ็™ปๅฝ•
apd fetch ไป…่Žทๅ–่ฎบๆ–‡ๅˆ—่กจ๏ผˆไธไธ‹่ฝฝ๏ผ‰
apd download ไป…ไธ‹่ฝฝ PDF๏ผˆๆ”ฏๆŒ็ผ“ๅญ˜๏ผ‰
apd upload Phase 1๏ผš่Žทๅ– + ไธ‹่ฝฝ + ไธŠไผ  + ่งฆๅ‘็”Ÿๆˆ
apd download-video Phase 2๏ผšไธ‹่ฝฝๅทฒ็”Ÿๆˆ็š„่ง†้ข‘๏ผˆๆ”ฏๆŒ็ผ“ๅญ˜๏ผ‰
apd publish Phase 3๏ผšๅ‘ๅธƒๅˆฐ HuggingFace
apd publish-douyin Phase 3b๏ผšๅ‘ๅธƒๅˆฐๆŠ–้Ÿณๅˆ›ไฝœ่€…ๅนณๅฐ
apd digest ็”Ÿๆˆๆœฌๅœฐๅ‘จๆŠฅ
apd run ๅฎŒๆ•ดๆต็จ‹๏ผˆไธ€้”ฎๆ‰ง่กŒ๏ผŒ้œ€็ญ‰ๅพ…่ง†้ข‘็”Ÿๆˆ๏ผ‰
apd status ๆŸฅ็œ‹่ฎบๆ–‡ๅค„็†็Šถๆ€

ๅธธ็”จๅ‚ๆ•ฐ

--week, -w     ๆŒ‡ๅฎšๅ‘จ ID๏ผˆๅฆ‚ 2026-01๏ผ‰๏ผŒ้ป˜่ฎคๅฝ“ๅ‰ๅ‘จ
--max, -m      ๆœ€ๅคง่ฎบๆ–‡ๆ•ฐ้‡
--headful      ๆ˜พ็คบๆต่งˆๅ™จ็ช—ๅฃ๏ผˆ่ฐƒ่ฏ•ๆ—ถไฝฟ็”จ๏ผ‰
--force, -f    ๅผบๅˆถ้‡ๆ–ฐๅค„็†๏ผˆๅฟฝ็•ฅ็ผ“ๅญ˜๏ผ‰
--debug        ๅผ€ๅฏ่ฐƒ่ฏ•ๆ—ฅๅฟ—

๐Ÿ“ ็›ฎๅฝ•็ป“ๆž„

auto-paper-digest/
โ”œโ”€โ”€ apd/                    # ไธป็จ‹ๅบๅŒ…
โ”‚   โ”œโ”€โ”€ cli.py              # ๅ‘ฝไปค่กŒๅ…ฅๅฃ
โ”‚   โ”œโ”€โ”€ config.py           # ้…็ฝฎๅธธ้‡
โ”‚   โ”œโ”€โ”€ db.py               # SQLite ๆ•ฐๆฎๅบ“
โ”‚   โ”œโ”€โ”€ hf_fetcher.py       # HF ่ฎบๆ–‡ๆŠ“ๅ–๏ผˆๆ”ฏๆŒๅ‘จ URL๏ผ‰
โ”‚   โ”œโ”€โ”€ pdf_downloader.py   # PDF ไธ‹่ฝฝๅ™จ
โ”‚   โ”œโ”€โ”€ nblm_bot.py         # NotebookLM ่‡ชๅŠจๅŒ–
โ”‚   โ”œโ”€โ”€ douyin_bot.py       # ๆŠ–้Ÿณๅˆ›ไฝœ่€…ๅนณๅฐ่‡ชๅŠจๅŒ–
โ”‚   โ”œโ”€โ”€ publisher.py        # HuggingFace ๅ‘ๅธƒ
โ”‚   โ”œโ”€โ”€ digest.py           # ๅ‘จๆŠฅ็”Ÿๆˆ
โ”‚   โ””โ”€โ”€ utils.py            # ๅทฅๅ…ทๅ‡ฝๆ•ฐ
โ”œโ”€โ”€ portal/                 # HuggingFace Spaces ้—จๆˆท
โ”‚   โ”œโ”€โ”€ app.py              # Gradio ๅบ”็”จ
โ”‚   โ”œโ”€โ”€ requirements.txt
โ”‚   โ””โ”€โ”€ README.md
โ”œโ”€โ”€ data/
โ”‚   โ”œโ”€โ”€ apd.db              # SQLite ๆ•ฐๆฎๅบ“
โ”‚   โ”œโ”€โ”€ .douyin_auth.json   # ๆŠ–้Ÿณ็™ปๅฝ•็Šถๆ€
โ”‚   โ”œโ”€โ”€ pdfs/               # ไธ‹่ฝฝ็š„ PDF๏ผˆๆŒ‰ๅ‘จๅˆ†็›ฎๅฝ•๏ผ‰
โ”‚   โ”œโ”€โ”€ videos/             # ็”Ÿๆˆ็š„่ง†้ข‘๏ผˆๆŒ‰ๅ‘จๅˆ†็›ฎๅฝ•๏ผ‰
โ”‚   โ”œโ”€โ”€ digests/            # ๅ‘จๆŠฅๆ–‡ไปถ
โ”‚   โ””โ”€โ”€ profiles/           # ๆต่งˆๅ™จ้…็ฝฎ๏ผˆๅซ็™ปๅฝ•ๆ€๏ผ‰
โ”œโ”€โ”€ .env.example            # ็Žฏๅขƒๅ˜้‡ๆจกๆฟ
โ””โ”€โ”€ pyproject.toml

๏ฟฝ ็ผ“ๅญ˜ๆœบๅˆถ

PDF ็ผ“ๅญ˜

  • ๅทฒไธ‹่ฝฝ็š„ PDF ้€š่ฟ‡ SHA256 ๆ ก้ชŒ
  • ็›ธๅŒๆ–‡ไปถ่‡ชๅŠจ่ทณ่ฟ‡

่ง†้ข‘็ผ“ๅญ˜

  • ไฝฟ็”จๆ–‡ไปถๅๅ‰็ผ€ๅŒน้…๏ผˆ{paper_id}_*.mp4๏ผ‰
  • ๆ”ฏๆŒๆ–ฐ็š„ๅ‘ฝๅๆ ผๅผ๏ผš{paper_id}_{video_title}.mp4
  • ไฝฟ็”จ --force ๅผบๅˆถ้‡ๆ–ฐไธ‹่ฝฝ

ๅ‘ๅธƒ็ผ“ๅญ˜

  • metadata.json ไธญ่ฎฐๅฝ•ๅทฒๅ‘ๅธƒ็š„่ฎบๆ–‡
  • ้‡ๅคๅ‘ๅธƒ่‡ชๅŠจ่ทณ่ฟ‡

๐Ÿ“Š ็Šถๆ€่ฟฝ่ธช

NEW โ†’ PDF_OK โ†’ NBLM_OK โ†’ VIDEO_OK
 โ”‚                          โ”‚
 โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€ ERROR โ—„โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
็Šถๆ€ ๅซไน‰
NEW ่ฎบๆ–‡ๅทฒๆŠ“ๅ–๏ผŒๅพ…ๅค„็†
PDF_OK PDF ๅทฒไธ‹่ฝฝ
NBLM_OK ๅทฒไธŠไผ ๅˆฐ NotebookLM๏ผŒ่ง†้ข‘็”Ÿๆˆไธญ
VIDEO_OK ่ง†้ข‘ๅทฒไธ‹่ฝฝ
ERROR ๅค„็†ๅคฑ่ดฅ๏ผˆไผš่‡ชๅŠจ้‡่ฏ•๏ผ‰

ๆŸฅ็œ‹็Šถๆ€๏ผš

apd status --week 2026-01
apd status --week 2026-01 --status ERROR

๐Ÿ”ง ๆ•…้šœๆŽ’้™ค

็™ปๅฝ•้—ฎ้ข˜

apd login

NotebookLM ็•Œ้ขๅ˜ๅŒ–

ๆŸฅ็œ‹ๆˆชๅ›พ๏ผš

ls data/profiles/screenshots/

่ง†้ข‘ๆœช็”Ÿๆˆ

่ง†้ข‘็”Ÿๆˆ้œ€่ฆๅ‡ ๅˆ†้’Ÿๆ—ถ้—ด๏ผŒ่ฏท็จๅŽ้‡่ฏ•๏ผš

apd download-video --week 2026-01 --headful

HuggingFace Token ้—ฎ้ข˜

็กฎไฟ .env ๆ–‡ไปถ้…็ฝฎๆญฃ็กฎ๏ผš

cat .env
# ๆฃ€ๆŸฅ HF_TOKEN ๅ’Œ HF_USERNAME

๐Ÿค ๆŠ€ๆœฏๆ ˆ

  • Python 3.11+ - ๆ ธๅฟƒ่ฏญ่จ€
  • Playwright - ๆต่งˆๅ™จ่‡ชๅŠจๅŒ–
  • SQLite - ็Šถๆ€ๆŒไน…ๅŒ–
  • Click - CLI ๆก†ๆžถ
  • Requests + BeautifulSoup - ็ฝ‘้กตๆŠ“ๅ–
  • huggingface_hub - HF API
  • Gradio - ้—จๆˆท็ฝ‘็ซ™
  • python-dotenv - ็Žฏๅขƒๅ˜้‡็ฎก็†

๐Ÿ“„ License

MIT License ยฉ 2026

About

auto-paper-digest: An automated pipeline that tracks Hugging Face weekly AI papers, downloads PDFs, imports them into NotebookLM, generates video overviews, and archives everything into a searchable weekly digest.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 98.4%
  • Shell 1.6%