本專案利用 youtube-dl 取得線上聲音資源以訓練語音辨識
apt install docker docker-compose#!/bin/bash
# clone 專案
git clone https://github.com/twgo/tw-on-youtube.git
# 啟動 docker.app
cd tw-on-youtube
docker-compose build
docker-compose run web rails db:create
docker-compose run web rails db:migrate
docker-compose up -d
#可至 localhost:3000 進行操作#!/bin/bash
docker-compose down
可順利關閉
若連不上可能是上次 ctrl c 關掉不順利
可至tmp/pids/ 刪掉 server.pid
接著重跑
docker-compose up
即可一鍵啟用- 連上 localhost:3000/videos 輸入 youtube 連結
- 採 mp4,為通用格式
- 可輸入含
list=或/channel/連結,會根據給的網址下的影片通抓
- 採 wav:為辨識所需格式
- 採vtt:vtt較srt多了來源語言類型,預設下載 zh-Hant, zh-Hans, en ,即繁中簡中英文。
- 凡影片提供有助語音辨識之基本資訊將記錄,例:聲音之位元率(abr)...
輸入影片位址後將於背景後台下載影片
- 輸入影片來源:目前限 youtube 單片、清單(playlist)與頻道(channel)
- 新增影片
- 檢視全部已下載影片
status 下載狀態 yid youtube 影片 id format_downloaded 已下載之檔案格式 subtitle_downloaded 已下載之字幕語系 其它為 youtube-dl 提供之 metadata
歡迎於 https://gitter.im/twgo/Lobby 留言給我們意見
- 為符合辨識用語料需求,下載音檔將格式化成為能被 Kaldi 直接使用之語料,並含對照文件以利查看來源影片
- 下載之影片音檔被收錄在資料夾,自動以下列規則命名存檔路徑 'output': 'public/download/wav/%(uploader)s/%(uploader)s%-%(playlist_id)s-%(id)s.%(ext)s',
- 下載之影片清單提供下載
- 使用關鍵字過濾後,點選 CSV 可取得清單
- 首先選擇對照清單
- 上傳所下載的對照清單
- 取得音檔來源,可於 command line 下載音檔