All

44 repositories

handcrafted-persona-engine
Public
handcrafted-persona-engine - Live2D AI 虚拟人系统亮点 • 🧠 对话：接入本地/云端 LLM，自定义性格，支持中断识别 • 🗣️ 语音：Whisper 实时识别 + TTS 合成 + 可选声音克隆（RVC） • 🎨 动作：支持 Live2D 表情控制、眨眼、Idle 动画 • 👀 感知：可读取屏幕文字，实现“看得见”的 AI • 📺 推流：Spout 输出，无缝接入 OBS • 🎛️ UI 面板：实时查看延迟、调节语速音调 • 🧹 脏话过滤 + JSON 配置 + 模块化设计
C#
•98•0•0•0•Updated Apr 22, 2025Apr 22, 2025
ChatTTS-ui
Public
一个简单的本地网页界面，使用ChatTTS将文字合成为语音，同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthesize text into speech, along with support for external API interfaces.
Python
•
Other
•903•0•0•0•Updated Apr 21, 2025Apr 21, 2025
douyin-downloader
Public
抖音批量下载工具，去水印，支持视频、图集、合集、音乐(原声)。免费！免费！免费！
Python
•843•0•0•0•Updated Apr 11, 2025Apr 11, 2025
DouyinLiveWebFetcher
Public
抖音直播间网页版的弹幕数据抓取（2025最新版本）
Python
•
GNU Affero General Public License v3.0
•460•0•0•0•Updated Apr 9, 2025Apr 9, 2025
index-tts
Public
An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
Python
•
Apache License 2.0
•1.6k•0•0•0•Updated Apr 9, 2025Apr 9, 2025
Bark-Voice-Cloning
Public
notebooks文件夹下，🥳💕🎶 NeuCo AI歌手，无需训练、一键翻唱，🌟 只需10秒音频，一键翻唱任意歌手的任意歌曲！相较于传统的ASVC，NeuCoSVC只需要上传一个角色的声音，然后就能模拟这个角色的声音唱歌。NeuCo AI的特色亮点： 🎤 NeuCoSVC是一个虚拟项目，可用于模拟角色的声音唱歌 🎧 建议上传你喜欢的参考音频，然后选择时间长度以及声音去除等操作 🎶 可选择上传B站视频或本地音频，并在上传后选择是否加入歌曲伴奏Bark Voice Cloning and Voice Cloning for Chinese Speech
Jupyter Notebook
•
MIT License
•420•0•0•0•Updated Apr 6, 2025Apr 6, 2025
A-customizable-audiobook-generator-based-on-GPT-SoVITS-for-personalized-voice-tones.
Public
通过AI实现对话者的识别并进行文段分割，再接入语音合成，自动生成有声小说
Python
•4•0•0•0•Updated Apr 3, 2025Apr 3, 2025
VideoEpicCreator
Public
一款基于Python和PyQt6开发的智能视频混剪工具，专为短剧创作者设计。利用多种AI大模型实现自动字幕识别、智能混剪、特效添加等功能，并与剪映等主流剪辑软件深度集成。
Python
•
MIT License
•31•0•0•0•Updated Apr 2, 2025Apr 2, 2025
easytts
Public
打造最简单的TTS前端集合，最简单的有声小说制作工作流。基于正则规则对小说进行分句，基于RoBERTa对小说中的对话进行说话人识别，从而实现一键式生成多人有声小说。多说话人的语音合成，高质量的有声小说制作。
Python
•25•0•0•0•Updated Mar 29, 2025Mar 29, 2025
Tailor
Public
Tailor是一款视频智能裁剪、视频生成和视频优化的视频剪辑工具。目前的目标是通过人工智能技术减少视频剪辑的繁琐操作，让普通人也能简单实现专业剪辑人的水准！长远目标是让视频剪辑实现真正的AIGC！
Python
•
Apache License 2.0
•112•0•0•0•Updated Mar 18, 2025Mar 18, 2025
DigitalHumanDemo
Public
整合GPT-SoVITS与MuseTalk实现2D数字人视频合成，结合rhubarb实现3D数字人嘴唇驱动
Python
•2•0•0•0•Updated Mar 18, 2025Mar 18, 2025
bailing
Public
百聆是一个类似GPT-4o的语音对话机器人，通过ASR+LLM+TTS实现，集成DeepSeek R1等优秀大模型，时延低至800ms，Mac等低配置也可运行，支持打断
Python
•
MIT License
•255•0•0•0•Updated Mar 15, 2025Mar 15, 2025
story-flicks
Public
一键生成高清故事短视频的AI工具：story-flicks，可以做儿童故事输入一个故事主题，它就会用AI模型生成故事内容、图像、配音以及字幕，最终合成完整视频可以自定义故事主题、分段数量、配音风格、视频语言等使用AI大模型，一键生成高清故事短视频。Generate high-definition story short videos with one click using AI large models.
Python
•354•0•0•0•Updated Mar 12, 2025Mar 12, 2025
AI-Video-Editing-Assistant
Public
智能视频剪辑助手Smart Video Editing Assistant 一个基于Python的智能视频剪辑工具，支持文案驱动剪辑和智能生成剪辑功能。模型MiniCPM-o-2.6多模态
Python
•
Apache License 2.0
•4•0•0•0•Updated Mar 1, 2025Mar 1, 2025
AI-Video-Editing-Assistant-
Public
智能视频剪辑助手Smart Video Editing Assistant 一个基于Python的智能视频剪辑工具，支持文案驱动剪辑和智能生成剪辑功能。模型MiniCPM-o-2.6多模态
Python
•
Apache License 2.0
•4•0•0•0•Updated Mar 1, 2025Mar 1, 2025
Linly-Talker
Public
Digital Avatar Conversational System - Linly-Talker. 😄✨ Linly-Talker is an intelligent AI system that combines large language models (LLMs) with visual models to create a novel human-AI interaction method. 🤝🤖 It integrates various technologies like Whisper, Linly, Microsoft Speech Services, and SadTalker talking head generation system. 🌟🔬
Python
•
MIT License
•473•0•0•0•Updated Feb 24, 2025Feb 24, 2025
imgocr
Public
Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理，可实现 CPU 上毫秒级的 OCR 精准预测，通用场景中英文OCR达到开源SOTA。
Python
•
Apache License 2.0
•15•0•0•0•Updated Jan 22, 2025Jan 22, 2025
DouyinLivetts
Public
基于saermart大佬开源的抖音弹幕抓取，实现的tts语音播放
Python
•
GNU Affero General Public License v3.0
•14•0•0•0•Updated Jan 16, 2025Jan 16, 2025
novel2video
Public
ai 小说推文/漫画推文支持sdui & comfyui
Python
•77•0•0•0•Updated Jan 11, 2025Jan 11, 2025
id-photo-wechat
Public
证件照小程序——前端（第三套）
JavaScript
•66•0•0•0•Updated Dec 27, 2024Dec 27, 2024
photo
Public
证件照小程序——前端（第一套）
JavaScript
•89•0•0•0•Updated Dec 27, 2024Dec 27, 2024
HivisionIDPhotos
Public
⚡️HivisionIDPhotos: a lightweight and efficient AI ID photos tools. 一个轻量级的AI证件照制作算法。
Python
•
Apache License 2.0
•2.2k•0•0•0•Updated Nov 20, 2024Nov 20, 2024
auto-video-generateor
Public
自动视频生成器，给定主题，自动生成解说视频。用户输入主题文字，系统调用大语言模型生成故事或解说的文字，然后进一步调用语音合成接口生成解说的语音，调用文生图接口生成契合文字内容的配图，最后融合语音和配图生成解说视频。
Python
•
MIT License
•152•0•0•0•Updated Nov 13, 2024Nov 13, 2024
omniparse
Public
一个可以把各种非结构化数据转为结构化数据的工具：OmniParse，本地运行，支持约20种文件格式支持文档、表格、图像、视频、音频、网页等，能提取表格、识别图片内容、转录音视频、爬取网页，把数据转成高结构化Markdown 格式适合需要批量处理各种数据并用于AI应用的场景，目前支持Linux系统
Python
•
GNU General Public License v3.0
•532•0•0•0•Updated Nov 3, 2024Nov 3, 2024
autocut
Public
用文本编辑器剪视频
Python
•
Apache License 2.0
•772•0•0•0•Updated Oct 5, 2024Oct 5, 2024
StoryDiffusion
Public
一款由南开大学HVision团队开发的人工智能工具，主要功能包括生成连贯的图像和视频故事，以及漫画生成创作。
Jupyter Notebook
•
Apache License 2.0
•650•0•0•0•Updated Sep 26, 2024Sep 26, 2024
lpanda
Public
AI 小说生成推文漫画视频
JavaScript
•
MIT License
•24•0•0•0•Updated Sep 12, 2024Sep 12, 2024
EmotiVoice
Public
EmotiVoice是一个强大的开源TTS引擎，完全免费，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
Python
•
Apache License 2.0
•734•0•0•0•Updated Aug 13, 2024Aug 13, 2024
Semi-Auto-NovelAI-to-Pixiv
Public
带有 WebUI 的 NovelAI 量产工具, 实现了批量文生图; 批量图生图; 视频转绘; 分块重绘; 批量 Vibe; 批量局部重绘; 批量超分降噪; 批量自动打码; 批量添加水印; 批量上传 Pixiv; 图片筛选; 批量抹除, 还原或导出生成信息; 法术解析; 多模型反推提示词; ChatGPT; 动态加载插件; 自动 roll 画风串; 批量 Enhance; tag选择器; 涂鸦重绘
Python
•
GNU Affero General Public License v3.0
•37•0•0•0•Updated Jul 27, 2024Jul 27, 2024
ai-server
Public
JAVA版本的PaddleOCR和rapidocr 不依赖第三方
Java
•
MIT License
•11•0•0•0•Updated May 22, 2024May 22, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

liuzjvip

All

All

44 repositories

handcrafted-persona-engine

ChatTTS-ui

douyin-downloader

DouyinLiveWebFetcher

index-tts

Bark-Voice-Cloning

A-customizable-audiobook-generator-based-on-GPT-SoVITS-for-personalized-voice-tones.

VideoEpicCreator

easytts

Tailor

DigitalHumanDemo

bailing

story-flicks

AI-Video-Editing-Assistant

AI-Video-Editing-Assistant-

Linly-Talker

imgocr

DouyinLivetts

novel2video

id-photo-wechat

photo

HivisionIDPhotos

auto-video-generateor

omniparse

autocut

StoryDiffusion

lpanda

EmotiVoice

Semi-Auto-NovelAI-to-Pixiv

ai-server

All

All

Repositories list

44 repositories