Thanks to visit codestin.com
Credit goes to github.com

Skip to content
Change the repository type filter

All

    Repositories list

    • handcrafted-persona-engine - Live2D AI 虚拟人系统 亮点 • 🧠 对话:接入本地/云端 LLM,自定义性格,支持中断识 别 • 🗣️ 语音:Whisper 实时识别 + TTS 合成 + 可选声音克隆(RVC) • 🎨 动作:支持 Live2D 表情控制、眨眼、Idle 动画 • 👀 感知:可读取屏幕文字,实现“看得见”的 AI • 📺 推流:Spout 输出,无缝接入 OBS • 🎛️ UI 面板:实时查看延迟、调节语速音调 • 🧹 脏话过滤 + JSON 配置 + 模块化设计
      C#
      98000Updated Apr 22, 2025Apr 22, 2025
    • 一个简单的本地网页界面,使用ChatTTS将文字合成为语音,同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthesize text into speech, along with support for external API interfaces.
      Python
      903000Updated Apr 21, 2025Apr 21, 2025
    • 抖音批量下载工具,去水印,支持视频、图集、合集、音乐(原声)。免费!免费!免费!
      Python
      843000Updated Apr 11, 2025Apr 11, 2025
    • 抖音直播间网页版的弹幕数据抓取(2025最新版本)
      Python
      460000Updated Apr 9, 2025Apr 9, 2025
    • index-tts

      Public
      An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
      Python
      1.6k000Updated Apr 9, 2025Apr 9, 2025
    • notebooks文件夹下,🥳💕🎶 NeuCo AI歌手,无需训练、一键翻唱,🌟 只需10秒音频,一键翻唱任意歌手的任意歌曲!相较于传统的ASVC,NeuCoSVC只需要上传一个角色的声音,然后就能模拟这个角色的声音唱歌。NeuCo AI的特色亮点: 🎤 NeuCoSVC是一个虚拟项目,可用于模拟角色的声音唱歌 🎧 建议上传你喜欢的参考音频,然后选择时间长度以及声音去除等操作 🎶 可选择上传B站视频或本地音频,并在上传后选择是否加入歌曲伴奏Bark Voice Cloning and Voice Cloning for Chinese Speech
      Jupyter Notebook
      420000Updated Apr 6, 2025Apr 6, 2025
    • 通过AI实现对话者的识别并进行文段分割,再接入语音合成,自动生成有声小说
      Python
      4000Updated Apr 3, 2025Apr 3, 2025
    • 一款基于Python和PyQt6开发的智能视频混剪工具,专为短剧创作者设计。利用多种AI大模型实现自动字幕识别、智能混剪、特效添加等功能,并与剪映等主流剪辑软件深度集成。
      Python
      31000Updated Apr 2, 2025Apr 2, 2025
    • easytts

      Public
      打造最简单的TTS前端集合,最简单的有声小说制作工作流。基于正则规则对小说进行分句,基于RoBERTa对小说中的对话进行说话人识别,从而实现一键式生成多人有声小说。多说话人的语音合成,高质量的有声小说制作。
      Python
      25000Updated Mar 29, 2025Mar 29, 2025
    • Tailor

      Public
      Tailor是一款视频智能裁剪、视频生成和视频优化的视频剪辑工具。目前的目标是通过人工智能技术减少视频剪辑的繁琐操作,让普通人也能简单实现专业剪辑人的水准!长远目标是让视频剪辑实现真正的AIGC!
      Python
      112000Updated Mar 18, 2025Mar 18, 2025
    • 整合GPT-SoVITS与MuseTalk实现2D数字人视频合成,结合rhubarb实现3D数字人嘴唇驱动
      Python
      2000Updated Mar 18, 2025Mar 18, 2025
    • bailing

      Public
      百聆 是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,集成DeepSeek R1等优秀大模型,时延低至800ms,Mac等低配置也可运行,支持打断
      Python
      255000Updated Mar 15, 2025Mar 15, 2025
    • 一键生成高清故事短视频的AI工具:story-flicks,可以做儿童故事 输入一个故事主题,它就会用AI模型生成故事内容、图像、配音以及字幕,最终合成完整视频 可以自定义故事主题、分段数量、配音风格、视频语言等 使用AI大模型,一键生成高清故事短视频。Generate high-definition story short videos with one click using AI large models.
      Python
      354000Updated Mar 12, 2025Mar 12, 2025
    • 智能视频剪辑助手Smart Video Editing Assistant 一个基于Python的智能视频剪辑工具,支持文案驱动剪辑和智能生成剪辑功能。 模型MiniCPM-o-2.6多模态
      Python
      4000Updated Mar 1, 2025Mar 1, 2025
    • 智能视频剪辑助手Smart Video Editing Assistant 一个基于Python的智能视频剪辑工具,支持文案驱动剪辑和智能生成剪辑功能。 模型MiniCPM-o-2.6多模态
      Python
      4000Updated Mar 1, 2025Mar 1, 2025
    • Digital Avatar Conversational System - Linly-Talker. 😄✨ Linly-Talker is an intelligent AI system that combines large language models (LLMs) with visual models to create a novel human-AI interaction method. 🤝🤖 It integrates various technologies like Whisper, Linly, Microsoft Speech Services, and SadTalker talking head generation system. 🌟🔬
      Python
      473000Updated Feb 24, 2025Feb 24, 2025
    • imgocr

      Public
      Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理,可实现 CPU 上毫秒级的 OCR 精准预测,通用场景中英文OCR达到开源SOTA。
      Python
      15000Updated Jan 22, 2025Jan 22, 2025
    • 基于saermart大佬开源的抖音弹幕抓取,实现的tts语音播放
      Python
      14000Updated Jan 16, 2025Jan 16, 2025
    • ai 小说推文/漫画推文 支持sdui & comfyui
      Python
      77000Updated Jan 11, 2025Jan 11, 2025
    • 证件照小程序——前端(第三套)
      JavaScript
      66000Updated Dec 27, 2024Dec 27, 2024
    • photo

      Public
      证件照小程序——前端(第一套)
      JavaScript
      89000Updated Dec 27, 2024Dec 27, 2024
    • ⚡️HivisionIDPhotos: a lightweight and efficient AI ID photos tools. 一个轻量级的AI证件照制作算法。
      Python
      2.2k000Updated Nov 20, 2024Nov 20, 2024
    • 自动视频生成器,给定主题,自动生成解说视频。用户输入主题文字,系统调用大语言模型生成故事或解说的文字,然后进一步调用语音合成接口生成解说的语音,调用文生图接口生成契合文字内容的配图,最后融合语音和配图生成解说视频。
      Python
      152000Updated Nov 13, 2024Nov 13, 2024
    • omniparse

      Public
      一个可以把各种非结构化数据转为结构化数据的工具:OmniParse,本地运行,支持约20种文件格式 支持文档、表格、图像、视频、音频、网页等,能提取表格、识别图片内容、转录音视频、爬取网页,把数据转成高结构化Markdown 格式 适合需要批量处理各种数据并用于AI应用的场景,目前支持Linux系统
      Python
      532000Updated Nov 3, 2024Nov 3, 2024
    • autocut

      Public
      用文本编辑器剪视频
      Python
      772000Updated Oct 5, 2024Oct 5, 2024
    • 一款由南开大学HVision团队开发的人工智能工具,主要功能包括生成连贯的图像和视频故事,以及漫画生成创作。
      Jupyter Notebook
      650000Updated Sep 26, 2024Sep 26, 2024
    • lpanda

      Public
      AI 小说生成推文漫画视频
      JavaScript
      24000Updated Sep 12, 2024Sep 12, 2024
    • EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
      Python
      734000Updated Aug 13, 2024Aug 13, 2024
    • 带有 WebUI 的 NovelAI 量产工具, 实现了批量文生图; 批量图生图; 视频转绘; 分块重绘; 批量 Vibe; 批量局部重绘; 批量超分降噪; 批量自动打码; 批量添加水印; 批量上传 Pixiv; 图片筛选; 批量抹除, 还原或导出生成信息; 法术解析; 多模型反推提示词; ChatGPT; 动态加载插件; 自动 roll 画风串; 批量 Enhance; tag选择器; 涂鸦重绘
      Python
      37000Updated Jul 27, 2024Jul 27, 2024
    • ai-server

      Public
      JAVA版本的PaddleOCR和rapidocr 不依赖第三方
      Java
      11000Updated May 22, 2024May 22, 2024