Thanks to visit codestin.com
Credit goes to www.meta-speech.com

元语音研究网
首页推荐关注语音文本图像大模型
    登录
    首页
    话题
    首页
    推荐
    关注
    语音
    文本
    图像
    大模型
    消息
    登录
    最新
    推荐
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于3天前

      MOE结构讲解不错的文章

      文章链接
      赞
      评论
      浏览 14
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于4天前

      IndexTTS 2.5 Technical Report

      论文链接 Demo 链接
      赞
      评论
      浏览 13
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于5天前

      FLOW2GAN: HYBRID FLOW MATCHING AND GAN WITH MULTI-RESOLUTION NETWORK FOR FEW-STEP HIGH-FIDELITY AUDIO GENERATION

      论文链接 代码链接
      赞
      评论
      浏览 30
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于6天前

      【ASR+WFST的第二春】IKFST: IOO and KOO Algorithms for Accelerated and Precise WFST-based End-to-End Automatic Speech Recognition

      论文链接
      赞 1
      评论
      浏览 150
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于6天前

      向量量化-RVQ/FSQ实现代码

      代码链接
      赞
      评论
      浏览 24
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于9天前

      《让炼丹更科学一些(五):基于梯度精调学习率》

      https://kexue.fm/archives/11530 这篇文章开始,我们考虑基于梯度的学习率调度,它有助于我们了解诸如 Warmup、Decay 等学习率策略的原理,也能为各种自适应学习率优化器提供有益的参考。
      赞
      评论
      浏览 37
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于9天前

      【内源性奖励】GENERALIST REWARD MODELS: FOUND INSIDE LARGE LANGUAGE MODELS

      论文链接
      赞
      评论
      浏览 17
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于10天前

      Qwen 门控注意力Gated Attention

      论文链接 解读链接
      赞
      评论
      浏览 22
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于10天前

      杰出研究员-Jason Wei

      网站链接 思考 Google Scholar
      赞
      评论
      浏览 26
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于12天前

      MULTILINGUAL VISUAL SPEECH RECOGNITION WITH A SINGLE MODEL BY LEARNING WITH DISCRETE VISUAL SPEECH UNITS

      论文链接
      赞
      评论
      浏览 29
      大模型&多模态
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于13天前

      SLAM-Omni

      论文链接 代码链接 数据链接 Demo 链接
      赞 1
      评论
      浏览 37
      大模型&多模态
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于13天前

      OSUM-EChat

      论文链接 代码链接
      赞
      评论
      浏览 41
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于14天前

      Qwen-2.5 Omni代码讲解

      视频链接
      赞
      评论
      浏览 36
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于14天前

      《DiVeQ:一种非常简洁的VQ训练方案》

      https://kexue.fm/archives/11328 本文介绍了 VQ(Vector Quantization)的一种新的训练方案,它只需通过 STE 实现,不需要加额外的 Aux Loss,从而显得特别简洁优雅。
      赞
      评论
      浏览 35
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于14天前

      《MuP之上:1. 好模型的自我修养》

      https://kexue.fm/archives/11340 从这篇文章开始,笔者会分享一些自上而下的模型优化的尝试,它是笔者在之前的“高阶 MuP”基础上的延伸思考和拓展。作为第一篇文章,我们主要描述了关于模型稳定性的三个基本条件,它将是后面进行计算和...
      赞
      评论
      浏览 27
      文本
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于14天前

      《低精度Attention可能存在有偏的舍入误差》

      https://kexue.fm/archives/11371 本文分享了一篇关于低精度 Attention 计算偏差的分析论文,同时借着这个机会,给自己补习了一下低精度计算的基础内容。
      赞
      评论
      浏览 34
      文本
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于14天前

      《流形上的最速下降:5. 对偶梯度下降》

      https://kexue.fm/archives/11388 这篇文章我们介绍了通过对偶梯度下降来寻找流形上的最速下降方向的思路,它也是前段时间 Thinking Machines Lab 的博客《Modular Manifolds》用来求解 Stief...
      赞
      评论
      浏览 40
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于14天前

      《n个正态随机数的最大值的渐近估计》

      https://kexue.fm/archives/11390 本文用三种不同的方法估计了 n 个正态随机数的最大值的数学期望,并由所得结果对低精度 Attention 矩阵中出现重复最大值的概率做了简单估计。
      赞
      评论
      浏览 35
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于14天前

      《Muon优化器指南:快速上手与关键细节》

      https://kexue.fm/archives/11416
      赞
      评论
      浏览 37
      文本
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于14天前

      《AdamW的Weight RMS的渐近估计(下)》

      https://kexue.fm/archives/11404 本文将上篇的结果推广到了动态版,允许我们估计随时间变化的学习率和 Weight Decay 之下的 AdamW 的 Weight RMS。
      赞
      评论
      浏览 32
      语音
    签到
    0
    立即签到
    公告

    元语音研究网站板块设计:【CP】Conference Paper,【JP】Journal Paper,【TR】Technique Report,【优秀导师】,【优秀研究员】,【优秀博士生】

    积分排行
    • 元语音
      元语音

      311 帖子 • 51 评论

      2087
    • Speech
      Speech

      166 帖子 • 24 评论

      1292
    • AI柠檬
      AI柠檬

      14 帖子 • 16 评论

      517
    • 江南一点红
      江南一点红

      1 帖子 • 1 评论

      46
    • 懵
      懵懵懂懂的新手

      1 帖子 • 17 评论

      39
    • M
      Mephisto

      0 帖子 • 4 评论

      28
    • 後藤ひとり
      後藤ひとり

      0 帖子 • 0 评论

      23
    • 心行
      心行

      2 帖子 • 0 评论

      20
    • 出东巷
      出东巷

      0 帖子 • 0 评论

      15
    • betciso
      betciso

      0 帖子 • 1 评论

      12
    关于 标签 友链
    © 2024 元语音研究网   由 AI柠檬 提供技术支持
    沪ICP备2022004527号-2