- [浏览需要 0 积分] 发布于5天前
FLOW2GAN: HYBRID FLOW MATCHING AND GAN WITH MULTI-RESOLUTION NETWORK FOR FEW-STEP HIGH-FIDELITY AUDIO GENERATION
论文链接 代码链接赞评论浏览 30 - [浏览需要 0 积分] 发布于6天前
【ASR+WFST的第二春】IKFST: IOO and KOO Algorithms for Accelerated and Precise WFST-based End-to-End Automatic Speech Recognition
论文链接赞 1评论浏览 150 - [浏览需要 0 积分] 发布于9天前赞评论浏览 17
- [浏览需要 0 积分] 发布于12天前
MULTILINGUAL VISUAL SPEECH RECOGNITION WITH A SINGLE MODEL BY LEARNING WITH DISCRETE VISUAL SPEECH UNITS
论文链接赞评论浏览 29 - [浏览需要 0 积分] 发布于14天前
《低精度Attention可能存在有偏的舍入误差》
https://kexue.fm/archives/11371 本文分享了一篇关于低精度 Attention 计算偏差的分析论文,同时借着这个机会,给自己补习了一下低精度计算的基础内容。赞评论浏览 34 - [浏览需要 0 积分] 发布于14天前
《n个正态随机数的最大值的渐近估计》
https://kexue.fm/archives/11390 本文用三种不同的方法估计了 n 个正态随机数的最大值的数学期望,并由所得结果对低精度 Attention 矩阵中出现重复最大值的概率做了简单估计。赞评论浏览 35 - [浏览需要 0 积分] 发布于14天前
《AdamW的Weight RMS的渐近估计(下)》
https://kexue.fm/archives/11404 本文将上篇的结果推广到了动态版,允许我们估计随时间变化的学习率和 Weight Decay 之下的 AdamW 的 Weight RMS。赞评论浏览 32