Parler-TTS:完全开源的TTS - 可以指定说话者的性别、语速、音调

打不倒的小乖兽 2024-04-12 10:42:50 浏览数 (378)
反馈

1、Parler-TTS:完全开源的TTS

可以指定说话者的性别、语速、音调,模型数据集、预处理、训练代码、权重全部开源。目前只支持英文。

在线体验:https://huggingface.co/spaces/parler-tts/parler_tts_mini

Github:https://github.com/huggingface/parler-tts

2、RWKV发布v5和v6版本

非Transformer的LLM架构,目前还是很小众。

论文:https://arxiv.org/abs/2404.05892

模型:https://huggingface.co/RWKV

3、Meta宣布第二代芯片MTIAv2

5nm工艺,目前只能用于推理,说是未来也会用于训练(CUDA咋解决?)

官方博客:https://ai.meta.com/blog/next-generation-meta-training-inference-accelerator-AI-MTIA/

4、Stable Diffusion 生态论文精选

整理的非常细致,地址:https://latentbox.com/zh/sd-ecology

5、多语言LLM综述 梳理了多语言LLM相关论文、语料数据、排行榜,总结了多语言LLM发展现状。 论文:https://arxiv.org/abs/2404.04925

Untitled


0 人点赞