AI日报:字节推出“Seed-TTS”语音生成模型,开启情感表达新时代

科技 2024-06-06 16:26 阅读:

AI日报:字节推出“Seed-TTS”语音生成模型,开启情感表达新时代 第1张

字节推出了最新的语音生成模型Seed-TTS,该模型在情感控制、小说配音和跨语言内容创作等方面表现出色,声音与真人无异,开启了语音合成新时代。

Stability AI发布了开源文本转音频模型Stable Audio Open,可生成长达47秒的音频样本和音效,适用于音乐制作和声音设计,为用户提供了稳定的音频生成质量和长度,并支持音频变化和风格转换。

AI日报:字节推出“Seed-TTS”语音生成模型,开启情感表达新时代 第2张

Suno原本计划推出的新功能被竞争对手Udio抢先发布,Udio推出了一系列更新,帮助用户上传音频片段并自动解析旋律和和弦,创作出美妙的音乐,并提供了多项便利功能。

AI日报:字节推出“Seed-TTS”语音生成模型,开启情感表达新时代 第3张

Adobe更新了隐私条款,意味着有权将用户作品用于训练AI,引发了用户关注和担忧,影响到设计作品的隐私和知识产权保护,引发个人隐私权和知识产权保护讨论。

AI日报:字节推出“Seed-TTS”语音生成模型,开启情感表达新时代 第4张

腾讯发布了针对开源文生图大模型混元DiT的加速库,可将推理时间缩短75%,为用户提供更便捷的使用体验,推动大模型行业的发展。

MiGPT项目将小爱音箱、米家智能设备与ChatGPT技术相结合,创建智能家庭助手,实现家庭自动化并建立情感联系,提供了流式响应、长短期记忆、自定义TTS和智能家居Agent等功能,为用户创造智能贴心的家庭生活体验。

Motiff妙多是一款定位为AI时代设计工具的界面设计软件,通过AI技术优化设计流程,提高生产效率,为用户带来前所未有的设计体验,是国内首个自研图形渲染引擎的界面设计软件。

即梦宣布全量上线实时画布功能,用户可以通过简单涂抹形状并添加提示词定制图像,让AI画图更可控,提供了更多的画图选择和创作可能性。

谷歌的人工智能概述功能触发频率大幅下降,在搜索结果中的显示比例降低,说明人工智能在搜索中的应用不断演进,虽然概述功能减少,但人工智能在搜索中的作用是不可避免的变化。