天谪科技前沿

聚焦全球AI工具与科技产品,收录官网、使用指南、案例分析、常见问题与动态更新。

全球AI工具与科技产品导航

覆盖 AI聊天、AI图像、AI写作、AI编程等方向,持续更新产品官网、使用指南、案例与问答。

已收录栏目 36 个 · 已发布内容 1575 篇

搜索结果:音频

共 60 条

Descript-17:全能型AI视频与音频编辑工具

人工智能工具

Descript-17是一款集成了AI技术的视频和音频编辑软件,支持文本驱动编辑、自动转录、语音克隆、屏幕录制和协作功能,让内容创作变得像编辑文档一样简单。它适用于播客制作、视频剪辑、营销内容

官网

Cleanvoice:智能音频清理工具,一键去除噪音与填充词

人工智能工具

Cleanvoice 是一款基于人工智能的音频处理工具,能够自动识别并去除录音中的背景噪音、填充词(如“嗯”“啊”)、长时间静音以及口齿不清等瑕疵,适用于播客、会议录音、采访、在线课程等多种场

官网

Descript-42:全能型AI视频与音频编辑工具,革新内容创作流程

人工智能工具

Descript-42是一款集视频编辑、音频编辑、字幕生成、屏幕录制、AI语音克隆与文本转语音于一体的智能创作平台。它利用先进的AI技术,让用户像编辑文档一样编辑视频和音频,大幅提升内容制作效

官网

Descript-38:全能型AI音频与视频编辑工具

人工智能工具

Descript-38是一款集音频编辑、视频编辑、文本转语音、语音克隆、屏幕录制与协作于一体的AI驱动创作平台。它利用先进的语音识别和自然语言处理技术,让用户像编辑文档一样编辑音频和视频,极大

官网

Descript-28:全能型AI视频与音频编辑工具

人工智能工具

Descript-28是一款集视频编辑、音频编辑、字幕生成、屏幕录制和AI语音克隆于一体的全能型创作工具。它利用人工智能技术,让用户像编辑文档一样轻松编辑视频和音频,支持实时协作,适合内容创作

官网

Descript-27:专业级AI音频与视频编辑工具

人工智能工具

Descript-27是一款集成了人工智能技术的专业音频和视频编辑工具,支持文本驱动的编辑、语音克隆、自动字幕生成和协作工作流,适用于播客、视频制作和内容创作。

官网

Descript-26:全能型AI音频与视频编辑工具

人工智能工具

Descript-26是一款集音频编辑、视频编辑、转录、屏幕录制和协作功能于一体的AI驱动工具,支持文本编辑音频、自动填充、语音克隆等创新功能,适合内容创作者、播客制作者和团队协作使用。

官网

Descript-25:新一代AI驱动的音频与视频编辑工具

人工智能工具

Descript-25是一款基于人工智能的音频和视频编辑软件,提供文本编辑式剪辑、语音克隆、自动转录、降噪等功能,帮助内容创作者、播客制作者和视频编辑者高效完成后期制作。其核心优势在于将音视频

官网

Descript-19:专业级AI音频与视频编辑工具

人工智能工具

Descript-19是一款集AI音频编辑、视频编辑、文本转语音和屏幕录制于一体的专业工具,支持实时协作,适合内容创作者、播客制作者和团队使用。

官网

Murph AI:智能语音合成与音频内容创作平台

人工智能工具

Murph AI 是一款基于人工智能的语音合成与音频内容创作平台,支持文本转语音、多语言配音、情感表达和自定义声音克隆,适用于播客、有声书、视频配音、广告制作等多种场景。其核心优势在于生成自然

官网

Descript-14:专业级AI音频与视频编辑平台

人工智能工具

Descript-14是一款集成了人工智能技术的音频和视频编辑工具,支持文本驱动的编辑、语音克隆、自动字幕生成等功能,帮助创作者高效制作高质量多媒体内容。

官网

Riverside:专业级远程录音与AI音频处理平台

人工智能工具

Riverside是一款专为播客、采访和远程录音设计的专业工具,提供本地录制、AI降噪、自动转录和视频编辑功能,确保高质量音频和视频输出。

官网

Podcastle:一站式AI播客与音频创作平台

人工智能工具

Podcastle是一款集AI语音合成、远程录音、音频编辑和文本转语音于一体的智能播客创作工具,帮助内容创作者、营销人员和媒体人轻松录制、编辑和发布专业级音频内容。

官网

Sunno AI:智能音乐创作与音频处理平台

人工智能工具

Sunno AI 是一款基于人工智能的音乐生成与音频处理工具,能够帮助用户快速创作原创音乐、生成背景音效、进行语音合成与音频编辑。适用于内容创作者、音乐制作人、开发者及企业用户,无需专业音乐知

官网

Audo.ai:智能音频修复与增强的一站式AI解决方案

人工智能工具

Audo.ai是一款基于先进人工智能技术的专业音频处理工具,致力于为用户提供高效、高质量的音频修复、降噪、增强和优化服务。它能够智能识别并消除录音中的背景噪音、杂音、回声等干扰,同时提升人声清

官网

Fliki:AI驱动的视频与音频内容创作平台

人工智能工具

Fliki是一款基于人工智能的视频与音频内容创作工具,能够将文本、博客文章或脚本快速转换为高质量、带有人工智能语音旁白的视频或音频内容,极大地简化了内容创作流程,适用于营销、教育、社交媒体等多

官网

Descript AI Editor:全能型AI视频与音频编辑工具

人工智能工具

Descript AI Editor是一款集成AI技术的视频和音频编辑软件,支持文本驱动编辑、语音克隆、自动字幕生成、屏幕录制及协作功能,适用于内容创作者、播客制作者和团队协作,大幅提升编辑效

官网

Descript 40:全能型AI音频与视频编辑工具,重塑内容创作流程

人工智能工具

Descript 40是一款集AI语音合成、文本转语音、视频编辑、音频修复和协作功能于一体的创新工具。它通过智能转录、语音克隆、多轨编辑和实时协作,大幅简化播客、视频、演示文稿等内容的制作流程

官网

Stable Audio 3:AI音乐生成工具,专业级音频创作与编辑

人工智能工具

Stable Audio 3 是 Stability AI 推出的最新 AI 音乐生成工具,支持文本到音频、音频到音频的转换,提供高质量、可商用的音乐和音效生成,适用于音乐制作、视频配乐、游戏

官网

Descript 37:全能型AI音频与视频编辑工具

人工智能工具

Descript 37是一款集音频编辑、视频编辑、文本转语音、AI语音克隆、屏幕录制和协作功能于一体的智能创作平台。它利用先进的AI技术,让用户像编辑文档一样轻松编辑音频和视频,支持实时转录、

官网

Udio-7:专业级AI音乐生成与音频创作平台

人工智能工具

Udio-7是一款基于深度学习技术的AI音乐生成工具,支持文本到音乐、旋律创作、多风格混音及实时协作,适用于音乐制作人、内容创作者和开发者,提供高保真音频输出与灵活的API集成。

官网

Stability AI - 领先的开源人工智能模型平台,赋能图像、视频、音频与3D创作

人工智能工具

Stability AI 是一家致力于开源人工智能模型研发与部署的领先公司,旗下拥有 Stable Diffusion 系列模型,支持文本生成图像、视频、音频、3D 内容及编程辅助。平台提供

官网

Stable Audio 3:AI驱动的专业音乐生成与音频编辑工具

人工智能工具

Stable Audio 3 是 Stability AI 推出的最新音频生成模型,能够根据文本描述或参考音频生成高质量、结构完整的音乐和音效。支持最长 3 分钟的立体声输出,具备音频到音频转

官网

Stable Audio 2.0:AI驱动的专业级音乐与音频生成工具

人工智能工具

Stable Audio 2.0是Stability AI推出的最新版本AI音频生成模型,能够根据文本描述或音频参考生成高质量、多轨道的音乐和音效。支持长达3分钟的完整曲目创作,提供风格控制、

官网

Sunno V33:专业级AI音乐生成与音频处理工具

人工智能工具

Sunno V33是一款集成了先进人工智能技术的音乐生成与音频处理工具,专为音乐创作者、制作人和音频工程师设计。它利用深度学习模型,能够从文本描述、旋律片段或和弦进行中自动生成高质量的音乐作品

官网

ElevenLabs Prime Audio 2:专业级AI语音合成与音频处理平台

人工智能工具

ElevenLabs Prime Audio 2是一款面向专业用户的高质量AI语音合成与音频处理工具,支持多语言、多情感、多音色的语音生成,并提供实时语音克隆、音频编辑和API集成功能,适用于

官网

Adobe Podcast:专业级AI音频编辑与增强工具

人工智能工具

Adobe Podcast 是 Adobe 推出的一款基于人工智能的在线音频编辑平台,专为播客创作者、视频制作者和内容创作者设计。它利用先进的 AI 技术自动去除背景噪音、优化语音清晰度,并提

官网

Rask AI:一站式多语言视频与音频本地化工具

人工智能工具

Rask AI 是一款基于人工智能的视频和音频本地化平台,支持多语言翻译、语音克隆、唇形同步等功能,帮助内容创作者和企业快速将视频内容转化为多种语言,拓展全球受众。

官网

Resemble:领先的AI语音合成与音频生成平台

人工智能工具

Resemble是一款专注于AI语音合成、音频克隆和自定义语音生成的先进平台,适用于内容创作者、开发者和企业。它提供高保真度的语音克隆、情感表达、多语言支持以及实时API,广泛应用于播客、有声

官网

AudioCraft:Meta开源AI音乐与音频生成框架,轻松创作高质量音频

人工智能工具

AudioCraft是Meta AI推出的开源音频生成框架,包含MusicGen、AudioGen和EnCodec三大组件,支持文本生成音乐、音频修复、音效合成等任务,提供预训练模型和Pyth

官网

Listnr:AI语音合成与文本转语音工具,打造自然逼真的音频内容

人工智能工具

Listnr是一款基于人工智能的文本转语音(TTS)工具,支持多种语言和声音,能够快速将文字转换为自然流畅的音频。适用于播客、有声书、视频配音、教育内容等多种场景,帮助用户高效生成专业级音频内

官网

Descript Studio Sound:AI驱动的专业音频修复与增强工具

人工智能工具

Descript Studio Sound是一款基于人工智能的音频处理工具,能够一键去除背景噪音、修复录音瑕疵并提升音质,适用于播客、视频制作、语音笔记等场景,让任何录音都达到专业级水准。

官网

Synthesys:全能型AI内容创作平台,赋能文本、图像、音频与视频生成

人工智能工具

Synthesys是一款集文本、图像、音频和视频生成于一体的全能型AI内容创作平台。它提供超过400种AI语音、丰富的视频模板和强大的图像生成能力,帮助用户高效创建专业级营销内容、社交媒体素材

官网

Fliki AI:一站式AI视频与音频内容创作平台

人工智能工具

Fliki AI是一款功能强大的一站式AI内容创作工具,专注于将文本、博客文章或想法快速转化为高质量的视频和音频内容。它集成了先进的文本转语音、AI语音克隆、AI图像生成和视频编辑功能,旨在帮

官网

Stable Audio:专业级AI音乐生成与音频编辑工具

人工智能工具

Stable Audio是由Stability AI推出的专业AI音乐生成与音频编辑平台,基于先进的音频扩散模型,能够根据文本描述生成高质量、结构完整的音乐片段和音效,支持自定义时长、风格和参

官网

Stable Audio 2.0:革命性的AI音乐与音频生成平台

人工智能工具

Stable Audio 2.0是由Stability AI推出的下一代AI音频生成模型,能够根据文本描述生成高质量、立体声、最长可达三分钟的完整音乐曲目或音效,在音乐创作、内容制作和声音设计

官网

Veed AI Tools:一站式在线AI视频与音频创作平台

人工智能工具

Veed AI Tools 是一个集成了多种人工智能功能的在线视频与音频编辑平台,旨在通过AI技术简化内容创作流程,为用户提供从文本生成、语音合成到视频编辑、字幕添加等一站式解决方案,尤其适合

官网

Google Gemini Ultra:下一代多模态人工智能模型深度解析

人工智能工具

Google Gemini Ultra是谷歌推出的最先进、规模最大的多模态AI模型,具备处理文本、图像、音频、视频和代码等多种信息类型的能力。它在复杂推理、多模态理解和代码生成方面表现出色,为

官网

Gemini 2.0:谷歌新一代多模态AI模型,开启智能应用新纪元

人工智能工具

Gemini 2.0是谷歌推出的最新一代多模态人工智能模型,具备强大的文本、图像、音频、视频和代码理解与生成能力。它专为开发者、企业和创意工作者设计,提供高性能的API接口,支持复杂推理、实时

官网

Google Gemini 2:下一代多模态人工智能模型深度解析

人工智能工具

Google Gemini 2是谷歌推出的最新一代多模态人工智能模型,集成了文本、图像、音频、视频和代码处理能力,旨在为开发者和企业提供更强大、更高效的AI解决方案。本文详细介绍其核心功能、技

官网

Gemini 2.5 Pro 0325:谷歌新一代多模态AI模型深度解析

人工智能工具

Gemini 2.5 Pro 0325是谷歌推出的最新旗舰级多模态AI模型,具备强大的推理能力、长上下文窗口(100万token)以及原生多模态处理能力。它能够同时理解文本、图像、音频、视频和

官网

Gemini Ultra:Google最强AI模型,引领多模态智能新纪元

人工智能工具

Gemini Ultra是Google DeepMind推出的顶级多模态AI模型,具备强大的推理、理解和生成能力,支持文本、图像、音频、视频和代码等多种输入输出形式,适用于复杂任务处理、科研分

官网

Descript-12:全能型AI音视频编辑与创作平台

人工智能工具

Descript-12是一款集音频编辑、视频剪辑、字幕生成、语音克隆与文本转语音于一体的AI驱动创作工具,支持多轨道编辑、实时协作和智能脚本修改,极大提升内容制作效率。

官网

Google Gemini 3:下一代多模态AI模型,开启智能交互新纪元

人工智能工具

Google Gemini 3是谷歌推出的最新一代多模态人工智能模型,融合文本、图像、音频、视频和代码理解能力,提供强大的推理、生成和交互功能。作为AI开发的核心工具,Gemini 3在自然语

官网

Google Gemini 2.5 Pro:下一代多模态AI模型深度解析

人工智能工具

Google Gemini 2.5 Pro是谷歌推出的最新一代多模态AI模型,具备强大的推理能力、长上下文窗口(高达100万token)以及原生多模态处理能力。它能够同时理解文本、图像、音频、

官网

Google Gemini 2.0:新一代多模态AI模型深度解析与应用指南

人工智能工具

Google Gemini 2.0是谷歌推出的最新一代多模态人工智能模型,具备文本、图像、音频、视频和代码的深度理解与生成能力。本文详细介绍其核心功能、技术优势、应用场景及开发实践,帮助开发者

官网

Gemini 1.5:谷歌新一代多模态AI模型深度解析与应用指南

人工智能工具

Gemini 1.5是谷歌推出的先进多模态AI模型,具备超长上下文窗口(最高100万token)、强大的文本、图像、音频、视频理解能力,以及高效的推理性能。本文详细介绍其核心功能、技术优势、适

官网

Jina AI:下一代神经搜索与多模态AI开发平台

人工智能工具

Jina AI 是一个开源的神经搜索框架,专为构建跨模态(文本、图像、音频、视频)的智能搜索与理解系统而设计。它提供云原生架构、可扩展的嵌入模型和高效的向量检索能力,帮助开发者快速搭建语义搜索

官网

Udio v1.5:AI音乐生成工具全面升级,创作专业级音频

人工智能工具

Udio v1.5是一款先进的AI音乐生成工具,基于深度学习技术,能够根据用户输入快速生成高质量、风格多样的音乐作品。它支持文本描述、旋律提示和参数调整,适用于音乐制作、内容创作、游戏音效等场

官网

Gemini 2.5:谷歌下一代多模态AI模型,赋能开发与创意

人工智能工具

Gemini 2.5是谷歌推出的最新多模态AI模型,具备强大的推理、代码生成和多媒体理解能力,适用于开发工具、数据分析、内容创作等多个场景。本文详细介绍其核心功能、技术优势及实际应用,帮助开发

官网

Stability AI Stable Audio 2.0:智能音乐生成工具,助力创意制作

人工智能工具

Stable Audio 2.0 是 Stability AI 推出的新一代人工智能音乐生成工具,基于扩散模型技术,能够根据文本描述或音频参考生成高质量、结构完整的音乐片段。支持最长3分钟的音

官网

Murf AI V2:专业级文本转语音与语音合成工具

人工智能工具

Murf AI V2是一款基于人工智能的文本转语音(TTS)和语音合成平台,提供超过120种自然逼真的AI语音,支持多种语言和口音,适用于视频制作、播客、电子学习、广告配音等场景。其V2版本在

官网

ElevenLabs Voice Cloning V3:高保真AI语音克隆与合成工具

人工智能工具

ElevenLabs Voice Cloning V3 是业界领先的AI语音克隆与合成平台,支持从短音频样本中生成高度逼真、富有情感和语调的自然语音。该工具适用于内容创作、配音、有声书制作、虚

官网

ElevenLabs Voice Isolator V7:专业级AI语音分离与降噪工具

人工智能工具

ElevenLabs Voice Isolator V7 是一款基于深度学习的先进语音隔离工具,能够从嘈杂的音频中精准提取人声,去除背景噪音、音乐和其他干扰,适用于播客制作、视频配音、会议录音

官网

Descript AI Studio:全能型AI驱动音视频与内容创作平台

人工智能工具

Descript AI Studio 是一款集音频编辑、视频制作、屏幕录制、字幕生成、文本转语音、AI语音克隆及协作功能于一体的综合性创作工具。它利用先进的AI技术,让用户像编辑文档一样轻松编

官网

Gemini 2.0 Flash:谷歌新一代快速响应AI模型,赋能开发与创意

人工智能工具

Gemini 2.0 Flash 是谷歌推出的新一代高性能AI模型,专注于极速响应、多模态理解和高效推理。它专为开发者、数据科学家和创意工作者设计,能够处理文本、图像、音频和视频等多种输入,在

官网

ElevenLabs Voice Isolator V2:新一代AI语音隔离与降噪工具

人工智能工具

ElevenLabs Voice Isolator V2 是 ElevenLabs 推出的第二代语音隔离模型,能够从任意音频中精准提取人声,去除背景噪音、音乐和其他干扰。该工具基于深度学习技术

官网

ElevenLabs Voice Design v4.0:下一代AI语音定制与合成工具

人工智能工具

ElevenLabs Voice Design v4.0 是一款先进的AI语音设计与合成工具,支持用户通过文本描述或参考音频快速生成高度逼真、情感丰富的自定义语音。该版本引入了更精细的音色控制

官网

Hugging Face:一站式人工智能模型平台与社区

人工智能工具

Hugging Face 是一个领先的人工智能平台,提供丰富的预训练模型、数据集和工具,支持自然语言处理、计算机视觉、音频处理等多领域任务。其核心产品包括 Transformers 库、Hug

官网

Hugging Face Transformers:一站式自然语言处理与深度学习模型库

人工智能工具

Hugging Face Transformers 是一个开源的 Python 库,提供数千个预训练的深度学习模型(如 BERT、GPT、T5 等),支持自然语言处理、计算机视觉、音频处理等任

官网
版权申明:© 2026 www.tianzhe.cn 天谪科技前沿 云南天谪网络科技有限公司 版权所有 | 联系邮箱:xx402365@qq.com | 滇ICP备2024037079号-1