覆盖 AI聊天、AI图像、AI写作、AI编程等方向,持续更新产品官网、使用指南、案例与问答。
已收录栏目 36 个 · 已发布内容 1575 篇
Descript-17是一款集成了AI技术的视频和音频编辑软件,支持文本驱动编辑、自动转录、语音克隆、屏幕录制和协作功能,让内容创作变得像编辑文档一样简单。它适用于播客制作、视频剪辑、营销内容
Cleanvoice 是一款基于人工智能的音频处理工具,能够自动识别并去除录音中的背景噪音、填充词(如“嗯”“啊”)、长时间静音以及口齿不清等瑕疵,适用于播客、会议录音、采访、在线课程等多种场
Descript-42是一款集视频编辑、音频编辑、字幕生成、屏幕录制、AI语音克隆与文本转语音于一体的智能创作平台。它利用先进的AI技术,让用户像编辑文档一样编辑视频和音频,大幅提升内容制作效
Descript-38是一款集音频编辑、视频编辑、文本转语音、语音克隆、屏幕录制与协作于一体的AI驱动创作平台。它利用先进的语音识别和自然语言处理技术,让用户像编辑文档一样编辑音频和视频,极大
Descript-28是一款集视频编辑、音频编辑、字幕生成、屏幕录制和AI语音克隆于一体的全能型创作工具。它利用人工智能技术,让用户像编辑文档一样轻松编辑视频和音频,支持实时协作,适合内容创作
Descript-27是一款集成了人工智能技术的专业音频和视频编辑工具,支持文本驱动的编辑、语音克隆、自动字幕生成和协作工作流,适用于播客、视频制作和内容创作。
Descript-26是一款集音频编辑、视频编辑、转录、屏幕录制和协作功能于一体的AI驱动工具,支持文本编辑音频、自动填充、语音克隆等创新功能,适合内容创作者、播客制作者和团队协作使用。
Descript-25是一款基于人工智能的音频和视频编辑软件,提供文本编辑式剪辑、语音克隆、自动转录、降噪等功能,帮助内容创作者、播客制作者和视频编辑者高效完成后期制作。其核心优势在于将音视频
Descript-19是一款集AI音频编辑、视频编辑、文本转语音和屏幕录制于一体的专业工具,支持实时协作,适合内容创作者、播客制作者和团队使用。
Murph AI 是一款基于人工智能的语音合成与音频内容创作平台,支持文本转语音、多语言配音、情感表达和自定义声音克隆,适用于播客、有声书、视频配音、广告制作等多种场景。其核心优势在于生成自然
Descript-14是一款集成了人工智能技术的音频和视频编辑工具,支持文本驱动的编辑、语音克隆、自动字幕生成等功能,帮助创作者高效制作高质量多媒体内容。
Podcastle是一款集AI语音合成、远程录音、音频编辑和文本转语音于一体的智能播客创作工具,帮助内容创作者、营销人员和媒体人轻松录制、编辑和发布专业级音频内容。
Sunno AI 是一款基于人工智能的音乐生成与音频处理工具,能够帮助用户快速创作原创音乐、生成背景音效、进行语音合成与音频编辑。适用于内容创作者、音乐制作人、开发者及企业用户,无需专业音乐知
Audo.ai是一款基于先进人工智能技术的专业音频处理工具,致力于为用户提供高效、高质量的音频修复、降噪、增强和优化服务。它能够智能识别并消除录音中的背景噪音、杂音、回声等干扰,同时提升人声清
Fliki是一款基于人工智能的视频与音频内容创作工具,能够将文本、博客文章或脚本快速转换为高质量、带有人工智能语音旁白的视频或音频内容,极大地简化了内容创作流程,适用于营销、教育、社交媒体等多
Descript AI Editor是一款集成AI技术的视频和音频编辑软件,支持文本驱动编辑、语音克隆、自动字幕生成、屏幕录制及协作功能,适用于内容创作者、播客制作者和团队协作,大幅提升编辑效
Descript 40是一款集AI语音合成、文本转语音、视频编辑、音频修复和协作功能于一体的创新工具。它通过智能转录、语音克隆、多轨编辑和实时协作,大幅简化播客、视频、演示文稿等内容的制作流程
Stable Audio 3 是 Stability AI 推出的最新 AI 音乐生成工具,支持文本到音频、音频到音频的转换,提供高质量、可商用的音乐和音效生成,适用于音乐制作、视频配乐、游戏
Descript 37是一款集音频编辑、视频编辑、文本转语音、AI语音克隆、屏幕录制和协作功能于一体的智能创作平台。它利用先进的AI技术,让用户像编辑文档一样轻松编辑音频和视频,支持实时转录、
Udio-7是一款基于深度学习技术的AI音乐生成工具,支持文本到音乐、旋律创作、多风格混音及实时协作,适用于音乐制作人、内容创作者和开发者,提供高保真音频输出与灵活的API集成。
Stability AI 是一家致力于开源人工智能模型研发与部署的领先公司,旗下拥有 Stable Diffusion 系列模型,支持文本生成图像、视频、音频、3D 内容及编程辅助。平台提供
Stable Audio 3 是 Stability AI 推出的最新音频生成模型,能够根据文本描述或参考音频生成高质量、结构完整的音乐和音效。支持最长 3 分钟的立体声输出,具备音频到音频转
Stable Audio 2.0是Stability AI推出的最新版本AI音频生成模型,能够根据文本描述或音频参考生成高质量、多轨道的音乐和音效。支持长达3分钟的完整曲目创作,提供风格控制、
Sunno V33是一款集成了先进人工智能技术的音乐生成与音频处理工具,专为音乐创作者、制作人和音频工程师设计。它利用深度学习模型,能够从文本描述、旋律片段或和弦进行中自动生成高质量的音乐作品
ElevenLabs Prime Audio 2是一款面向专业用户的高质量AI语音合成与音频处理工具,支持多语言、多情感、多音色的语音生成,并提供实时语音克隆、音频编辑和API集成功能,适用于
Adobe Podcast 是 Adobe 推出的一款基于人工智能的在线音频编辑平台,专为播客创作者、视频制作者和内容创作者设计。它利用先进的 AI 技术自动去除背景噪音、优化语音清晰度,并提
Rask AI 是一款基于人工智能的视频和音频本地化平台,支持多语言翻译、语音克隆、唇形同步等功能,帮助内容创作者和企业快速将视频内容转化为多种语言,拓展全球受众。
Resemble是一款专注于AI语音合成、音频克隆和自定义语音生成的先进平台,适用于内容创作者、开发者和企业。它提供高保真度的语音克隆、情感表达、多语言支持以及实时API,广泛应用于播客、有声
AudioCraft是Meta AI推出的开源音频生成框架,包含MusicGen、AudioGen和EnCodec三大组件,支持文本生成音乐、音频修复、音效合成等任务,提供预训练模型和Pyth
Listnr是一款基于人工智能的文本转语音(TTS)工具,支持多种语言和声音,能够快速将文字转换为自然流畅的音频。适用于播客、有声书、视频配音、教育内容等多种场景,帮助用户高效生成专业级音频内
Descript Studio Sound是一款基于人工智能的音频处理工具,能够一键去除背景噪音、修复录音瑕疵并提升音质,适用于播客、视频制作、语音笔记等场景,让任何录音都达到专业级水准。
Synthesys是一款集文本、图像、音频和视频生成于一体的全能型AI内容创作平台。它提供超过400种AI语音、丰富的视频模板和强大的图像生成能力,帮助用户高效创建专业级营销内容、社交媒体素材
Fliki AI是一款功能强大的一站式AI内容创作工具,专注于将文本、博客文章或想法快速转化为高质量的视频和音频内容。它集成了先进的文本转语音、AI语音克隆、AI图像生成和视频编辑功能,旨在帮
Stable Audio是由Stability AI推出的专业AI音乐生成与音频编辑平台,基于先进的音频扩散模型,能够根据文本描述生成高质量、结构完整的音乐片段和音效,支持自定义时长、风格和参
Stable Audio 2.0是由Stability AI推出的下一代AI音频生成模型,能够根据文本描述生成高质量、立体声、最长可达三分钟的完整音乐曲目或音效,在音乐创作、内容制作和声音设计
Veed AI Tools 是一个集成了多种人工智能功能的在线视频与音频编辑平台,旨在通过AI技术简化内容创作流程,为用户提供从文本生成、语音合成到视频编辑、字幕添加等一站式解决方案,尤其适合
Google Gemini Ultra是谷歌推出的最先进、规模最大的多模态AI模型,具备处理文本、图像、音频、视频和代码等多种信息类型的能力。它在复杂推理、多模态理解和代码生成方面表现出色,为
Gemini 2.0是谷歌推出的最新一代多模态人工智能模型,具备强大的文本、图像、音频、视频和代码理解与生成能力。它专为开发者、企业和创意工作者设计,提供高性能的API接口,支持复杂推理、实时
Google Gemini 2是谷歌推出的最新一代多模态人工智能模型,集成了文本、图像、音频、视频和代码处理能力,旨在为开发者和企业提供更强大、更高效的AI解决方案。本文详细介绍其核心功能、技
Gemini 2.5 Pro 0325是谷歌推出的最新旗舰级多模态AI模型,具备强大的推理能力、长上下文窗口(100万token)以及原生多模态处理能力。它能够同时理解文本、图像、音频、视频和
Gemini Ultra是Google DeepMind推出的顶级多模态AI模型,具备强大的推理、理解和生成能力,支持文本、图像、音频、视频和代码等多种输入输出形式,适用于复杂任务处理、科研分
Descript-12是一款集音频编辑、视频剪辑、字幕生成、语音克隆与文本转语音于一体的AI驱动创作工具,支持多轨道编辑、实时协作和智能脚本修改,极大提升内容制作效率。
Google Gemini 3是谷歌推出的最新一代多模态人工智能模型,融合文本、图像、音频、视频和代码理解能力,提供强大的推理、生成和交互功能。作为AI开发的核心工具,Gemini 3在自然语
Google Gemini 2.5 Pro是谷歌推出的最新一代多模态AI模型,具备强大的推理能力、长上下文窗口(高达100万token)以及原生多模态处理能力。它能够同时理解文本、图像、音频、
Google Gemini 2.0是谷歌推出的最新一代多模态人工智能模型,具备文本、图像、音频、视频和代码的深度理解与生成能力。本文详细介绍其核心功能、技术优势、应用场景及开发实践,帮助开发者
Gemini 1.5是谷歌推出的先进多模态AI模型,具备超长上下文窗口(最高100万token)、强大的文本、图像、音频、视频理解能力,以及高效的推理性能。本文详细介绍其核心功能、技术优势、适
Jina AI 是一个开源的神经搜索框架,专为构建跨模态(文本、图像、音频、视频)的智能搜索与理解系统而设计。它提供云原生架构、可扩展的嵌入模型和高效的向量检索能力,帮助开发者快速搭建语义搜索
Udio v1.5是一款先进的AI音乐生成工具,基于深度学习技术,能够根据用户输入快速生成高质量、风格多样的音乐作品。它支持文本描述、旋律提示和参数调整,适用于音乐制作、内容创作、游戏音效等场
Gemini 2.5是谷歌推出的最新多模态AI模型,具备强大的推理、代码生成和多媒体理解能力,适用于开发工具、数据分析、内容创作等多个场景。本文详细介绍其核心功能、技术优势及实际应用,帮助开发
Stable Audio 2.0 是 Stability AI 推出的新一代人工智能音乐生成工具,基于扩散模型技术,能够根据文本描述或音频参考生成高质量、结构完整的音乐片段。支持最长3分钟的音
Murf AI V2是一款基于人工智能的文本转语音(TTS)和语音合成平台,提供超过120种自然逼真的AI语音,支持多种语言和口音,适用于视频制作、播客、电子学习、广告配音等场景。其V2版本在
ElevenLabs Voice Cloning V3 是业界领先的AI语音克隆与合成平台,支持从短音频样本中生成高度逼真、富有情感和语调的自然语音。该工具适用于内容创作、配音、有声书制作、虚
ElevenLabs Voice Isolator V7 是一款基于深度学习的先进语音隔离工具,能够从嘈杂的音频中精准提取人声,去除背景噪音、音乐和其他干扰,适用于播客制作、视频配音、会议录音
Descript AI Studio 是一款集音频编辑、视频制作、屏幕录制、字幕生成、文本转语音、AI语音克隆及协作功能于一体的综合性创作工具。它利用先进的AI技术,让用户像编辑文档一样轻松编
Gemini 2.0 Flash 是谷歌推出的新一代高性能AI模型,专注于极速响应、多模态理解和高效推理。它专为开发者、数据科学家和创意工作者设计,能够处理文本、图像、音频和视频等多种输入,在
ElevenLabs Voice Isolator V2 是 ElevenLabs 推出的第二代语音隔离模型,能够从任意音频中精准提取人声,去除背景噪音、音乐和其他干扰。该工具基于深度学习技术
ElevenLabs Voice Design v4.0 是一款先进的AI语音设计与合成工具,支持用户通过文本描述或参考音频快速生成高度逼真、情感丰富的自定义语音。该版本引入了更精细的音色控制
Hugging Face 是一个领先的人工智能平台,提供丰富的预训练模型、数据集和工具,支持自然语言处理、计算机视觉、音频处理等多领域任务。其核心产品包括 Transformers 库、Hug
Hugging Face Transformers 是一个开源的 Python 库,提供数千个预训练的深度学习模型(如 BERT、GPT、T5 等),支持自然语言处理、计算机视觉、音频处理等任