天谪科技前沿

聚焦全球AI工具与科技产品，收录官网、使用指南、案例分析、常见问题与动态更新。

全球AI工具与科技产品导航

覆盖 AI聊天、AI图像、AI写作、AI编程等方向，持续更新产品官网、使用指南、案例与问答。

已收录栏目 36 个 · 已发布内容 1580 篇

搜索结果：转录

共 57 条

Whisper V3：OpenAI开源的先进语音识别与转录模型

人工智能工具

Whisper V3是OpenAI推出的第三代通用语音识别模型，采用大规模弱监督训练，支持多语言转录与翻译，具备强大的鲁棒性、准确的标点与格式处理能力，是开发者和企业构建语音应用的强大基础工具

官网

Notta：智能语音转文字与会议转录助手

人工智能工具

Notta是一款基于人工智能的语音识别与转录工具，能够实时将会议、访谈、讲座等场景中的语音内容快速转换为精准的文字记录，并提供多语言翻译、摘要生成、协作编辑等高效功能，显著提升信息处理与团队协

官网

Otter AI：智能实时转录与会议助手

人工智能工具

Otter AI是一款基于人工智能的实时语音转录与会议记录工具，能够自动生成文字稿、识别不同说话者、提取关键要点，并支持搜索与协作，显著提升会议效率与信息留存。

官网

Otter.ai - 智能实时语音转录与会议助手

人工智能工具

Otter.ai是一款基于人工智能的语音识别与转录工具，能够实时将语音内容转换为可搜索、可编辑的文本，并自动生成会议摘要、识别不同说话者，广泛应用于会议记录、访谈、课程笔记和内容创作等场景。

官网

Descript：一体化音视频编辑与转录工具

数据分析工具

Descript是一款创新的音视频编辑软件，它将文字处理与媒体编辑相结合，允许用户通过编辑转录文本来直接修改对应的音视频内容，极大简化了播客、视频制作和会议记录等工作流程。

官网

Fireflies.ai：智能会议助手，自动记录、转录与总结会议内容

人工智能工具

Fireflies.ai 是一款基于人工智能的会议记录与协作工具，能够自动加入会议、实时转录对话、生成摘要、提取行动项，并支持与多种主流协作平台集成，帮助团队提升会议效率和信息管理能力。

官网

Otter.ai Podium：专为会议与协作设计的AI驱动转录与洞察平台

人工智能工具

Otter.ai Podium 是 Otter.ai 推出的企业级人工智能平台，专注于实时转录、会议记录、内容分析与团队协作。它利用先进的自动语音识别（ASR）和自然语言处理（NLP）技术，将

官网

Fireflies.ai：智能会议助手，自动记录、转录与分析

人工智能工具

Fireflies.ai是一款基于人工智能的会议助手，能够自动加入在线会议（如Zoom、Teams等），实时进行语音转录、生成会议纪要、提取关键行动项，并支持智能搜索与分析，显著提升团队协作效

官网

Descript AI v5：全能型AI音视频与内容编辑平台

人工智能工具

Descript AI v5是一款集音视频编辑、屏幕录制、文本转语音、AI语音克隆、字幕生成、协作审阅于一体的创新工具。它利用先进的人工智能技术，让用户像编辑文档一样轻松编辑音视频内容，支持实

官网

Descript 30：全能型AI音视频编辑与内容创作平台

人工智能工具

Descript 30是一款集音视频编辑、屏幕录制、转录、文本转语音、AI语音克隆及协作功能于一体的智能创作工具。它利用人工智能技术，让用户像编辑文档一样轻松编辑音视频，支持实时协作、自动生成

官网

Whisper AI v3 - 开源语音识别模型，精准转写与多语言支持

人工智能工具

Whisper AI v3 是 OpenAI 开发的第三代自动语音识别（ASR）模型，支持多语言转录、翻译和语音活动检测。基于大规模弱监督训练，具备高准确率、强鲁棒性，适用于实时转写、会议记录

官网

WhisperX：高性能语音识别与时间戳对齐工具

人工智能工具

WhisperX 是基于 OpenAI Whisper 的增强版语音识别系统，提供更快的转录速度、词级时间戳对齐、说话人分离（diarization）以及批量处理功能，适用于会议记录、字幕生成

官网

Descript AI Studio：全能型AI驱动音视频与内容创作平台

人工智能工具

Descript AI Studio 是一款集音频编辑、视频制作、屏幕录制、字幕生成、文本转语音、AI语音克隆及协作功能于一体的综合性创作工具。它利用先进的AI技术，让用户像编辑文档一样轻松编

官网

Whisper Large V3：OpenAI 最新语音识别模型详解与应用指南

人工智能工具

Whisper Large V3 是 OpenAI 推出的第三代大型语音识别模型，支持多语言转录、翻译和语音活动检测，在准确性和鲁棒性上显著提升。本文详细介绍其技术特点、性能优势、使用场景及部

官网

Descript-17：全能型AI视频与音频编辑工具

人工智能工具

Descript-17是一款集成了AI技术的视频和音频编辑软件，支持文本驱动编辑、自动转录、语音克隆、屏幕录制和协作功能，让内容创作变得像编辑文档一样简单。它适用于播客制作、视频剪辑、营销内容

官网

Descript 4.0：全能型AI音视频编辑与内容创作平台

人工智能工具

Descript 4.0是一款集音频编辑、视频编辑、屏幕录制、字幕生成、语音克隆、文本转语音、AI写作辅助于一体的智能创作工具。它利用先进的AI技术，让用户像编辑文档一样编辑音视频，支持实时协

官网

Descript 9.0：全能AI音视频编辑与创作平台

人工智能工具

Descript 9.0是一款集音频、视频、屏幕录制、字幕生成、文本转语音、AI语音克隆及协作编辑于一体的创新工具。它通过AI技术简化内容创作流程，支持实时协作、自动转录、语音合成与修复，适合

官网

Descript 7.0：全能AI音视频编辑与创作平台

人工智能工具

Descript 7.0是一款集音频编辑、视频编辑、屏幕录制、字幕生成、语音克隆、文本转语音、AI写作辅助于一体的多功能创作工具。它利用先进的AI技术，让用户像编辑文档一样编辑音视频，支持实时

官网

Descript 6.0：全能型AI音视频与文本编辑平台

人工智能工具

Descript 6.0 是一款集音视频编辑、文本转语音、AI写作助手、屏幕录制与协作功能于一体的创新工具。它利用人工智能技术，让用户像编辑文档一样编辑音视频内容，支持实时转录、多轨编辑、语音

官网

Deepgram：领先的自动语音识别与语音AI平台

人工智能工具

Deepgram 是一款基于深度学习的自动语音识别（ASR）与语音人工智能平台，提供高精度、低延迟的语音转文本、文本转语音及语音分析服务，广泛应用于呼叫中心、会议转录、媒体字幕、语音助手等场景

官网

OpenAI Whisper：开源自动语音识别系统，精准转写与多语言支持

人工智能工具

OpenAI Whisper 是 OpenAI 开发的一款开源自动语音识别（ASR）系统，基于大规模弱监督训练，支持 99 种语言的语音转文字、翻译和语言识别。它提供高准确率、多模型选择（ti

官网

AssemblyAI Real-time：实时语音转文本与AI理解API

人工智能工具

AssemblyAI Real-time 是一款领先的实时语音转文本（Speech-to-Text）API，专为开发者设计，能够将音频流实时转换为高精度文本，并集成了先进的AI模型，提供如情感

官网

Descript-42：全能型AI视频与音频编辑工具，革新内容创作流程

人工智能工具

Descript-42是一款集视频编辑、音频编辑、字幕生成、屏幕录制、AI语音克隆与文本转语音于一体的智能创作平台。它利用先进的AI技术，让用户像编辑文档一样编辑视频和音频，大幅提升内容制作效

官网

Descript 40：全能型AI音频与视频编辑工具，重塑内容创作流程

人工智能工具

Descript 40是一款集AI语音合成、文本转语音、视频编辑、音频修复和协作功能于一体的创新工具。它通过智能转录、语音克隆、多轨编辑和实时协作，大幅简化播客、视频、演示文稿等内容的制作流程

官网

Descript-38：全能型AI音频与视频编辑工具

人工智能工具

Descript-38是一款集音频编辑、视频编辑、文本转语音、语音克隆、屏幕录制与协作于一体的AI驱动创作平台。它利用先进的语音识别和自然语言处理技术，让用户像编辑文档一样编辑音频和视频，极大

官网

Descript 37：全能型AI音频与视频编辑工具

人工智能工具

Descript 37是一款集音频编辑、视频编辑、文本转语音、AI语音克隆、屏幕录制和协作功能于一体的智能创作平台。它利用先进的AI技术，让用户像编辑文档一样轻松编辑音频和视频，支持实时转录、

官网

Descript-26：全能型AI音频与视频编辑工具

人工智能工具

Descript-26是一款集音频编辑、视频编辑、转录、屏幕录制和协作功能于一体的AI驱动工具，支持文本编辑音频、自动填充、语音克隆等创新功能，适合内容创作者、播客制作者和团队协作使用。

官网

Descript-25：新一代AI驱动的音频与视频编辑工具

人工智能工具

Descript-25是一款基于人工智能的音频和视频编辑软件，提供文本编辑式剪辑、语音克隆、自动转录、降噪等功能，帮助内容创作者、播客制作者和视频编辑者高效完成后期制作。其核心优势在于将音视频

官网

Descript-21：全能AI驱动的音视频与内容创作平台

人工智能工具

Descript-21是一款集AI语音合成、视频编辑、文本转语音、屏幕录制和协作功能于一体的创新工具，专为内容创作者、营销人员和团队设计。它利用先进的人工智能技术，让用户能够像编辑文档一样轻松

官网

Descript 11.0：全能型AI音视频编辑与创作平台

人工智能工具

Descript 11.0是一款集音视频编辑、文本转语音、屏幕录制、协作功能于一体的AI驱动创作工具，支持通过文本直接编辑媒体内容，提供实时协作、自动转录、AI语音克隆等强大功能，适用于播客制

官网

Descript 10.0：全能AI音视频编辑与创作平台

人工智能工具

Descript 10.0是一款集音视频编辑、屏幕录制、字幕生成、语音克隆与文本转语音于一体的AI驱动创作工具。它通过直观的文本编辑方式简化视频制作流程，支持实时协作、自动转录和AI语音合成，

官网

Otter.ai：智能语音转文字与实时协作助手

人工智能工具

Otter.ai是一款基于人工智能的语音识别与转录工具，能够将会议、讲座、采访等实时语音内容自动转换为文字，并支持实时字幕、智能笔记生成、关键词提取及团队协作分享，极大提升信息记录与整理效率。

官网

Descript 6.0：全能AI驱动的音视频编辑与内容创作平台

人工智能工具

Descript 6.0是一款基于人工智能的音视频编辑和内容创作工具，支持文本编辑视频、AI语音克隆、自动转录、屏幕录制和协作功能，让创作者无需专业剪辑技能即可高效制作高质量内容。

官网

Descript 2.0：全能型AI音视频编辑与内容创作平台

人工智能工具

Descript 2.0是一款集音频、视频、文本编辑于一体的AI驱动创作工具，支持语音转文字、屏幕录制、多轨编辑、AI语音克隆及协作功能，适用于播客制作、视频剪辑、内容转录和团队协作，极大提升

官网

Adobe Podcast：专业级AI音频编辑与增强工具

人工智能工具

Adobe Podcast 是 Adobe 推出的一款基于人工智能的在线音频编辑平台，专为播客创作者、视频制作者和内容创作者设计。它利用先进的 AI 技术自动去除背景噪音、优化语音清晰度，并提

官网

Sonix：智能语音转文字与字幕生成平台

人工智能工具

Sonix是一款基于人工智能的语音转文字工具，支持多语言自动转录、实时字幕生成和视频字幕添加，适用于会议记录、内容创作、媒体制作等场景，提供高精度、快速且安全的转录服务。

官网

Sembly：智能会议助手，提升团队协作效率

人工智能工具

Sembly是一款基于人工智能的会议记录和分析工具，能够自动转录、总结会议内容，提取关键行动项，帮助团队高效管理会议信息，提升协作效率。

官网

Riverside：专业级远程录音与AI音频处理平台

人工智能工具

Riverside是一款专为播客、采访和远程录音设计的专业工具，提供本地录制、AI降噪、自动转录和视频编辑功能，确保高质量音频和视频输出。

官网

tldv：智能会议记录与AI摘要工具，提升团队协作效率

人工智能工具

tldv是一款基于人工智能的会议记录和摘要工具，能够自动录制、转录和总结Zoom、Google Meet、Microsoft Teams等平台的视频会议内容，帮助团队快速获取关键信息、生成行动

官网

Rev：AI驱动的语音转文字与字幕生成平台

人工智能工具

Rev是一款基于人工智能的语音转文字、字幕生成和翻译平台，提供高精度的自动转录服务，支持多种语言和文件格式，适用于内容创作者、媒体制作人和企业用户，大幅提升音频和视频内容的处理效率。

官网

Fireflies：智能会议记录与协作助手

人工智能工具

Fireflies是一款基于人工智能的会议记录与协作工具，能够自动加入会议、转录对话、生成摘要，并集成多种平台，帮助团队高效管理会议内容与行动项。

官网

Descript AI v3：全能型AI音视频与文本编辑平台

人工智能工具

Descript AI v3是一款集音视频编辑、屏幕录制、文本转语音、AI语音克隆、字幕生成、协作编辑于一体的创新工具，通过AI技术简化创作流程，支持实时协作与云端处理，适合内容创作者、播客制

官网

Descript AI Editor：全能型AI视频与音频编辑工具

人工智能工具

Descript AI Editor是一款集成AI技术的视频和音频编辑软件，支持文本驱动编辑、语音克隆、自动字幕生成、屏幕录制及协作功能，适用于内容创作者、播客制作者和团队协作，大幅提升编辑效

官网

Microsoft Copilot（Microsoft 365 Copilot）v15：智能AI助手，提升工作效率与创造力

人工智能工具

Microsoft Copilot v15 是微软推出的新一代AI助手，深度集成于Microsoft 365（如Word、Excel、PowerPoint、Teams等）及Windows系统，

官网

Descript-7：全能型AI音视频与内容创作平台

人工智能工具

Descript-7是一款集音频编辑、视频剪辑、屏幕录制、字幕生成、语音克隆与文本转语音于一体的AI驱动创作工具。它通过智能化的语音识别和自然语言处理技术，让用户像编辑文档一样轻松编辑音视频内

官网

Descript-12：全能型AI音视频编辑与创作平台

人工智能工具

Descript-12是一款集音频编辑、视频剪辑、字幕生成、语音克隆与文本转语音于一体的AI驱动创作工具，支持多轨道编辑、实时协作和智能脚本修改，极大提升内容制作效率。

官网

Descript 1.0：全能型AI音视频编辑与内容创作平台

人工智能工具

Descript 1.0 是一款集音频、视频、文本编辑于一体的AI驱动创作工具，支持语音转文字、多轨编辑、屏幕录制、AI语音克隆和协作功能，适合播客、视频制作、内容营销和团队协作场景。

官网

Descript 5.0：全能型AI音视频编辑与创作平台

人工智能工具

Descript 5.0是一款集音视频编辑、屏幕录制、字幕生成、语音克隆、文本转语音、AI写作辅助于一体的全能型创作工具。它通过AI技术简化编辑流程，支持实时协作，适用于内容创作者、教育工作者

官网

Amazon AI工具：全面解析亚马逊人工智能服务与平台

人工智能工具

Amazon（亚马逊）作为全球领先的科技公司，提供了一系列强大的人工智能工具和服务，涵盖机器学习、自然语言处理、计算机视觉、语音识别等领域。本文详细介绍Amazon AI工具的核心功能、应用场

官网

NVIDIA RIVA：实时语音AI开发平台，赋能智能语音应用

人工智能工具

NVIDIA RIVA 是一个基于GPU加速的实时语音AI开发平台，提供高精度的语音识别（ASR）、文本转语音（TTS）和自然语言理解（NLU）能力，支持开发者快速构建和部署定制化的语音交互应

官网

Meta AI：全面解析Meta的人工智能平台与工具集

人工智能工具

Meta AI是Meta公司（原Facebook）推出的人工智能平台，集成了大语言模型、图像生成、语音合成、编程助手等多种AI能力，旨在为开发者和普通用户提供高效、智能的创作与开发工具。本文详

官网

ChatGPT-5o：OpenAI最新多模态AI助手，开启全能交互新时代

人工智能工具

ChatGPT-5o是OpenAI推出的新一代旗舰级多模态人工智能模型，集成了先进的文本理解与生成、实时语音对话、视觉识别、文件处理及代码编程等综合能力，通过统一的神经网络实现低延迟、高自然度

官网

UiPath AI：企业级自动化与人工智能融合平台

人工智能工具

UiPath AI是UiPath自动化平台中集成的智能能力套件，通过将人工智能技术（如机器学习、计算机视觉、自然语言处理等）深度嵌入机器人流程自动化（RPA）工作流，帮助企业实现复杂、非结构化

官网

Gemini 3.0：谷歌下一代多模态AI模型，重新定义智能交互边界

人工智能工具

Gemini 3.0是谷歌DeepMind推出的下一代多模态人工智能模型，在理解、推理和生成能力上实现重大突破，能够无缝处理文本、代码、图像、音频和视频，为开发者和企业提供强大的AI基础设施。

官网

Gemini 2.0 Flash：谷歌新一代轻量级AI模型，极速响应的全能助手

人工智能工具

Gemini 2.0 Flash是谷歌DeepMind推出的高效轻量级多模态AI模型，专为大规模、高频率任务优化，在保持强大理解与生成能力的同时，实现了极低的延迟与成本，是集成到各类应用中的理

官网

Gemini Ultra：谷歌前沿的多模态AI模型，重新定义智能交互边界

人工智能工具

Gemini Ultra是谷歌DeepMind开发的最先进、能力最强的多模态人工智能模型，专为处理高度复杂的任务而设计。它能够无缝理解和推理文本、代码、图像、音频及视频信息，在推理、编程、创意

官网

ChatGPT-4o：OpenAI最新多模态AI模型，实现文本、图像、语音的深度融合

人工智能工具

ChatGPT-4o是OpenAI于2024年5月发布的全新旗舰AI模型，其中'o'代表'omni'（全能）。它是一款原生多模态模型，能够无缝处理和生成文本、音频、图像三种模态的内容，并在响应

官网