天谪科技前沿

聚焦全球AI工具与科技产品，收录官网、使用指南、案例分析、常见问题与动态更新。

全球AI工具与科技产品导航

覆盖 AI聊天、AI图像、AI写作、AI编程等方向，持续更新产品官网、使用指南、案例与问答。

已收录栏目 36 个 · 已发布内容 1581 篇

搜索结果：text

共 60 条

ElevenLabs Text to Sound Effects - AI音效生成工具

人工智能工具

ElevenLabs Text to Sound Effects 是一款基于人工智能的音效生成工具，能够通过文本描述快速生成高质量、多样化的音效，适用于视频制作、游戏开发、播客编辑等场景。无需

官网

ElevenLabs Text-to-Speech：高保真AI语音合成工具

人工智能工具

ElevenLabs Text-to-Speech是一款基于深度学习的AI语音合成工具，能够生成极其自然、富有情感的语音，支持多语言、多音色，广泛应用于内容创作、有声读物、视频配音、虚拟助手等

官网

ElevenLabs Text-to-Sound：AI驱动的文本转音效与背景音乐生成工具

人工智能工具

ElevenLabs Text-to-Sound 是一款基于人工智能的文本转音效与背景音乐生成工具，能够将自然语言描述快速转化为高质量、可定制的音频片段，适用于视频制作、游戏开发、播客、广告创

官网

ElevenLabs Text to Speech：高保真AI语音合成工具详解

人工智能工具

ElevenLabs Text to Speech是一款基于深度学习的AI语音合成工具，能够将文本转换为自然、富有情感的语音，支持多种语言和声音风格，广泛应用于内容创作、有声读物、视频配音、语

官网

AssemblyAI Real-time：实时语音转文本与AI理解API

人工智能工具

AssemblyAI Real-time 是一款领先的实时语音转文本（Speech-to-Text）API，专为开发者设计，能够将音频流实时转换为高精度文本，并集成了先进的AI模型，提供如情感

官网

Deepgram：领先的自动语音识别与语音AI平台

人工智能工具

Deepgram 是一款基于深度学习的自动语音识别（ASR）与语音人工智能平台，提供高精度、低延迟的语音转文本、文本转语音及语音分析服务，广泛应用于呼叫中心、会议转录、媒体字幕、语音助手等场景

官网

Civitai：开源AI艺术模型分享与探索平台

人工智能与机器学习

Civitai是一个专注于稳定扩散（Stable Diffusion）等开源AI图像生成模型的社区驱动型平台，为用户提供模型发现、下载、分享、评级及讨论的一站式服务，极大地推动了AI艺术创作的

官网

Sora：OpenAI推出的革命性文本生成视频AI模型

人工智能工具

Sora是OpenAI开发的一款突破性文本到视频生成模型，能够根据用户输入的简短文字描述，生成长达一分钟的高质量、高保真视频内容。它代表了当前AI视频生成领域的最先进技术，能够理解复杂的物理世

官网

Claude MCP：AI模型上下文协议工具详解

人工智能工具

Claude MCP（Model Context Protocol）是Anthropic推出的一种开放协议，旨在让AI模型（如Claude）安全、标准化地访问外部数据源和工具，从而扩展其能力。

官网

So-VITS-SVC：基于VITS的实时语音转换与歌声合成工具，开源AI声音克隆解决方案

人工智能工具

So-VITS-SVC（SoftVC VITS Singing Voice Conversion）是一款基于VITS（Variational Inference Text-to-Speech）

官网

Zapier MCP：连接AI与自动化工作流的智能中间件平台

人工智能工具

Zapier MCP（Model Context Protocol）是Zapier推出的AI原生集成层，允许开发者通过标准化协议将大型语言模型（LLM）与数千个应用无缝连接。它提供安全的数据访

官网

万相（Wanx）—— 阿里云AI创意生成平台，一站式文本到图像与视频创作工具

人工智能工具

万相（Wanx）是阿里云推出的新一代AI创意生成平台，专注于文本到图像（Text-to-Image）和文本到视频（Text-to-Video）的智能创作。它基于通义大模型技术，支持用户通过简单

官网

Ideogram AI：革命性的文本生成图像人工智能平台

人工智能工具

Ideogram AI是一款专注于文本生成图像（Text-to-Image）的先进人工智能工具，以其独特的文本渲染能力和高质量的图像生成效果在AI艺术创作领域脱颖而出。它能够精准理解自然语言描

官网

Leonardo AI V3：新一代AI图像生成与创意设计工具深度解析

人工智能工具

Leonardo AI V3是专为创意设计、游戏开发和数字艺术领域打造的高性能AI图像生成平台。它基于先进的深度学习模型，支持文本到图像、图像到图像、风格迁移、实时协作编辑等功能，提供从概念草

官网

Kling AI 5.0：新一代视频生成与图像创作智能平台

人工智能工具

Kling AI 5.0 是一款由快手科技推出的先进人工智能视频生成与图像创作工具，基于扩散模型与自研3D变分自编码器（3D VAE）技术，支持文生视频、图生视频、视频延展及图像生成，具备高保

官网

Google Gemini 2：下一代多模态人工智能模型深度解析

人工智能工具

Google Gemini 2是谷歌推出的最新一代多模态人工智能模型，集成了文本、图像、音频、视频和代码处理能力，旨在为开发者和企业提供更强大、更高效的AI解决方案。本文详细介绍其核心功能、技

官网

Whisper AI v3 - 开源语音识别模型，精准转写与多语言支持

人工智能工具

Whisper AI v3 是 OpenAI 开发的第三代自动语音识别（ASR）模型，支持多语言转录、翻译和语音活动检测。基于大规模弱监督训练，具备高准确率、强鲁棒性，适用于实时转写、会议记录

官网

Gemini 2.5 Pro Exp 03-25：谷歌最新多模态AI模型深度解析

人工智能工具

Gemini 2.5 Pro Exp 03-25 是谷歌推出的实验性多模态AI模型，具备强大的推理、代码生成、图像理解与长上下文处理能力。本文详细介绍其核心功能、技术特点、使用场景及开发者接入

官网

Kling AI 1.5：新一代AI视频生成工具，开启创意视频创作新纪元

人工智能工具

Kling AI 1.5是一款由快手科技推出的先进AI视频生成工具，基于扩散模型技术，能够从文本描述或图像输入中生成高质量、高动态的视频内容。它支持多种视频风格、长视频生成、运动控制等功能，适

官网

Meta Llama 3：下一代开源大语言模型详解

人工智能模型

Meta Llama 3 是 Meta 公司推出的第三代开源大语言模型，具备强大的自然语言理解和生成能力，支持多种应用场景，如对话系统、内容创作和代码生成。本文详细介绍其核心特性、技术架构、使

官网

Zapier MCP：连接AI与工作流的智能自动化平台

人工智能工具

Zapier MCP是Zapier推出的基于模型上下文协议（MCP）的AI自动化工具，允许用户通过自然语言指令连接超过7000个应用，实现无代码工作流创建、数据同步和任务自动化，提升团队效率。

官网

Hugging Face Transformers：一站式自然语言处理与深度学习模型库

人工智能工具

Hugging Face Transformers 是一个开源的 Python 库，提供数千个预训练的深度学习模型（如 BERT、GPT、T5 等），支持自然语言处理、计算机视觉、音频处理等任

官网

Whisper Large V3：OpenAI 最新语音识别模型详解与应用指南

人工智能工具

Whisper Large V3 是 OpenAI 推出的第三代大型语音识别模型，支持多语言转录、翻译和语音活动检测，在准确性和鲁棒性上显著提升。本文详细介绍其技术特点、性能优势、使用场景及部

官网

Synthesia 2.6：AI视频生成工具全面升级，打造专业级虚拟主播与营销视频

人工智能工具

Synthesia 2.6是领先的AI视频生成平台的最新版本，支持用户通过文本快速创建带有逼真虚拟主播的专业视频。该版本在角色表情、语音自然度、多语言支持以及视频编辑功能上进行了显著提升，适用

官网

Pika Labs 2.2：AI视频生成工具全面解析

人工智能工具

Pika Labs 2.2是一款基于人工智能的视频生成工具，能够通过文本或图像输入快速创建高质量、风格多样的短视频。该版本在视频质量、运动控制和编辑灵活性上进行了显著升级，适用于创意内容制作、

官网

Pika-5：下一代AI视频生成工具，重塑创意内容生产

人工智能工具

Pika-5是一款基于深度学习的AI视频生成工具，能够通过文本描述或图像输入快速生成高质量、连贯且富有创意的短视频。它支持多种风格、场景和角色控制，适用于广告、社交媒体、影视预可视化等场景，极

官网

Google Gemini 2.0：新一代多模态AI模型深度解析与应用指南

人工智能工具

Google Gemini 2.0是谷歌推出的最新一代多模态人工智能模型，具备文本、图像、音频、视频和代码的深度理解与生成能力。本文详细介绍其核心功能、技术优势、应用场景及开发实践，帮助开发者

官网

Descript 5.0：全能型AI音视频编辑与创作平台

人工智能工具

Descript 5.0是一款集音视频编辑、屏幕录制、字幕生成、语音克隆、文本转语音、AI写作辅助于一体的全能型创作工具。它通过AI技术简化编辑流程，支持实时协作，适用于内容创作者、教育工作者

官网

Runway Gen-1/Gen-2/Gen-3：AI视频生成与编辑工具深度解析

人工智能工具

Runway Gen系列是Runway公司推出的新一代AI视频生成与编辑平台，支持文本、图像、视频等多种输入方式，快速生成高质量视频内容。本文详细介绍其核心功能、技术原理、应用场景及使用指南，

官网

ElevenLabs-TTS：顶级AI文本转语音工具，打造逼真自然语音合成体验

人工智能工具

ElevenLabs-TTS是一款基于深度学习的文本转语音工具，利用先进的人工智能技术生成高度逼真、富有情感和语调的自然语音。它支持多种语言和声音风格，适用于有声书、播客、视频配音、虚拟助手等

官网

Kling 4.0：新一代AI视频生成与创意工具深度解析

人工智能工具

Kling 4.0是一款由快手AI团队研发的先进AI视频生成工具，基于扩散模型与Transformer架构，支持文本、图像、视频等多种输入方式，可生成高质量、高动态、高一致性的视频内容。本文详

官网

Runway Gen-9：下一代AI视频生成与编辑工具详解

人工智能工具

Runway Gen-9是Runway公司推出的最新一代AI视频生成与编辑工具，基于先进的扩散模型和深度学习技术，支持文本生成视频、图像生成视频、视频风格迁移、动态场景合成等多种功能。它为用户

官网

Qwen-VL-Max：阿里云通义千问多模态大模型，图像理解与视觉问答的AI利器

人工智能工具

Qwen-VL-Max是阿里云推出的通义千问系列多模态大模型，专注于图像理解、视觉问答和图文生成。它能够处理复杂视觉任务，支持中英文，适用于内容审核、智能客服、教育辅助、电商场景等，提供高精度

官网

Pika 6.0：下一代AI视频生成工具，让创意无限可能

人工智能工具

Pika 6.0 是一款领先的AI视频生成工具，支持从文本、图像或视频片段快速生成高质量、风格多样的短视频。它利用先进的深度学习模型，提供实时编辑、风格迁移、动态效果等功能，适用于内容创作、广

官网

Runway Gen-6：下一代AI视频生成与编辑平台

人工智能工具

Runway Gen-6是Runway公司推出的第六代AI视频生成与编辑工具，基于先进的扩散模型和Transformer架构，支持文本、图像、视频片段等多种输入方式，快速生成高质量、高分辨率的

官网

Claude MCP 服务器：一站式AI工具集成与扩展平台

人工智能工具

Claude MCP 服务器是一个为Claude AI助手设计的模块化服务器集合，通过MCP协议实现与多种外部工具和服务的无缝集成，包括文件系统、数据库、API、搜索、代码执行等，极大扩展Cl

官网

Stable Diffusion 4：新一代AI图像生成工具详解

人工智能工具

Stable Diffusion 4是Stability AI推出的最新版本AI图像生成模型，基于扩散技术，能够从文本描述生成高质量、高分辨率的图像。本文详细介绍其核心功能、技术优势、应用场景

官网

Murf AI - 专业级AI语音合成与文本转语音工具

人工智能工具

Murf AI是一款基于人工智能的文本转语音（TTS）平台，提供超过120种自然逼真的AI语音，支持多种语言和口音，广泛应用于视频制作、播客、电子学习、广告配音等场景。用户可通过简单的文本输入

官网

Runway Gen-3：下一代AI视频生成工具，创意无限

人工智能工具

Runway Gen-3是Runway公司推出的最新一代AI视频生成模型，基于扩散Transformer架构，能够从文本、图像或视频片段生成高质量、连贯且富有创意的视频内容。它支持多种风格、实

官网

Runway Gen-4：下一代AI视频生成与编辑平台，专业级创意工具

人工智能工具

Runway Gen-4是Runway公司推出的第四代AI视频生成与编辑平台，集成了先进的扩散模型和实时渲染技术，支持文本生成视频、图像生成视频、视频风格迁移、对象移除、背景替换、慢动作生成等

官网

Mistral-7B：高效开源大语言模型，赋能AI应用开发

人工智能工具

Mistral-7B 是一款由 Mistral AI 开发的高性能开源大语言模型，拥有 70 亿参数，在推理、代码生成、文本理解等任务上表现出色，支持多种自然语言处理场景。其轻量级设计和 Ap

官网

Gemini 2.0 Flash Lite：轻量级高性能AI模型，加速智能应用开发

人工智能工具

Gemini 2.0 Flash Lite 是 Google 推出的轻量级 AI 模型，专为需要快速响应、低成本和高效推理的场景设计。它继承了 Gemini 系列的多模态能力，但在模型大小和计

官网

Cohere Command-R：企业级生成式AI模型，赋能高效文本生成与理解

人工智能工具

Cohere Command-R是Cohere公司推出的一款专为企业场景优化的生成式AI模型，具备强大的文本生成、摘要、问答、分类和检索增强生成（RAG）能力。它支持多语言处理，提供高准确率和

官网

Pika 2.0：下一代AI视频生成工具，让创意瞬间成真

人工智能工具

Pika 2.0是一款由Pika Labs开发的先进AI视频生成工具，能够通过文本描述、图像或视频片段快速生成高质量、风格多样的短视频。它支持多种创意控制功能，如局部修改、扩展画布和添加特效，

官网

Runway Gen-3 Alpha：新一代AI视频生成工具详解

人工智能工具

Runway Gen-3 Alpha是Runway公司推出的第三代AI视频生成模型，专注于从文本、图像或视频片段快速生成高质量、逼真的视频内容。它采用先进的扩散模型架构，支持高分辨率输出、精细

官网

Firefly Adobe：AI驱动的创意设计工具，革新视觉内容生成

人工智能工具

Firefly Adobe是Adobe推出的生成式AI工具集，专注于图像、文本效果和矢量图形的智能创作。它利用深度学习模型，让用户通过自然语言描述快速生成高质量视觉内容，无缝集成于Photos

官网

OpenAI语音引擎 - 先进的文本转语音与语音合成AI工具

人工智能工具

OpenAI语音引擎（OpenAI Voice Engine）是OpenAI推出的基于深度学习的语音合成与文本转语音（TTS）API，能够生成高度自然、富有表现力的语音，支持多种语言和声音风格

官网

Meta：领先的人工智能与增强现实技术平台

人工智能工具

Meta（原Facebook）是一家全球领先的科技公司，专注于人工智能、增强现实、虚拟现实和社交技术的研发与创新。其AI工具包括Llama大语言模型、PyTorch深度学习框架、Meta AI

官网

Gemini 1.5：谷歌新一代多模态AI模型深度解析与应用指南

人工智能工具

Gemini 1.5是谷歌推出的先进多模态AI模型，具备超长上下文窗口（最高100万token）、强大的文本、图像、音频、视频理解能力，以及高效的推理性能。本文详细介绍其核心功能、技术优势、适

官网

Google Gemini：下一代多模态人工智能模型详解与应用指南

人工智能工具

Google Gemini 是 Google 推出的最先进的多模态人工智能模型，能够理解和处理文本、图像、音频、视频和代码等多种数据类型。本文详细介绍 Gemini 的核心能力、版本分类、应用

官网

Google AI：全面解析谷歌人工智能平台与工具

人工智能工具

Google AI是谷歌旗下的人工智能研究与应用平台，提供包括机器学习、自然语言处理、计算机视觉、语音识别等在内的多种AI工具与服务。本文详细介绍Google AI的核心产品、技术特点、应用场

官网

Canva：全能型在线设计平台，赋能AI创意与协作

人工智能工具

Canva是一款集图形设计、演示文稿、文档编辑、视频制作于一体的在线设计工具，内置AI功能如智能抠图、文字转图像、AI写作助手等，适合个人、团队及企业快速创建专业视觉内容。

官网

OpenAI Whisper：开源自动语音识别系统，精准转写与多语言支持

人工智能工具

OpenAI Whisper 是 OpenAI 开发的一款开源自动语音识别（ASR）系统，基于大规模弱监督训练，支持 99 种语言的语音转文字、翻译和语言识别。它提供高准确率、多模型选择（ti

官网

Replicate CogVideo：开源文本生成视频AI模型

人工智能工具

Replicate CogVideo是由清华大学和智源研究院联合开发的先进文本到视频生成模型，基于CogView2架构，能够根据文本描述自动生成高质量、连贯的短视频片段，是开源AI视频生成领域

官网

Runway Gen-23：下一代AI驱动的创意内容生成平台

人工智能工具

Runway Gen-23是Runway公司推出的新一代人工智能创意工具套件，集成了先进的视频生成、图像编辑、3D建模和文本转视频等AI模型，旨在为创作者、设计师和开发者提供一站式AI驱动的创

官网

Claude 7.0 Nova：下一代AI助手，重新定义智能交互与生产力

人工智能工具

Claude 7.0 Nova是Anthropic公司推出的最新一代大型语言模型，以其卓越的推理能力、安全性、长上下文处理及多模态理解，为企业与个人用户提供安全、可靠、高效的AI助手解决方案。

官网

Playground AI v4：功能强大的在线AI图像生成与编辑平台

人工智能工具

Playground AI v4是一款基于浏览器的免费AI图像生成与混合编辑工具，集成了Stable Diffusion等先进模型，提供直观的界面、丰富的风格滤镜和强大的图像控制功能，让用户无

官网

ElevenLabs Voice Studio Pro：专业级AI语音合成与克隆平台

人工智能工具

ElevenLabs Voice Studio Pro是一款尖端的专业级人工智能语音合成平台，以其卓越的语音自然度、多语言支持及强大的语音克隆功能而闻名。它专为内容创作者、开发者、企业和创意专

官网

Midjourney v6：引领AI图像生成新纪元的强大模型

人工智能工具

Midjourney v6是Midjourney公司推出的最新一代人工智能图像生成模型，以其卓越的图像质量、对复杂提示词的理解能力、更逼真的细节渲染和更强的艺术风格控制，在AI艺术创作领域树立

官网

Pika：革命性AI视频生成平台，一键将创意转化为动态影像

人工智能视频生成工具

Pika是一款前沿的人工智能视频生成与编辑平台，它能够根据用户的文本描述、静态图像或现有视频片段，快速生成高质量、风格多样的短视频。其核心优势在于直观易用的界面、强大的生成能力以及对创意工作流

官网