Adept是一家在人工智能领域备受瞩目的研究实验室,成立于2021年,由包括Ashish Vaswani(Transformer架构论文的主要作者)在内的多位深度学习领域的顶尖专家联合创立。与许多专注于内容生成(如文本、图像)的AI公司不同,Adept将研发重心放在了构建能够理解人类意图并直接操作计算机软件以完成任务的通用人工智能(AGI)助手或“智能体”上。
核心愿景与目标
Adept的终极目标是开发一个通用的、基于行动的AI模型。这个模型能够通过自然语言接受用户的任何指令,然后像人类一样,在计算机上使用各种软件工具(如浏览器、设计软件、数据分析平台、企业系统等)来执行任务。例如,用户可以说“帮我找出上季度销售额最高的五个产品,并制作一份总结图表”,Adept的AI就能够自动打开相应的数据库或CRM软件,查询数据,分析结果,并最终在表格或演示软件中生成可视化的图表。其核心在于将语言转化为行动,充当人类与数字世界之间高效、智能的桥梁。
核心技术:ACT-1模型
Adept的核心技术成果是其首个模型——ACT-1(Action Transformer 1)。该模型基于强大的Transformer架构,并在大量“人机交互”数据(如屏幕截图、对应的操作指令和动作序列)上进行训练。
- 工作原理:ACT-1接收两种输入:一是用户用自然语言描述的任务目标;二是当前计算机屏幕的视觉信息(即“上下文”)。模型通过理解这两者,预测出为了完成任务需要在当前界面上执行的下一个最佳操作(例如:点击哪个按钮、在哪个字段输入什么文本、按下什么快捷键等)。
- 与ChatGPT等模型的区别:像ChatGPT这类大语言模型(LLM)主要擅长理解和生成文本,它们可以告诉你“如何”做一件事,但无法亲自“动手”去做。而ACT-1的设计初衷就是直接执行动作,它旨在成为一个“行动者”,而不仅仅是“建议者”。
潜在应用场景
这种能力一旦成熟,将具有革命性的应用潜力:
- 办公自动化:自动完成数据录入、报告生成、邮件分类与回复、会议安排等重复性工作。
- 专业软件辅助:辅助设计师使用Photoshop,帮助分析师操作Tableau或Excel,指导工程师使用CAD软件。
- 企业业务流程自动化:连接并操作多个企业系统(如ERP、CRM),自动完成跨系统的复杂工作流。
- 个人效率工具:成为每个人的数字副驾驶,帮助处理日常电脑操作,大幅提升个人工作效率。
面临的挑战与未来展望
实现这一愿景也面临巨大挑战:
- 复杂性:不同软件的界面、逻辑千差万别,让一个模型通用地理解并操作所有软件极其困难。
- 安全与可靠性:AI直接操作系统,一旦出错可能导致数据丢失或错误操作,需要极高的可靠性和安全护栏。
- 评估难度:如何准确评估一个AI智能体完成复杂、多步骤任务的成功率,本身就是一个研究难题。
尽管挑战重重,Adept所代表的“行动型AI”方向被认为是通向更实用、更强大AGI的关键路径之一。它不仅仅满足于对话,而是致力于让AI真正融入人类的工作流,成为能够创造实际生产力的合作伙伴。随着多模态理解和规划能力的进步,Adept及其同行们正在推动人工智能从“思考”走向“行动”的新阶段。