Created
Jul 31, 2024 01:04 AM
Favorite
Favorite
Priority
备注
推荐
类型
Agent-E 能帮你搞定很多在线任务,比如填写网页表格、在亚马逊等购物网站上找畅销商品或者按价格排序、查找特定网站的内容、与网络媒体互动、做全面的网络搜索、管理项目任务等等。它还能给你个性化的购物建议,比如它能根据你的指令填写表格、查找 ESPN 上的体育比分、播放 YouTube 视频,推荐商品。简单来说,Agent-E 就像你的私人助理一样,只要你用自然语言给它指令,它就能帮你搞定很多事情,让你的网络生活更轻松。在最近的更新中其成功率达到了73.2%,相比之前提升了20%。Agent-E 不仅是自动化脚本的集合,更是将复杂网络任务转化为日常语言指令的技术突破。(访问链接在文章底部
notion image
在基准测试中,Agent-E 的表现显著优于此前最先进的网页代理系统,成功率达到73.2%,比纯文本网页代理提高了20%,比多模态网页代理提高了16%。
传统的网页代理在处理现代网页的复杂性和变化性时往往效率低下且容易出错,难以准确执行任务,因而无法有效应对嘈杂且庞大的 HTML 文档对象模型(DOMs)。这种低效性成为自主网页代理在实际应用中部署的重要障碍,尤其在可靠性和精准度至关重要的场景下更为明显。
为了解决这些问题,Agent-E 采用分层架构,将任务规划和执行阶段分为两个独立组件:规划代理和浏览器导航代理。规划代理负责将用户任务拆分为较小的子任务,而浏览器导航代理则利用先进的 DOM 提炼技术来执行这些子任务。通过这种设计,每个组件可以专注于其特定角色,从而大幅提高系统的效率和性能。
notion image
在基准测试中,Agent-E 的表现显著优于此前最先进的网页代理系统,成功率达到73.2%,比纯文本网页代理提高了20%,比多模态网页代理提高了16%。
在处理复杂网站如 Wolfram Alpha 时,Agent-E 的性能提升高达30%。除了成功率,研究团队还报告了其他关键指标,如任务完成时间和错误感知。Agent-E 平均需150秒完成一个任务,而失败的任务则需220秒。每个任务平均调用25次大型语言模型,充分体现了其高效性和有效性。
notion image
WebArena 是一个独立且可自托管的 Web 环境,专用于构建自主代理。WebArena 模拟真实世界的功能和数据,将工具和知识资源嵌入独立网站,使智能代理能模拟人类解决问题。用户可通过自然语言指令对智能代理进行基准测试,实现在 Web 上的具体交互。欢迎交流~,带你学习AI,了解AI
Loading...