你是否还在为脆弱的 Web 自动化测试而烦恼?XPath 变更、CSS 选择器失效、DOM 结构调整,这些问题是不是经常让你的自动化脚本功亏一篑?今天要给大家介绍的 Magnitude,可能会彻底改变你对 Web 自动化的认知。
大多数浏览器自动化工具(如Selenium、Playwright)依赖于DOM结构来定位元素。但现代网站的DOM结构越来越复杂,稍一变动脚本就会失效。
概括起来,传统的 Web 自动化工具(如 Selenium、Playwright)会存在两大痛点:
依赖 DOM 结构:一旦页面元素的属性或层级发生变化,脚本就会失效
指令僵化:只能执行固定流程,遇到意外情况无法自主调整
而 Magnitude 凭借两大创新彻底解决了这些问题:
视觉优先架构:通过多模态大模型直接分析页面截图,基于像素坐标执行操作,完全不依赖 DOM 结构
可控且可重复的自动化:支持从精细操作到复杂流程的不同抽象级别,结合自定义提示词,既灵活又可预测。
什么是 Magnitude?
Magnitude 是一款基于AI视觉 的 Web 自动化框架,它彻底摆脱了传统自动化工具对 DOM 结构的依赖,通过模拟人类视觉和交互方式来操控浏览器。简单来说,它不是通过查找元素的 ID 或类名来操作页面,而是像人一样 "看到" 界面并做出反应。 Magnitude 的革命性在于:它不依赖DOM,而是直接“看”屏幕!就像人类通过视觉识别按钮、输入框一样,它通过像素坐标来定位和操作元素。
<blockquote>