wordpress新站不收录宁波人流医院

张小明 2026/1/2 10:12:13
wordpress新站不收录,宁波人流医院,wordpress 春叶 主题,哪个平台可以接推广任务#x1f4f1; 前言#xff1a;Appium 已死#xff1f;视觉 Agent 当立#xff01; 前段时间#xff0c;字节发布的“豆包手机”和荣耀的“任意门”火了#xff0c;核心卖点都是 “AI 懂你的屏幕#xff0c;能帮你操作手机”。 作为开发者#xff0c;你可能会问#xf… 前言Appium 已死视觉 Agent 当立前段时间字节发布的“豆包手机”和荣耀的“任意门”火了核心卖点都是“AI 懂你的屏幕能帮你操作手机”。作为开发者你可能会问“这不就是自动化脚本吗”错大错特错传统的脚本Appium/Airtest是“盲人摸象”它们依赖底层的 XML 控件 ID。一旦 APP 改版ID 变了脚本直接报废。而AppAgent是“睁眼看世界”。它利用GPT-4o或Qwen-VL这种视觉大模型直接**“看”手机截屏像人类一样通过“视觉感知”**来决定点哪里。今天我就带大家用开源的AppAgent框架手搓一个简易版“豆包手机”实现**“由 AI 自动刷抖音看到喜欢的猫咪视频就自动点赞”**的黑科技 核心原理AI 是怎么“玩手机”的AppAgent 的工作流程非常符合人类的直觉分为三个阶段感知See - 思考Think - 行动Act。1. 视觉感知 (Visual Perception)AI 截取当前手机屏幕。为了让大模型能准确描述位置AppAgent 会在屏幕上覆盖一层**“透明的数字标号”**或者直接划分网格。比如“点赞按钮”上可能覆盖了数字[25]。2. 决策推理 (Reasoning)我们将截图和标号发给 GPT-4o并附上 Prompt“你现在的任务是刷视频。如果视频里有猫就点击点赞按钮标号 25否则执行上滑操作。”3. 执行动作 (Action)大模型返回决策Tap(25)或Swipe(Up)。AppAgent 将其翻译成adb shell input tap x y命令发送给安卓手机。架构流程图无括号版1. 实时截屏2. 覆盖数字标记3. 输入视觉模型4. 思考并输出指令5. 映射为坐标6. 执行操作Android 手机屏幕截图带标号的图片GPT-4o / Qwen-VL指令: 点击标号 5ADB 命令️ 实战环节环境搭建1. 硬件准备一台 Android 手机开启 USB 调试。电脑Windows/Mac 均可装好 Python 和 ADB。2. 克隆 AppAgent 仓库AppAgent 是腾讯开源的项目我们直接站在巨人的肩膀上。gitclone https://github.com/mnotgod96/AppAgentcdAppAgent pipinstall-r requirements.txt3. 配置模型 (config.yaml)你需要一个能看懂图片的“大脑”。推荐使用GPT-4o最强或Qwen-VL-Max国产性价比。OPENAI_API_KEY:sk-xxxxOPENAI_API_MODEL:gpt-4o⚔️ 黑科技演示训练 AI 玩 抖音AppAgent 有个非常牛逼的**“探索阶段 (Exploration Phase)”。它不需要你手写规则你可以让 AI 自己去 APP 里乱点一通它会自己总结**出“哦原来点这里是评论点那里是转发。”Step 1: 探索模式 (Learn)运行脚本选择“探索模式”。python learn.py --app tiktok --mode explorationAI 会自动打开抖音尝试点击各个图标并记录下每个图标的功能文档。点击“爱心” - 发现数字变了 - 记录这是点赞。上滑屏幕 - 视频变了 - 记录这是切换视频。Step 2: 部署模式 (Act)教会了徒弟现在让它自己干活。我们编写一个简单的任务 PromptUser Prompt:“不断地上滑刷视频。仔细观察视频内容如果视频中出现了‘猫’或者‘狗’就给我点个赞然后继续刷。如果是广告直接快速划走。”运行代码python run_agent.py --app tiktok --taskAuto swipe and like cats见证奇迹的时刻你会看到手机屏幕自己在动屏幕出现美女跳舞 - AI 判断“无猫” - 执行Swipe Up。屏幕出现一只布偶猫 - AI 识别成功 - 执行Tap(Like_Icon)- 执行Swipe Up。屏幕出现广告 - AI 识别文本“广告” - 执行Swipe Up。 核心代码剖析 (简化版)为了让大家理解这玩意儿是怎么跑起来的我把核心的 Python 逻辑抽取出来fromapp_agentimportAppAgentfromandroid_envimportAndroidDevice# 1. 连接手机deviceAndroidDevice(serialemulator-5554)# 2. 初始化视觉 AgentagentAppAgent(modelgpt-4o,devicedevice)# 3. 任务循环task刷视频看到猫就点赞whileTrue:# 抓屏 视觉识别ui_elementsdevice.capture_and_label()# AI 思考actionagent.think(screenshotui_elements,instructiontask)# action 返回: {action_type: click, element_id: 5}# 执行ifaction[action_type]click:device.click(action[element_id])elifaction[action_type]swipe:device.swipe(up)print(f AI 执行了:{action}) 总结与展望看到这里你可能觉得这就是个“高级按键精灵”。但在我看来AppAgent 代表了操作系统交互的未来。想象一下老人模式老人对着手机说“给孙子发个红包”AI 自动操作微信完成转账。跨 App 协作说一句“帮我把刚才大众点评的餐厅地址发给李总并预约明晚的滴滴”AI 自动在三个 App 之间跳转操作。这就是“豆包手机”想做的事也是**On-Device AI端侧智能**的终极形态。别再死磕 XML 和 XPath 了给你的爬虫和脚本装上一双“眼睛”吧
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

天津网站搜索排名优化网站建设 套餐

Wan2.2-T2V-5B在Mac M系列芯片上运行表现如何? 你有没有试过,在咖啡馆里打开MacBook,敲一行文字:“一只橘猫跳上窗台,阳光洒在它毛茸茸的背上”——然后不到10秒,一段流畅的小视频就生成了?&…

张小明 2025/12/30 23:53:39 网站建设

python做网站好吗网站建设可行性方案模板

Langchain-Chatchat 轻量级部署与配置指南 在企业知识管理日益智能化的今天,如何快速构建一个安全、高效、支持中文的本地问答系统,成为许多团队关注的重点。Langchain-Chatchat 正是在这一背景下脱颖而出的开源项目——它不仅专为中文场景优化&#xf…

张小明 2025/12/30 23:20:26 网站建设

南昌哪个公司做网站好营口建网站的公司

近期,Navicat 宣布正式支持国产达梦数据库。Navicat 旗下全能工具 支持达梦用户的全方位管理开发需求,而轻量化免费的 则满足小型和独立开发者的基础需求。 Navicat Premium 自版本 17.3 开始支持达梦 DM8 或以上版本。它支持的系统有 Windows、Linux …

张小明 2025/12/31 20:24:54 网站建设

上海想找人设计网站宁夏做网站公司

轻量级大模型首选:Qwen3-8B在消费级显卡上的表现 在生成式AI浪潮席卷全球的今天,越来越多开发者和企业希望将大语言模型(LLM)集成到实际业务中。然而,现实却常常令人望而却步——主流模型动辄需要多张A100显卡、高昂的…

张小明 2025/12/31 21:30:19 网站建设

青龙县建设局网站网站建设织梦怎么样

如何3分钟实现全平台音乐格式转换?解锁音频自由使用教程 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址: htt…

张小明 2025/12/31 15:20:34 网站建设

大兴德艺网站建设短视频seo厂家

Magpie-LuckyDraw作为一款功能强大的年会抽奖系统,凭借其炫酷的3D动画效果和跨平台部署能力,成为各类活动现场的首选抽奖工具。这款开源抽奖软件支持Windows、Mac、Linux、Web和Docker全平台运行,让抽奖环节既公平又充满视觉冲击力。 【免费下…

张小明 2026/1/1 6:03:51 网站建设