<feed xmlns="http://www.w3.org/2005/Atom"> <id>https://qmmms.github.io/</id><title>QMMMS's Blog</title><subtitle>QMMMS/赛博升哥的技术小站</subtitle> <updated>2026-01-27T22:25:09+08:00</updated> <author> <name>赛博升哥</name> <uri>https://qmmms.github.io/</uri> </author><link rel="self" type="application/atom+xml" href="https://qmmms.github.io/feed.xml"/><link rel="alternate" type="text/html" hreflang="zh-CN" href="https://qmmms.github.io/"/> <generator uri="https://jekyllrb.com/" version="4.4.1">Jekyll</generator> <rights> © 2026 赛博升哥 </rights> <icon>/assets/img/favicons/favicon.ico</icon> <logo>/assets/img/favicons/favicon-96x96.png</logo> <entry><title>WebArena 部署踩坑</title><link href="https://qmmms.github.io/posts/webarena/" rel="alternate" type="text/html" title="WebArena 部署踩坑" /><published>2026-01-27T20:24:00+08:00</published> <updated>2026-01-27T20:24:00+08:00</updated> <id>https://qmmms.github.io/posts/webarena/</id> <content type="text/html" src="https://qmmms.github.io/posts/webarena/" /> <author> <name>赛博升哥</name> </author> <category term="经验与总结" /> <summary>参考：Webarena、WebAgent-R1 Map 网站 后端服务部署 (Tile, Nominatim, OSRM) 在 WebArena 中，地图功能并不依赖外部公网 API（如 Google Maps），而是完全本地化部署。这涉及三个核心服务： Tile Server: 提供地图瓦片图片渲染（视觉层）。 Nominatim: 提供地理编码服务（搜索地址转坐标，或坐标转地址）。 OSRM: 提供路径规划服务（驾车、骑行、步行导航）。 直接下载 AWS S3 上预构建好的数据卷的方式进行部署。 前置要求： 确保服务器有足够的磁盘空间（建议预留 200GB+）。 确保已安装 Docker。 设置环境变量 DATA_ROOT 指向你的数据存储目录，例如：export DATA_ROOT=/data/map_back...</summary> </entry> <entry><title>CrowdAgent：一些讨论</title><link href="https://qmmms.github.io/posts/CrowdAgent/" rel="alternate" type="text/html" title="CrowdAgent：一些讨论" /><published>2025-10-05T20:24:00+08:00</published> <updated>2026-01-27T22:23:26+08:00</updated> <id>https://qmmms.github.io/posts/CrowdAgent/</id> <content type="text/html" src="https://qmmms.github.io/posts/CrowdAgent/" /> <author> <name>赛博升哥</name> </author> <category term="经验与总结" /> <summary>一篇工作 CrowdAgent: Multi-Agent Managed Multi-Source Annotation System 被 EMNLP 2025 System demonstrations 接收了，在这篇博客中，我想简要谈谈论文背后的工作、限制与其他的一些想法 太长不看 CrowdAgent 可以看作是之前 EMNLP’23 发表的 FreeAL 的延申。 FreeAL 讨论了在无人类参与下大模型与小模型组成的主动学习 pipeline 利用LLM进行标注是完全可行的 小模型可以协同进行过滤、精炼大模型的标签 完全监督、弱监督的小模型在很多场景下比（未精调）大模型强 在一些讨论中（包括 FreeAL 的 知乎文章），一个问题被提及：完全抛弃真人标注者，真的对吗？ 数据标注的最终目标是服务于人类的应用，其“黄金标准”也源于人类的共识。一个完...</summary> </entry> <entry><title>当我聊起丰川祥子，我在想什么</title><link href="https://qmmms.github.io/posts/saki/" rel="alternate" type="text/html" title="当我聊起丰川祥子，我在想什么" /><published>2025-10-02T00:24:00+08:00</published> <updated>2025-10-02T00:24:00+08:00</updated> <id>https://qmmms.github.io/posts/saki/</id> <content type="text/html" src="https://qmmms.github.io/posts/saki/" /> <author> <name>赛博升哥</name> </author> <category term="经验与总结" /> <summary>参考： 丰川祥子堂吉诃德论 wiki 丰川祥子人物分析 谁是Ave Mujica最强数值怪？丰川祥子是个怎样的“人”？（上） 丰川祥子是 BanG Dream! 系列动画 MyGO 和 Ave Mujica 的重要人物，在动画播出时讨论度很高。丰川祥子是复杂的，多面的，在不同的观众中形象不同，对于很多人来说，似乎在这个角色中看到了自己的影子。在这里结合之前的参考来聊聊。 简历 丰川祥子是丰川集团的大小姐，父亲丰川清告入赘，祥子随母丰川瑞穗姓。与睦是青梅竹马，并与三角初华结下友谊 初三时，母亲瑞穗因病急逝，对祥子造成了不小的打击。 被睦拉去观看月之森音乐祭时看到了前辈乐队Morfonica的表演，深受鼓舞 组成了乐队CRYCHIC，一直开导灯，让灯感受到了温暖 灯完成《春日影》的歌词后，祥子为歌词落泪，并认为这...</summary> </entry> <entry><title>平行世界中的某互联网厂实习回忆录</title><link href="https://qmmms.github.io/posts/intrn/" rel="alternate" type="text/html" title="平行世界中的某互联网厂实习回忆录" /><published>2025-09-18T23:00:00+08:00</published> <updated>2025-09-18T23:00:00+08:00</updated> <id>https://qmmms.github.io/posts/intrn/</id> <content type="text/html" src="https://qmmms.github.io/posts/intrn/" /> <author> <name>赛博升哥</name> </author> <category term="经验与总结" /> <summary>平行世界，虚拟时间，虚拟地点，虚拟公司，请不要对号入座 福利与工作环境 L 型工位，带两个柜子和人体工学椅，工位间的隔板很高，环境很不错。不过对于有些不太幸运的实习生，正式工位不够，就只能在走廊里架一个临时桌子当工位。 每个楼层分 A、B、C 区，只有 B 区有会议室，其他都是工位。会议室有各种规模的，几人到100多人。事实上，如果是谈具体的工作，那么十人左右的会议室完全足够了。100多人的大会议室大多都是部门层面去做总结，或者是谈未来的方向，或是评优，不是具体的事项。平常会议室还是挺紧张的，如果要去快速做一下对齐， A、B、C 区都有休息区可以快速聊一下。 食堂饭菜种类很多，早饭夜宵免费，午饭和晚饭付费，但每个工作日有20餐补。每天午饭后发免费水果或酸奶，周末食堂不开。 学校和户口都不在公司所在城市的话，会有租房补贴，1600 对于正式员工如果租房每月能提两千的公积金...</summary> </entry> <entry><title>LLaMA-Factory 实战记录</title><link href="https://qmmms.github.io/posts/llamafactory/" rel="alternate" type="text/html" title="LLaMA-Factory 实战记录" /><published>2025-07-13T08:00:00+08:00</published> <updated>2025-08-21T23:10:36+08:00</updated> <id>https://qmmms.github.io/posts/llamafactory/</id> <content type="text/html" src="https://qmmms.github.io/posts/llamafactory/" /> <author> <name>赛博升哥</name> </author> <category term="经验与总结" /> <summary>本文旨在完整记录一次利用开源框架LLaMA-Factory对Qwen2.5-VL-7B-Instruct模型进行微调（SFT、RL）的全过程。内容涵盖环境配置、任务定义、数据准备、训练策略、过程监控、推理验证、结果分析与部署。 环境准备 使用了如下软硬件及模型资源： 硬件环境: 本次实践基于8张NVIDIA A800（80GB显存）GPU服务器。 微调框架: LLaMA-Factory，一个集成了多种微调方法的用户友好型开源框架。具体安装方式请遵循其官方GitHub仓库指南：https://github.com/hiyouga/LLaMA-Factory 基础模型: Qwen2.5-VL-7B-Instruct，由阿里巴巴通义千问团队开源的70亿参数视觉语言模型。模型权重（约16GB）可通过ModelScope进行下载：https://modelscope.cn/...</summary> </entry> </feed>
