QMMMS's Blog

Who You Want to Be

很多时候,我们思考的一切,别人已经思考过了。 这篇文章尝试讲解 Gigachad、Virgin、Incel、Neckbeard、Wojak、Doomer等符号,作为认识自己的一些前置准备 引入 我们都知道这个男人 Gigachad。最纯净、最完美的肉体,全部人类雄性概念所提炼出的最高精华,斗志与耐性与黄金精神更是带给他的追随者无限惊喜。时而他鼓励人们走进健身房进行自我提升;时...

Complex Stable Business Development Process

没有适合所有业务的开发流程,从0开做加法,而不是从100开始做减法 对于复杂业务,模块众多,研发及测试需要跨模块开发及测试,不同模块间流程不统一导致了跨模块开发时成本的增加。因此,需要建设统一的的开发测试上线流程。此外,为了降低流程的成本,通过服务号及机器人等方式,在关键节点通过自动化手段辅助,实现无人介入的目标 阶段 阶段说明 ...

Generation of Silence

具有深度学习或者计算机背景的同学看到这个标题,或许会以为是“一种(基于深度学习的)静默的模型/数据生成方法”。 哈哈,实则不然,只是作为时代浪潮下,2025届全国普通高校毕业生1222万人中的一员,聊聊我所看到的,青年的困境。标题翻译成“寂静的一代”更加适合。 学历贬值 上世纪90年代初,日本在几十年的飞速发展之后,经历了突如其来的经济泡沫破灭,大学毕业生就业率陡然下降,许多名校...

Big Picture of Flarum Extensions

为 Flarum 编写插件所需要的基础知识与实例 支撑组件 PHP是在服务器端运行的脚本语言,与HTML紧密结合。开发人员可以在HTML中嵌入PHP代码,并在服务器上进行解析和执行。这种结合使得开发人员能够轻松地生成动态的Web页面,根据用户的请求动态生成内容。与C、C++语言有着相似的语法结构,与许多数据库管理系统(DBMS)兼容,如MySQL、Oracle、SQLite等。多线程支...

NID任务思考

新意图发现(New Intent Discovery,NID)是在部署实际对话系统时面临的重要问题,它在半监督语料库上训练意图分类器,其中未标记的用户话语包含已知和新颖意图。应当如何设计半监督学习算法? 数据集-CLINC150 该数据集用于评估意图分类系统在存在“超出范围”查询的情况下的性能。 “超出范围”是指不属于任何系统支持的意图类的查询。 训练集有1.8W个文本-标签对,测...

智库慧询:通过与微调大模型对话完成数据库分析

感谢同小组的 ZYH 同学和 ZWC 同学,他们为项目做的贡献比我多 数据是互联网产业的血脉,全球数据分析市场预计将在未来五年内以每年20%的速度增长。但是传统的SQL语句语句构建费时费力,同时还需要数据分析师的参与。希望通过与微调大模型对话,自动完成SQL语句生成、统计图表绘制、数据分析的一系列工作。 整体思路如下: 最终完成的界面:进入系统,自动根据数据库生成数据图表 ...

GLM:General Language Model Pretraining with Autoregressive Blank Infilling

在最近的一个项目中使用到了ChatGLM3-6B开源模型进行微调,在这里简要介绍一下 GLM 模型和 ChatGLM 用到的技术。 关于公司,智谱AI是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了ChatGLM(chatg...