文章目录
- 1. Quantization
- 1.1 Weight-Activation Quantization: SmoothQuant
- 1.2 Weight-Only Quantization: AWQ and TinyChat
- 1.2.1 AWQ
- 1.2.2 TinyChat
- 1.3 Further Practice: QServe (W4A8KV4)
张小明
前端开发工程师
Excalidraw绘制AR/VR交互:沉浸式体验路径图 在设计一款新的VR教育应用时,团队常面临这样的困境:产品经理用文档描述用户从戴上头显到进入三维课堂的完整流程,UI设计师却难以快速将其转化为可视化的动线图;工程师关心手…
Excalidraw构建元宇宙空间:虚拟世界架构设想 在远程协作成为常态的今天,团队沟通中的“语境缺失”问题愈发突出。工程师讨论系统架构时,仅靠文字描述难以对齐认知;产品与开发交接需求时,缺少一个共同的视觉锚点。这种…
网络资源访问与Windows 7域管理全解析 1. 网络资源访问权限 在网络环境中,资源的访问权限至关重要。对于打印机资源,主要有以下几种权限: - 读取权限(Read Permissions) :拥有此权限的用户可以读取分配的权限。当打印机共享时,“所有人”组除了获得打印权限外,还会…
Excalidraw 绘制 CI/CD 流水线:DevOps 可视化的工程实践 在一次跨时区的远程架构评审会上,团队花了整整 40 分钟争论“CI 触发条件是否包含 PR 合并前的集成测试”。不是因为逻辑复杂,而是没人能快速画出一张清晰的流程图来对齐认知。最终有人…
Excalidraw绘制机器学习 pipeline:训练部署全流程 在一次跨时区的远程评审会上,算法工程师正试图向运维团队解释模型上线后的流量路径。白板上贴满了手写便签,PPT里的架构图层层嵌套,却依然有人频频发问:“这个特征服务…
Excalidraw构建应急响应图:突发事件预案 在一次深夜的线上故障复盘会上,某科技公司的运维团队围坐在虚拟会议室中。屏幕上是一张杂乱无章的PPT流程图——“先通知A,再联系B,如果C没响应就找D”……每个人都在试图回忆自己在应急流…