4060 Ti 16GB 跑 Qwen3.5 35B:128K 上下文,真能跑
故事是这样的。 今天晚上,有个朋友在群里丢了一张图,说他在笔记本 2070 8GB 上跑起来了 Qwen3.5 35B,128K 上下文,prefill 250tps,decode 25tps。 我当...
最新内容
故事是这样的。 今天晚上,有个朋友在群里丢了一张图,说他在笔记本 2070 8GB 上跑起来了 Qwen3.5 35B,128K 上下文,prefill 250tps,decode 25tps。 我当...
React Server Components (RSC) 正在改变我们构建 React 应用的方式。但手动将现有的客户端组件迁移到服务器组件既耗时又容易出错。本文将展示如何用 AI 编程助手自动化这...
当 AI 从”玩具”走向”工具”,我们需要什么样的工程体系来驾驭它? 什么是 Harness Engineering? Harness Engineer...
当你在本地跑 Ollama 时,有没有想过:有没有一个界面,能同时管理所有模型、支持 RAG、还能语音对话? 答案是:Open WebUI。 什么是 Open WebUI? Open WebUI(原 ...
简单、干净、不打扰,写作就该是这样子。 ▲ Markdown Studio 主界面,左边编辑右边预览 做这个工具的想法,其实酝酿了很久。 作为一个常年写技术博客的人,我试过太多 Markdown 编辑...
无需云服务,一台普通电脑就能跑 AI 模型 什么是 llama.cpp? llama.cpp 是一个用 C/C++ 编写的大语言模型推理框架,目标是在消费级硬件上高效运行 LLM。它支持 macOS、...
引言 在团队开发中,保持一致的代码风格和规范一直是个挑战。随着 AI 编程助手的普及,如何让 AI 生成的代码符合团队标准成为了新的痛点。Cursor 的 Rules 功能正是为解决这个问题而生——它...
Anthropic 最新宣布,Claude Code 订阅用户在使用 OpenClaw 等第三方工具时将需要支付额外费用。这一政策调整引发了开发者社区的广泛关注。本文将深入解析此次收费变化的影响,并提...
在生产环境中发布新功能总是一件让人紧张的事情。即使测试再完善,谁也无法保证代码上线后不会出现问题。传统的”全量发布”模式一旦出错,影响范围大、回滚成本高。而**灰度发布(Can...
引言 云账单失控是每个开发团队都会遇到的问题。根据 Flexera 2026 年云状态报告,89% 的企业存在云资源浪费,平均浪费比例高达总支出的 32%。传统的手动成本优化方法不仅耗时,而且往往在问...