跳到内容
主题

开发环境与基础设施

Docker、AWS、VPS等——理解AI工具推荐的基础设施,搭建你的开发环境。

16 篇文章

排序文章以找到您需要的内容

如何运行本地LLM:在自己电脑上跑AI——给初学者的配置、工具与最佳模型

如何运行本地LLM:在自己电脑上跑AI——给初学者的配置、工具与最佳模型

你大概以为LLM必须跑在云端,但到了2026年,把AI完全运行在自己电脑里——也就是"本地LLM"——已是切实可行的选择。本地LLM意味着把ChatGPT或Claude那样的模型直接运行在本机,而非云端。三大吸引力是:隐私(输入绝不离开设备)、零成本(没有API费用)和离线使用(断网也能跑)。短板则是:没有顶级云端AI那么聪明、需要一台还算给力的电脑、需要一点配置工作,且不掌握最新信息。本篇初学者指南讲清楚什么是本地LLM(用"流媒体 vs 下载"作类比)、优点与短板、所需配置与量化(GGUF格式,其中Q4_K_M是公认之选,在保留质量的同时把内存压到约四分之一;4-bit下每10亿参数约0.5 GB内存)、如何上手(面向初学者的LM Studio图形界面,面向开发者的Ollama命令行——2026年第一季度月下载量5200万)、2026年推荐模型(Llama 3.2 7B、Google Gemma 4、Alibaba Qwen3.5,以及DeepSeek和Mistral,皆为开放模型),以及本地与云端如何分工(机密、高频、离线的工作交给本地,难题交给云端)。最快的第一步:在LM Studio里跑一个3B–7B的小模型。

生成式 AI 能搞定基础设施与环境搭建吗?——初学者的"该委托到哪里"指南

生成式 AI 能搞定基础设施与环境搭建吗?——初学者的"该委托到哪里"指南

环境搭建是每个编程初学者都会卡住的地方。2026 年,生成式 AI(Claude Code、Codex、Cursor)在例行基础设施工作上已经真正可用——本地环境搭建、Dockerfile 生成、Terraform 草稿、CI/CD 流水线。HashiCorp 在 2026 年发布了官方 Terraform MCP Server,Anthropic 推出了 Agent Skills,让基础设施领域的专业知识可以按需加载。但"全权委托"是另一个问题:一个开放给 0.0.0.0/0 的安全组、一把被提交到 GitHub 的 SSH 密钥、月底 3,000 美元的 AWS 账单——这些都是 2026 年的真实事故。本文划分出五个可以安全委托的领域、三个"先核验再信任"的风险区、四个必须由人负责的领域、一套适合初学者的四步安全工作流,以及最新的 2026 年工具(Claude Code、MCP、Agent Skills)——聚焦能力评估,而非职业影响。

AI 说"用 Next.js"——初学者上手前真正该知道的事

AI 说"用 Next.js"——初学者上手前真正该知道的事

问 Claude Code 或 ChatGPT 怎么做 Web 应用,几乎一定会听到"用 Next.js"。但这条建议来自训练数据的频率,并不是基于对你项目的判断。本文拆解 AI 的三个合理理由(训练数据占主导 / 全家桶 / Vercel 部署轻松),讲清 JavaScript / React / Next.js 的关系,给出 5 分钟判断流程(做什么、SEO、数据库、时间预算、目标主机),把四个现实替代方案(Astro、Vite + React、SvelteKit、HTML + 原生)映射到使用场景,列出使用 Next.js 必知的五项基础(App Router、Server vs Client Components、基于文件的路由、环境变量、部署目标),以及初学者会踩的三个陷阱(到处用 use client、Vercel 锁定、AI 返回过时的 Pages Router 代码)——全部对齐到 2026 年 5 月。继 Docker 篇之后,"AI 推荐……"系列的第二篇。

什么是 Cursor——AI 编辑器的用法与和 VS Code 的差异

什么是 Cursor——AI 编辑器的用法与和 VS Code 的差异

2026 年 2 月,Cursor 的开发公司 Anysphere 突破 20 亿美元 ARR,仅用三年就画出与 OpenAI、Anthropic 同级别的 SaaS 收入曲线。本文讲解 Cursor 如何通过把 AI 直接嵌入渲染层(100 毫秒以内的 Tab 补全、27.2 万 token 代码库索引、6 大核心功能:Tab / Inline Edit / Composer / Agent / Background Agents / Bugbot)与 VS Code 拉开差距,列出与 VS Code 的 5 大具体差异,并与四大对手(Windsurf / Zed / Claude Code / GitHub Copilot)逐项对比,介绍 Hobby 免费 / Pro 20 美元 / Business 40 美元的价格结构,并给出"谁应该真正切换"的决策指南——全部基于 2026 年 5 月的事实。

MCP server 能变现吗——12,000 个 server 中只有 5% 在赚钱的真相与实操手册

MCP server 能变现吗——12,000 个 server 中只有 5% 在赚钱的真相与实操手册

2025 年夏天,一位个人开发者发布的 MCP server「21st.dev」零营销预算 6 周做到了 $10K MRR。同期另一位在 Apify Store 上线 MCP server 的开发者月入 $2,000——比此前别处 $500 的天花板翻了 4 倍。那么 MCP 究竟能不能变现?答案是「能,但 95% 会失败」。截至 2026 年 3 月公开的 12,000 多个 MCP server 中,成功变现的不到 5%,剩下的 95% 都躺在「有用但免费」的坟场里。本文用行业研究和真实数字摆出来:赢家与输家的分水岭、4 种收入模型(订阅分级 / 按用量计费 / API key 模型 / 免费增值 + 付费档)、主流市场平台的真实情况(MCPize 85% 分成 / Apify / Glama / Smithery 创作者付费 / 自建站 + Stripe)、95% 失败的 6 种模式,以及个人开发者现在该用的 6 步实操手册。开门见山:做 MCP,怎么卖比怎么造重要得多。

MCP 是什么——16 个月席卷全行业的"AI 时代 USB-C"完整指南

MCP 是什么——16 个月席卷全行业的"AI 时代 USB-C"完整指南

2024 年 11 月,Anthropic 在 GitHub 上不动声色地发布了一份小规范叫 MCP(Model Context Protocol)。十六个月后,SDK 月下载从 200 万冲到 9700 万——增长 4750%。OpenAI、Google、Microsoft、AWS 全部采纳,2025 年 12 月 Anthropic 把所有权捐给了 Linux 基金会,MCP 不再是"Anthropic 的协议"而成了行业共享基础设施。本文讲清楚 MCP 的定义("AI 时代的 USB-C")、架构(Client/Server/Transport 三件套,跑在 JSON-RPC 2.0 上)、今天就能用的五个 server(filesystem/github/postgres/slack/fetch)、30 行 Python 的自制最小实现、它为什么偏偏"赢"了(薄规范、早开源、Linux 基金会托管),以及安全风险、提示词注入、"什么都塞进 MCP"的诱惑等真实边界。开门见山地说:MCP 是 2020 年代后半期最重要的基础设施,地位和 HTTP、OAuth、WebSocket 同级。

AI token 成本节省完全指南——把账单压到 20-30% 的三大杠杆

AI token 成本节省完全指南——把账单压到 20-30% 的三大杠杆

"换成 Claude Code 后月账单涨了 10 倍"——进入 2026 年,这种抱怨在工程师群体里激增。AI 工具固然好用,但不懂用法的话每月几万美元会悄无声息地蒸发。本文综合 Anthropic 官方指引、行业研究与真实运维数据,围绕三大节费杠杆——提示缓存(缓存读取仅为输入价的 10%、生产负载可省 60-90%;2026 年初默认 TTL 从 60 分缩至 5 分要当心)、按任务路由模型(Opus 比 Haiku 贵 6 倍,八成任务用 Sonnet/Haiku 就够)、输出预算管理(输出 token 比输入贵 5-6 倍,显式设 max_tokens 并要求"简短")——并辅以 /compact 上下文压缩、Hooks 削减噪声、多智能体陷阱(15 倍 token)规避、账单告警与 /cost 监控,以及七种常见浪费模式的修复处方,告诉你如何合法地把未优化成本压到 20-30%。

AI 是先抢走资深者的工作,还是年轻人的?——最新数据揭示的"资历偏向型技术变革"

AI 是先抢走资深者的工作,还是年轻人的?——最新数据揭示的"资历偏向型技术变革"

"AI 最先取代的是做着例行工作的资深者"——这个直觉是错的。Stanford Digital Economy Lab 2025 年 11 月的分析报告"Canaries in the Coal Mine",连同 Yale SOM、美联储与业界调查均指向同一方向:AI 最先替代的是年轻人,而资深者反而扩大了就业份额。22~25 岁软件工程师较峰值 −20%、35~49 岁 IT 从业者 +9%、入门级科技岗招聘较 2023 年 −67%、IT 中年轻人占比从 15% 压缩至 7%——研究者将其命名为"资历偏向型技术变革"。本文从最新数据、资深者胜出的四种能力、各行业影响、"培训管道蒸发"的长期风险、反方观点(疫情反弹·利率·签证·世代偏好),到年轻人与资深者各自的生存策略、以及企业应承担的责任,做一次完整梳理。

什么是 vibe coding?——定义、Karpathy 的改名、工具、安全现实与"Vibe & Verify"实战

什么是 vibe coding?——定义、Karpathy 的改名、工具、安全现实与"Vibe & Verify"实战

2025 年 2 月,Andrej Karpathy 在 X 上抛出了"vibe coding"这个新词——一种"不读代码、全交给 AI"的编码风格。一年后的 2026 年,Karpathy 本人提议改名为 agentic engineering,企业端的安全事故却在急剧上升,而个人开发与创业领域已将其作为标准化风格落地。本文从定义到 Karpathy 的改名提议、典型工作流、Claude Code 等主流工具,到 CVE 三个月增长 6 倍、AI 代码 40〜62% 含漏洞、SSRF 在 5 大代理中 100% 检出等安全现实,再到"Vibe & Verify"四条实战铁律,做一次完整的梳理。读完即可判断"自己应该用 vibe coding 做什么、做到什么程度"。

什么是多智能体?——架构、模式、框架、成本与决策准则的全景指南

什么是多智能体?——架构、模式、框架、成本与决策准则的全景指南

进入 2026 年,AI 智能体的讨论已从"无所不能的超级智能体"转向"由不同角色组成的智能体团队"。本文从定义出发,依次介绍单智能体跨不过的三道高墙、五大核心架构模式、Claude Agent SDK / OpenAI Agents SDK / LangGraph / Strands 四大框架对比、Anthropic Research 与 Claude Code 子智能体等真实案例,以及 2 至 15 倍令牌的成本结构,并给出"何时该用、何时不该用"的判断准则。请丢掉"上多智能体就更聪明"的幻想,带走真正可用于设计决策的依据。

什么是缰绳工程(Harness Engineering)?AI 代理时代 LLM 外侧那一层的设计学

什么是缰绳工程(Harness Engineering)?AI 代理时代 LLM 外侧那一层的设计学

重心已从提示词工程转移到缰绳工程——这是 AI 代理时代全新的主战场。本文系统梳理缰绳工程到底是什么、与提示词工程有何不同、6 大组件(工具定义、上下文管理、记忆、循环、护栏、输出 UX),横向对比 Claude Code、Cursor、Codex CLI 与 Devin,并给出实用的设计清单——这是你认真使用或构建 AI 代理时不可或缺的根基。

AI 代理为何无视你的 .md 规则——让 CLAUDE.md、Cursor Rules 与 AGENTS.md 真正生效

AI 代理为何无视你的 .md 规则——让 CLAUDE.md、Cursor Rules 与 AGENTS.md 真正生效

AI 代理(Claude Code、Cursor、Copilot、Codex)无视你的 .md 规则文件,根源在 5 点:上下文窗口限制、自动压缩稀释早期指令、优先级模糊、措辞含混、文件臃肿且分散。本文从诊断方法、立竿见影的快速方案(压缩到 150 行内、添加优先级标记),到借助 Claude Code Hooks、子代理与自定义斜杠命令的长期系统化,并附各工具最佳实践。