科技大霹雳
每日整理前一天的科技热点进行分享
技术文章、实战教程、经验心得,覆盖车机开发、AI 应用、团队管理等领域
claude-plugins-official 是 Anthropic 官方维护的 Claude Code 插件目录,包含 30+ 内部插件(LSP 语言服务器、PR 评审工具包、Git 工作流、代码质量分析等)和 15 个外部合作伙伴插件。20.2k Stars 背后,是一套完整的插件扩展规范——从 plugin.json 元数据到 Skills/Commands/MCP 三种扩展方式,这是理解 Claude Code 可扩展性架构的最佳起点。
RAG 系列第二十三篇。真实文档里 30%–50% 的信息藏在图片和表格里,文本 RAG 完全看不到。三条处理路线:OCR/解析提取后文本化(最成熟)、CLIP 多模态 Embedding(图文同一向量空间)、ColPali 直接把 PDF 页面当图像处理(2024 年最新方法,绕开文本提取)。每条路线各自的适用场景和局限。
RAG 系列最终篇。代码不是文档,它有结构(函数/类)、语义(docstring)和调用关系(call graph)——普通文本分块会把这些全部丢掉。本文用 AST 解析 llm-in-action 代码库(22 个 Python 文件、225 个代码单元),构建调用图(168 条边),实现语义代码搜索和调用链查询。代码运行结果:`build_self_rag_graph` 的完整下游调用链、`main` 的 54 个直接调用、`build_index` 的调用树全部被正确找出。
Academic Research Skills 是一套专为学术研究者设计的 Claude Code Skills,覆盖从选题到发表的完整流程,包含 13 代理深度研究、12 代理论文撰写、7 代理同行评审三大核心技能。更值得关注的是它的工作流设计哲学——防幻觉门控、苏格拉底对话、魔鬼代言人机制,对所有 AI Skill 设计者都有参考价值。
RAG 系列第二十篇。Demo 级 RAG 对所有用户共享同一个向量库,任何人都能检索到任何内容。企业场景需要三件事:多租户隔离(不同公司/部门的知识库互不可见)、权限控制(工程师看不到 HR 文档,HR 看不到财务数据)、服务化(缓存重复问题 + 限流防止滥用)。本文用 Qdrant Collection 实现多租户,用元数据过滤器做权限控制,用滑动窗口实现限流,5 个场景验证全部通过。
RAG 系列第二十一篇。一次 RAG 请求涉及两种 API 调用:Embedding 和 LLM,都是按量计费且有延迟。四种优化:LLM 响应缓存(相同问题 0ms 返回,5057ms→0.8ms)、Embedding 缓存(重复文本零 API 调用)、Semantic Cache(相似问题复用答案,但阈值校准是难点)、异步批量 Embedding(12 条文本 2.87x 加速)。每种优化独立测量,数据说话。
独立开发的产品,从想法到上线全程自己搞定
在播客中分享科技见解、生活思考
每周精选内容直达邮箱,包括技术干货、产品更新、行业洞察。不 spam,随时退订。
我们仅收集您的邮箱地址用于发送 Newsletter,不会与第三方共享。您可以随时退订。
已有 1,024 位订阅者 · 隐私优先,绝不泄露
找到我
在各个平台关注我,获取最新动态