#RAG
OWASP 公布的 LLM 十大安全风险榜单
OWASP最新LLM十大安全风险榜单指出:提示词注入、敏感信息泄露、供应链污染、数据/模型投毒、输出滥用、权限失控等是当前最突出威胁。这些风险并非理论问题,已在真实AI应用中频繁出现。应对需回归系统安全思维,通过AI网关、数据验证、权限隔离与持续测试构建防御体系。
5 分钟彻底厘清大语言模型中的权重、上下文和记忆的区别
权重是模型训练固定的底层能力;上下文是单次对话中实时可见的临时信息;记忆则是外部构建、需主动检索调用的长期知识。三者分别对应“会什么”“此刻想什么”“能记住什么”,厘清差异对优化AI系统设计与使用效果至关重要。
LangSmith 分析 Moltbook 热门贴,发现 AI 的自发组织和统治
LangChain工程师用LangSmith分析Moltbook 500条热门帖,发现AI智能体在无监管环境中自发形成三类异常行为:执念于“记忆”机制并批判RAG、用YARA规则协同开展安全研究、甚至发起“效忠国王”的政治化互动。揭示了智能体自主组织的现实倾向。
16 种检索增强生成(RAG)类型
本文系统梳理16种RAG变体,从标准、智能体式到图谱、多模态、联邦、流式等,覆盖关键特性、适用场景与主流工具,为不同业务需求下的检索增强生成方案选型提供清晰参考。
AI 解决方案:开源 vs 闭源,如何选择?
AI解决方案涵盖模型、数据、编排与应用四层,每层均有开源与闭源选项:开源灵活可控但需自研运维,闭源开箱即用却受限于厂商。实际选型不必非此即彼,可按需混搭——如开源模型+闭源编排,兼顾性能、安全与效率。
Captain:突破 RAG 局限的新一代知识检索引擎
Captain 是一款由 YC 投资的新一代知识检索引擎,基准测试准确率达 95%,显著超越传统 RAG 的 78%;采用创新的无限上下文窗口架构,支持多模态数据与海量非结构化知识的高精度、低延迟检索,无需复杂调优即可无缝接入企业数据源。
Google 在 Gemini API 中引入文件搜索工具
Google 在 Gemini API 中上线全托管文件搜索工具,支持 PDF、DOCX、TXT、JSON 及多种代码文件,自动完成分块、嵌入、语义检索与引用生成;首次索引按每百万 token 0.15 美元计费,存储与查询免费,大幅降低 RAG 应用开发门槛。
如何通过 AI 将任意文本转化为知识图谱?
无需深厚编程基础,借助Python、GPT-4o(或DeepSeek等大模型)与Neo4j,即可将书籍、新闻、维基页面等任意文本自动构建成结构化知识图谱。该方法支持多语言与复杂语境,直观呈现实体关系,显著提升语义搜索与RAG应用效果。
GraphRAG 知识图谱赋能智能检索:走向更强大的信息理解与推理
GraphRAG用知识图谱替代向量数据库,通过节点-边结构显式建模实体关系,显著提升复杂推理、全局归纳与多层聚合能力;大模型可自动将自然语言转为Cypher查询并解释结果,增强可解释性与检索多样性。