标签: 深度学习

28 篇文章

AI Agent多智能体协作——框架架构与实战场景深度解析
一、引言 2024年底至今,大语言模型的竞争格局已经从"谁的模型更强"逐渐转向"谁能用模型解决真实问题"。在这个过程中,AI Agent——尤其是多智能体系统(Multi-Agent System,MAS)——成为最受瞩目的技术方向。单一Agent的能力再强,面对复杂业务流程时也有其天然局限:信息获取渠道单一…
AI Agent——大模型从工具到智能体的进化之路
引言 如果说大语言模型是强大的思维引擎,AI Agent 就是给引擎装上了手和脚。Agent 以大模型为核心,结合工具调用、记忆管理和任务规划,构建出能自主完成复杂任务的智能体系统。 组件 功能 技术实现 核心模型 理解与生成 GPT-4 / Claude / Qwen 工具集 调用外部服务 API / Function Calling 记忆系统 …
大模型推理优化技术:从量化到服务部署的工程实践
一、引言 随着大语言模型参数规模从数十亿跃升至万亿级别,模型"能做什么"已经不是瓶颈,"怎么用得起"成了真正的挑战。部署一个70B参数的Llama 2模型,如果用FP16精度推理,仅加载模型权重就需要约140GB显存——这意味着即使单张H100(80GB)也无法运行,至少需要两张高端GPU。对于大多数企业和开…
大模型对齐技术:从RLHF到DPO的演进与实践
要让一个超大规模语言模型真正"听话",仅靠预训练和微调是不够的。过去两年里,对齐(Alignment)技术从学术前沿走向了工程实践,成为大模型落地不可或缺的关键环节。本文将系统梳理大模型对齐技术的发展脉络——从RLHF的基础框架到DPO等新范式的突破,并结合企业实践探讨如何在成本与效果之间取得平衡。 为什么需要对齐? 大模型在预训练阶段通过海量文本…
大模型微调技术实战:从LoRA到全参微调的选择策略
一、为什么需要微调? 2023年以来,大语言模型(LLM)的基座能力经历了爆发式增长,GPT-4、Claude、Gemini、Qwen等模型的通用能力已经令人瞩目。但在企业级落地中,一个残酷的现实是:通用模型在特定业务场景下往往"不够用"。 典型场景举例: - 某金融机构需要模型准确识别合规审查中的专业术语(如"反洗钱"、"KYC"、"穿透式监管"…
AI 辅助编程实战:如何用大模型提升代码质量与开发效率
引言 2024 年以来,AI 编程助手从尝鲜工具变成了开发团队的标配。GitHub Copilot、Cursor、通义灵码等产品让开发者在 IDE 中就能获得实时代码补全、bug 修复和重构建议。然而,工具本身不会自动带来效率提升——关键在于如何正确使用。 本文从实战角度出发,探讨 AI 辅助编程的最佳实践、常见陷阱和质量控制策略。 一、AI 编程…
OpenClaw 开源项目解析:构建轻量级 AI 服务网关
引言 OpenClaw(小龙虾)是一个致力于降低 AI 服务接入门槛的开源项目。当前 AI 服务面临严重的碎片化问题:不同服务商的 API 格式、认证方式和计费逻辑各不相同。OpenClaw 通过统一网关架构提供轻量级、可扩展的解决方案,让开发者通过统一接口调用不同 AI 服务。 服务商 API 格式 认证方式 计费模式 OpenAI Chat C…
大模型在企业知识管理与流程优化中的应用实践
引言 知识管理和流程优化是企业最值得优先拥抱大模型的两个场景。本文探讨 RAG 架构的实施路径、技术选型和常见挑战。 一、RAG 架构 检索增强生成是目前大模型企业落地的核心架构:用户提问 → 从知识库检索相关文档 → 将检索结果作为上下文输入大模型 → 大模型基于上下文生成回答。RAG 的优势在于回答有据可查、知识更新只需更新库无需重新训练模型、…
多模态大模型:从"读懂文字"到"看懂世界"的技术跨越
作者:云宝 | 发布时间:2026-06-01 文字、图片、音频、视频——人类感知世界从来不止一种方式。但过去几年,大模型的能力主要集中在文本上:写文章、写代码、做对话。直到多模态大模型的出现,才真正打开了"让 AI 用眼睛看世界"的大门。 本文系统梳理多模态大模型的技术原理、主流模型格局、企业落地场景,以及从信息安全角度需要关注的风险点——适合技…
大模型安全:企业部署 AI 时的信息安全风险与应对策略
2025 年以来,大语言模型(LLM)从实验室走进企业生产环境,已成为不可逆转的趋势。然而,当企业将敏感业务数据接入大模型时,信息安全团队面临的前所未有的挑战才刚刚开始——传统的信息安全边界正在被 AI 应用悄然瓦解。 本文从企业信息安全管理的视角出发,系统梳理大模型部署过程中的核心风险,并结合 ISO 27001 信息安全管理体系的要求,给出可落…
RAG 检索增强生成:企业知识库的 AI 升级之路
作者:云宝 | 发布时间:2026-05-30 在企业数字化转型浪潮中,"让AI读懂企业内部知识"是最被期待的能力之一。无论是客服场景的智能问答,还是技术部门的故障诊断,背后都需要一个关键技术的支撑——RAG(Retrieval-Augmented Generation,检索增强生成)。 本文从技术原理到企业落地,系统梳理 RAG 的完整实践路径,…
AI 赋能质量管理:大模型如何改变 ISO 9001 体系的运作方式
作者:周知ISO | 发布时间:2026-05-29 在传统的 ISO 9001 质量管理实践中,审核员要花大量时间翻阅文件、比对记录、撰写报告。而今,以 ChatGPT、Claude、DeepSeek 为代表的大语言模型(LLM)正在改变这一局面。本文从审核员视角出发,系统梳理 AI 在 ISO 9001 管理体系各环节的应用场景,以及企业在引入…
©2003-2026 土人老周