分类：大语言模型

的文章列表

共44篇文章

开源AI模型硬件需求排行榜：你的显卡能跑哪些模型？

按显存需求从低到高排列77款开源AI模型，帮你快速定位自己硬件的\"天花板\"。排行榜说明所有数据基于Q4_K_M量化（最流行的量化格式，质量保留约88%）。显存需求 = 模型文件大小 + 0.5GB运行时开销 + 10%安全余量。MoE模型按总参数计算显存（需加载所有专家）。超轻量级（<2GB）—— 任何设备都能跑排名模型参数显存上下文许可证任务 1 Qwen3 0.6B

大语言模型
admin
4天前
9 热度
0评论

从零实现一个完整 RAG 系统：基于 Eino 框架的检索增强生成实战

在大型语言模型（LLM）广泛应用的今天，检索增强生成（Retrieval-Augmented Generation, RAG）已成为解决模型幻觉、提升回答准确性的核心技术方案。传统的大模型受限于训练数据的截止时间，无法获取实时信息或私有领域知识，往往导致“一本正经地胡说八道”。RAG 技术通过引入外部知识库，实现了“先检索、后生成”的逻辑闭环，使模型能够基于真实、最新的上下文进行推理。本文将深入

大语言模型
admin
5天前
9 热度
0评论

【从0到1构建一个ClaudeAgent】协作-Worktree+任务隔离

在构建自主智能体（Agent）系统时，随着任务复杂度的提升，并发执行带来的资源冲突成为核心痛点。当多个智能体同时处理不同模块的重构或开发任务时，若共享同一代码目录，未提交的更改极易相互污染，导致代码库状态混乱且难以回滚。传统的任务看板仅管理“做什么”，却忽视了“在哪做”的物理隔离问题。为解决这一难题，引入 Git Worktree 机制成为一种高效的技术方案。通过为每个独立任务分配专属的 Git

大语言模型
admin
5天前
7 热度
0评论

在现代化的AI辅助编程工具中，Claude Code 以其流畅的交互体验和高效的代码处理能力脱颖而出。当用户在终端输入“帮我重构这个模块”并看到系统在数十秒内完成文件读取、测试运行及代码编辑时，这背后隐藏着一套极其精密的工程架构。大多数技术文章仅停留在使用层面的教程，而深入探究其内部运行机制——从入口分发到多Agent递归，从流式API调用到复杂的权限检查链——对于理解高性能CLI应用的设计哲学具

大语言模型
admin
5天前
7 热度
0评论

【Command】project-knowledge-init

在现代软件开发流程中，随着项目规模的不断扩大，代码库的复杂性呈指数级增长。传统的文档维护方式往往滞后于代码迭代，导致新成员上手困难、技术债务累积以及AI辅助编程工具上下文缺失等问题。项目知识库（Project Knowledge Base）作为连接代码实现与业务逻辑的桥梁，其质量直接决定了开发效率与智能化水平。本文深入探讨一种基于多Agent协作（Multi-Agent Collaboration

大语言模型
admin
6天前
9 热度
0评论

Function Calling 踩坑实录：让 AI 真正动手帮你干活

在大型语言模型（LLM）的应用开发中，Function Calling（函数调用）是连接人工智能与外部世界的关键桥梁。它赋予了AI模型感知环境和执行操作的能力，使其从单纯的文本生成器进化为能够查询数据库、调用API、修改配置文件的智能代理（Agent）。然而，在实际工程落地过程中，许多开发者往往低估了实现稳定Function Calling的复杂度。常见的痛点包括：模型生成的参数格式错误、无法正

大语言模型
admin
6天前
8 热度
0评论

别再让 AI 瞎猜了：Function Calling 实战，10 分钟让模型真正会用工具

在构建基于大语言模型（LLM）的智能应用时，开发者常面临一个核心挑战：模型虽然具备强大的自然语言处理能力，但缺乏对实时数据和私有业务系统的访问权限。这种局限性往往导致模型在面对具体事实性问题时产生“幻觉”，即自信地编造错误信息。例如，当用户询问“昨天的销售额”时，若未连接真实数据库，模型可能会生成看似合理但完全虚构的数字。Function Calling（函数调用，也称为工具使用）正是解决这一痛点

大语言模型
admin
6天前
9 热度
0评论

你的AI并不笨：它只是缺少一个约束机制

在人工智能应用开发的快速迭代中，开发者常面临一个核心困境：为何拥有强大推理能力的大语言模型（LLM）在实际任务中频频出错？以谷歌推出的20亿参数开源模型Gemma为例，当被要求修复代码漏洞时，它往往忽略现有文件，凭空捏造代码并宣称任务完成。这种现象并非模型智能的缺失，而是缺乏有效的约束机制。本文深入探讨AI智能体工程中的关键转变——从单纯优化模型权重转向构建高效的驾驭系统（Harness）。通过分

大语言模型
admin
7天前
10 热度
0评论

你每天用的 AI，可能真的被“投毒”了

随着大语言模型（LLM）技术的飞速发展，人工智能已深度融入软件开发、数据分析及日常办公等全场景应用中。然而，近期关于“AI被投毒”的讨论引发了技术社区的广泛关注。这一概念并非指代传统意义上的模型训练数据污染，而是指向了更为隐蔽且高频发生的推理阶段输入安全风险。当开发者将AI从简单的问答助手转变为自动化信息处理核心时，如果缺乏对输入数据质量的严格管控，系统极易受到恶意注入或错误信息的误导。本文旨在

大语言模型
admin
7天前
12 热度
0评论

以 Nano-vLLM 为例，深入理解 LLM 推理引擎（Part 2）

在大语言模型（LLM）的应用浪潮中，推理性能直接决定了用户体验与系统成本。当我们向模型输入一段提示词并等待其逐字生成回复时，背后涉及的是千亿级参数神经网络的复杂计算过程。许多开发者往往将推理引擎视为一个黑盒，仅关注API的调用，却忽视了其内部如何通过重写模型代码与深度优化底层计算逻辑，将静态权重转化为高效的智能输出。理解这一过程，不仅有助于排查性能瓶颈，更是构建高性能AI应用的基础。本文将以简化

大语言模型
admin
7天前
11 热度
0评论

曼波资源站 ManboHub

分类：大语言模型

开源AI模型硬件需求排行榜：你的显卡能跑哪些模型？

从零实现一个完整 RAG 系统：基于 Eino 框架的检索增强生成实战

【从0到1构建一个ClaudeAgent】协作-Worktree+任务隔离

Claude Code 源码拆解：一个请求的生命周期

【Command】project-knowledge-init

Function Calling 踩坑实录：让 AI 真正动手帮你干活

别再让 AI 瞎猜了：Function Calling 实战，10 分钟让模型真正会用工具

你的AI并不笨：它只是缺少一个约束机制

你每天用的 AI，可能真的被“投毒”了

以 Nano-vLLM 为例，深入理解 LLM 推理引擎（Part 2）

分类： 大语言模型

分类：大语言模型