Files
Project-Caffeine/docs/design/project-caffeine-user-requirement-analysis.md
2026-03-01 14:26:55 +08:00

29 KiB
Raw Blame History

Project Caffeine用户需求分析文档

1. 项目概述

本系统旨在开发一个基于 MCP (Model Context Protocol) 架构的个人级研究助手智能体系统。系统通过打通多源学术数据库,并基于多种经典思维框架(如 5W3H、5 Whys、SCQA 等与递归深度研究Recursive Deep Research算法驱动大语言模型进行多智能体协同与 Chain of Thought (CoT) 深度推理,为研究人员提供极具深度的主题洞察与结构化报告。

  • 核心闭环打通:实现“输入研究主题 -> 自动化全网检索 -> 数据语义分块与清洗 -> 动态角色化提示词组装 -> 大模型迭代深度推理 -> 输出带有引用的专业报告”的全链路。
  • 微服务化解耦将系统拆分为“文献查询执行与分块”、“提示词策略军师与角色路由”与“CoT推理大脑”三个独立运行的 MCP Server通过标准协议如 stdio 或 SSE与外部支持 MCP 的大模型客户端协同工作。
  • 递归深度控制:引入 depth(研究深度)和 breadth研究广度参数支持大模型在初步检索后带着“已知洞察Learnings”进行多轮自我追问与深挖。
  • 建立标准数据底座:确立 JSON用于系统底层交互与 YAML/Markdown用于本地知识库数据标准无缝对接个人知识管理软件。

2. 需求背景与用户痛点分析

在现代学术研究与深度行业调研中研究人员面临着跨领域、海量信息处理的巨大挑战。通过对研究工作流进行深度的“5 Whys”剖析我们提取出当前用户在日常研究中面临的四大核心痛点并以此作为本个人级研究助手智能体设计的根本出发点

2.1 信息源繁杂与人工处理效率低下(自动化采集需求)

现代研究高度依赖多种数据来源,包括各类期刊论文、报告和跨库文献(如 Google Scholar、PubMed、arXiv、Semantic Scholar 等)。面对如此庞杂且缺乏统一整理方式的信息来源,手动筛选和处理不仅需要大量重复性劳动,极易使人疲劳,而且难以全面覆盖所有关键内容。用户急需自动化信息处理能力来替代繁杂的数据搬运工作。

2.2 传统检索无法理解复杂研究意图(智能意图拆解需求)

用户在发起研究时,往往只有一个初步或模糊的方向。传统的搜索工具只能接受简单关键词,无法理解并执行用户的复杂研究指令。用户需要一个智能中枢,能够适应不同的研究需求,通过层层剥离问题表象(如连续追问五次“为什么”),主动发现底层的学术痛点,并将模糊想法转化为精准的检索策略。

2.3 海量文献缺乏深度整合与逻辑提炼(结构化推理需求)

获取海量文献摘要仅仅是第一步,如何从中提炼价值才是核心难题。人工对比多篇文献的研究方法差异、梳理时间脉络并推演未来趋势极其耗时。用户需要的不仅仅是文献聚合,而是系统能够结合经典思维框架(如 SCQA、SWOT 等),自动进行多步深度推理,快速提取关键点并生成高质量、结构化的深度调研报告。

2.4 知识资产孤立与缺乏可追溯性(知识图谱构建需求)

在长期的研究中,单次检索获取的信息极易成为“数据孤岛”,难以保证信息的可访问性、可追溯性和可分析性。用户希望每次研究的成果都能转化为永久的个人知识资产,通过统一的格式保存到本地知识库中,以便后续通过标签、双向链接等方式发现跨学科的隐藏关联。


3. 核心功能需求

3.1 输入解析模块

本模块位于用户交互的最前端,负责将用户自然语言表达的模糊研究想法,转化为系统可执行的结构化参数与底层检索指令。

  1. 自然语言意图提取:自动解析用户输入中的隐式条件,提取核心研究主题、目标时间范围(如“近五年”)、特定领域限制及语言偏好。
  2. 递归参数初始化:提取或应用系统级的深度 (depth) 和广度 (breadth) 参数。若用户未显式指定,系统默认设定 depth=2, breadth=3,以启动标准深度的递归研究机制。
  3. 多维 Query 发散与降维 (Query Generation):面对宽泛的研究主题,调用提示词策略 Server 将单一请求拆解为多个(数量取决于 breadth 值)高精度、专业化的学术数据库检索关键词组 (SERP Queries)。

3.2 提示词生成模块

作为整个智能体系统的“大脑皮层”,本模块通过 MCP 协议的 Prompts 原语,在研究的不同阶段动态组装并下发最优的上下文指令。

  1. 动态角色注入 (Persona Agents):根据当前所处的工作流节点,向大模型强制注入特定角色的系统指令。

    • 信息搜集期:注入“资深检索策略专家”角色,侧重于广度扫描与关键词变异。
    • 信息消化期:注入“洞察提取研究员”角色,侧重于事实核查与数据提炼。
    • 报告合成期:注入“战略分析顾问”角色,侧重于宏观视角的逻辑推演。
  2. 经典思维框架挂载 (Framework Templates):提供标准化的结构提示词模板,如 5W3H(全面拆解)、SCQA(问题定义与汇报)、5 Whys(根因追溯)等,强制约束大模型的思考路径。

  3. 上下文无缝拼接 (Context Assembly):在递归深挖过程中,负责将上一轮提取的“已知洞察 (Learnings)”以特定的结构化格式拼接入本轮的提示词中,确保模型带着“先验知识”进行下一步推理。

3.3 模型推理模块

本模块基于 MCP Client如 Claude Desktop、Cursor 、Cherry Studio等的调度承载大语言模型执行多步复杂逻辑推理 (Chain of Thought),并负责最终成果的输出。

  1. CoT 深度推理与可视化:在生成最终报告前,强制模型按照设定的思维框架(如 5W3H分步执行逻辑链并在客户端中以清晰的步骤编号输出推理过程1. 正在评估现状(S)... 2. 发现核心冲突(C)...),确保推理路径透明、可追溯。

  2. 输出质量强制校验 (Quality Validation):在报告生成阶段,模型需结合内置的质检标准进行自我审查:

    • 引用密度校验:每段核心结论必须包含对应的文献溯源标记(如 [文献标题/ID]),确保结论的严谨性。
    • 时效性与冲突检查:自动核查引用的时效性,并在报告末尾强制生成“研究局限性与利益冲突声明 (Limitations)”。
  3. 模块化结构输出:强制使用 Markdown 格式,输出包含摘要 (Abstract)、引言 (Intro)、主体事实 (Body)、核心洞察总结 (Key Learnings) 的标准化报告。

3.4 反馈优化机制

该模块旨在通过“人机协同”与“系统自律”双重循环,不断提升研究的精度和深度。

  1. 系统级递归自评估 (Autonomous Depth Control):在每次数据抓取与洞察提取后,模型自动调用 evaluate_research_depth 工具,对比当前已获知的 Learnings 与设定的 depth 目标。若发现信息仍存在盲区,系统将自主生成更刁钻的追问提示词,进入下一轮抓取,直至满足深度要求。

  2. 用户级人工纠偏循环 (Human-in-the-Loop)

    • 用户可在研究的中间态(如模型列出大纲时)或最终报告生成后,通过客户端给出显式反馈(例:“请重点补充该技术在成本控制 (How much) 方面的文献分析”)。
    • 系统捕获反馈后,即时更新当前对话的上下文,动态调整下一轮检索策略或重新生成对应的报告模块。

3.5 数据存储与检索模块

该模块充当智能体的“数据管家”,负责打通云端学术数据、模型内存与用户本地知识库的物理边界。

  1. 长文本语义递归分块 (Semantic Chunking)针对从外部获取的超长学术文献PDF 或长网页),在投递给大模型前进行 Token 感知的语义切块,避免超出上下文窗口限制,保障核心逻辑无损传递。

  2. 双轨制数据落盘 (JSON + Markdown)

    • 系统交互:底层数据流转与缓存统一采用标准化 JSON 格式,便于程序高效解析。
    • 本地归档:将核心文献与最终分析报告,通过内置适配器转换为带有 YAML Frontmatter 元数据(包含标题、作者、分类、标签等)的 Markdown 文件,持久化存入用户指定的本地目录。
  3. 个人知识网络构建 (PKM Integration):利用生成的 Markdown 与 YAML 规范,无缝对接 ObsidianLogseq 等个人知识管理软件。支持双向链接 (Bi-directional Linking) 构建,将孤立的分析报告织成互相关联的个人学术知识图谱。


4. 系统整体架构设计

4.1 解决方案与系统映射

基于以上痛点,本个人级研究助手智能体以自动化信息处理为核心,首创了基于 MCP 协议的“三体微服务解耦架构”:

  • 针对痛点1:引入文献查询 MCP Server (“执行者”),全自动打通多源学术库执行数据抓取。
  • 针对痛点2:引入提示词策略 MCP Server (“军师”),智能拆解用户意图,动态组装高精度检索策略。
  • 针对痛点3:引入CoT 多步推理 MCP Server (“分析师”),利用大语言模型执行 Chain of Thought 推理,输出极具深度的主题洞察与结论汇总。
  • 针对痛点4:确立 JSON 与 YAML/Markdown 双轨制数据标准,将生成的报告与原始文献无缝沉淀至本地个人知识管理软件(如 Obsidian助力构建专属的学术知识图谱。

4.2 系统服务器角色说明

4.2.1 文献查询 MCP Server (“执行者”)

该 Server 纯粹作为智能体的“手”和“脚”,不包含任何提示词逻辑,专职负责与外部学术世界的物理交互及本地文件的 I/O 操作。

  1. 多源数据库检索:支持连接并搜索 Google Scholar、PubMed、arXiv、Semantic Scholar 等多个数据库。

  2. 核心 Tools 模块

     - search_academic_literature根据参数query、limit、year_range 等)调用底层数据库 API输出包含标题、摘要、引用量等元数据的标准 JSON 数组。  - fetch_document_details:当摘要不足以支撑分析时,通过 document_id 或 doi 获取指定文献的 JSON 格式详细文本块。  -   crape_and_parse_deep_content :深度网页与文档解析工具。突破 API 限制当遇到核心价值的外部链接、PDF 文档或深层网页时,绕过简单摘要,直接抓取并解析清洗去噪后的长文本原文。  - manage_exploration_state:探索状态与去重账本工具。用于记录已检索的 Query 和抓取的文献 URL防止在多轮递归搜索中陷入死循环或重复阅读。  - save_to_local_vault:内置数据适配器,将内存中的 JSON 数据自动转换为带有 YAML Frontmatter 的 Markdown (.md) 文件,并存入指定本地目录。

  3. 并发与缓存管理 内置 LRU 缓存与并发限制,在同时抓取多篇文献时避免 API 速率限制。

  4. 核心 Resources 模块:提供 vault://local_literature/ 协议,专门允许大模型读取保存在本地的 YAML/Markdown 格式历史文献与分析笔记。

4.2.2 提示词策略 MCP Server (“军师”)

该 Server 是整个智能体系统掌控方向的引擎,贯穿于研究的整个生命周期。除了单次的语义拆解,它还支持接收 depth (研究深度)和 breadth (研究广度) 参数,充当深度研究的“导航仪”。

  1. Persona Agents角色化智能体注入 针对不同研究阶段,赋予大模型不同的专业 Persona例如“资深检索策略专家”负责生成 Query、“洞察提取研究员”负责阅读文献、“战略分析顾问”负责总结

  2. 核心 Tools 模块

     - generate_search_queries 当用户的研究主题过于模糊时,辅助大模型将其拆解为 3-5 个高精度的专业检索 Query转化为标准 JSON 参数),以便准确调用检索工具。  -  evaluate_knowledge_gaps:知识盲区与子查询生成工具。在每一轮文献数据返回后,强制模型评估“当前信息”与“最终目标”的差距,自动派生下一轮并发子查询 (Sub-queries)。  - generate_5w3h_enhanced_prompt 将模糊的想法拆解为 Who、What、Where、When、Why、How、How much、How to do 八个维度的结构化提示词。  - generate_5whys_root_cause_analysis:强制模型连续追问五次“为什么”,层层递进剥离问题的表象,寻找最底层的学术痛点。  - analyze_via_scqa:运用麦肯锡金字塔原理,梳理出情境 (S)、冲突 (C)、疑问 (Q) 和回答 (A)。  - analyze_via_six_hats:使用六顶思考帽,从数据事实、风险、价值、直觉等 6 个维度交叉评估一篇具有争议性的前沿论文(来自我们的对话历史)  - analyze_via_swotSWOT 分析,从内部核心优势 (S)、内部短板 (W)、外部机会红利 (O) 以及外部风险 (T) 四个象限进行深度剖析。  - analyze_via_pestlePESTLE 宏观背景分析,从政治政策 (P)、经济环境 (E)、社会文化 (S)、技术革新 (T)、法律合规 (L)、环境发展 (E) 六个宏观维度系统输出研报。

  3. 核心 Resources 模块:提供 templates://prompt_template/ 协议,专门允许大模型读取保存在本地的高质量 5W3H、SCQA、5 Whys 等结构化提示词模板。

4.2.3 CoT 多步推理 MCP Server ( “分析师”)

该 Server 是纯粹的逻辑推理引擎,它接收“提示词增强与策略 MCP Server”下发的高阶提示词结合“ 文献查询 MCP Server”抓取的文献数据执行严谨的学术分析。

  1. 核心 Prompts 模块

   - cot_literature_synthesis:核心 Prompt强制大模型运用 Chain of Thought 框架对检索到的多篇文献进行交叉对比。要求模型先按时间线梳理脉络 -> 再对比核心文献的研究方法差异 -> 最后推演该主题的未来趋势。支持基于 SCQA、SWOT、PESTLE、六顶思考帽等经典思维框架的专属提示词模板输出诸如文献综述、研究趋势、技术框架、关键结论总结等深度内容。    -  incremental_synthesis_prompt :增量合成模板。在深度研究模式下,每探索完一个分支,模型动态更新并续写内存中的阶段性 Markdown 调研报告,并强制要求详尽的脚注溯源网络。

  1. 质量校验机制 (Quality Validation):强制模型在生成内容时维持高引用密度 (Citation density),例如每 100 字至少 1.5 个有效引用。

    • 自动执行时效性检查 (Recent sources check)**。
    • 强制在报告末尾生成局限性与冲突声明 (Limitations & Conflict disclosure)。
  2. 标准化报告输出:强制大模型按照专业学术格式输出:摘要 (Abstract)、目录 (ToC)、引言 (Intro)、主体 (Body)、研究方法 (Methodology)、局限性 (Limitations)、核心洞察 (Key Learnings) 和 参考文献 (References)。

  3. 核心 Resources 模块:提供 templates://frameworks/ 协议,允许大模型读取高质量的结构化模板范本(如 SCQA 汇报范本),将其作为先验知识纳入思考,确保输出风格与颗粒度的一致性。

4.3 系统协同工作流

当用户发起一个学术研究请求(如指定 depth=3 深度挖掘某领域应用瓶颈)时,三个 Server 将执行以下 Deep Research 闭环交互流:

  1. 意图解析与参数组装 :用户输入初步想法后,大模型调用提示词增强 Server 将模糊请求降维,拆解为精准的检索关键词组(如 {"query": "LLM medical diagnosis limitations", "limit": 10})。

  2. 并发检索与深度抓取:大模型拿着 JSON 参数调用 文献查询 Server 连接多源学术库执行查询。对于高价值目标,调用 scrape_and_parse_deep_content 工具直接解析全文。

  3. 阶段性增量合成与盲区评估:大模型结合提取内容,使用 推理 Server 生成阶段性综述。紧接着调用 策略 Serverevaluate_knowledge_gaps 评估盲区,判断信息是否充足。

  4. 递归向下钻取 (循环步骤2-3):若发现知识盲区,系统自动生成新 Query 并再次指挥 执行 Server 深入检索,同步利用 manage_exploration_state 防止死循环,直至达到预设深度限制。

  5. 最终统稿与双轨落盘:基于历次迭代记忆生成具备极高深度与广度的最终报告,调用 执行 Serversave_to_local_vault 工具统一转化为带 YAML Frontmatter 的 Markdown 格式,永久存入用户本地知识库。

5. 软件系统架构设计

5.1 系统拓扑架构

graph TB
    subgraph UserLayer ["用户层"]
        User[研究人员]
        Client[支持MCP的客户端<br/>Claude Desktop/Cursor/IDE]
    end

    subgraph ProtocolLayer ["MCP协议层"]
        MCP_Stdio[stdio 传输]
        MCP_SSE[SSE 传输]
    end

    subgraph ServerCluster ["MCP Server 集群"]
        direction TB
        S1["文献查询 MCP Server<br/>(执行者)"]
        S2["提示词策略 MCP Server<br/>(军师)"]
        S3["CoT多步推理 MCP Server<br/>(分析师)"]
    end

    subgraph Infrastructure ["外部基础设施"]
        DB[("学术数据库<br/>PubMed/arXiv/Scholar")]
        Web[("互联网资源<br/>PDF/HTML")]
        PKM[("本地知识库<br/>Obsidian/Logseq 目录")]
        Templates[("提示词模板库<br/>5W3H/SCQA/SWOT")]
    end

    User --> Client
    Client -- "stdio/SSE" --> MCP_Stdio
    Client -- "stdio/SSE" --> MCP_SSE

    MCP_Stdio --> S1
    MCP_Stdio --> S2
    MCP_Stdio --> S3

    MCP_SSE --> S1
    MCP_SSE --> S2
    MCP_SSE --> S3

    S1 -- "API/Web Crawl" --> DB
    S1 -- "HTTP/Fetch & 语义切块" --> Web
    S1 -- "File I/O (YAML/MD)" --> PKM

    S2 -- "File I/O" --> Templates

    S3 -- "引用与归档" --> PKM

    classDef client fill:#e1f5fe,stroke:#01579b;
    classDef server fill:#fff9c4,stroke:#fbc02d;
    classDef infra fill:#e0e0e0,stroke:#616161;

    class User,Client client;
    class S1,S2,S3 server;
    class DB,Web,PKM,Templates infra;

该架构图展示了从查询学术数据库到将结果存储在本地知识管理系统中的整个过程,各个组件通过不同的层级进行交互与数据流转。

  1. 用户层:表示研究人员与系统的交互。

    • 用户:发起研究的研究人员。
    • 客户端:支持 MCP 协议 的外部客户端,如 Claude DesktopCursor 或任何 IDE。
  2. MCP 协议层:数据传输的通信层。

    • MCP_Stdio:标准输入/输出传输协议。
    • MCP_SSE:服务器推送事件传输协议。
  3. MCP Server 集群:系统的核心逻辑组件。

    • S1文献查询 MCP Server:负责查询和处理文献。
    • S2提示词策略 MCP Server:负责生成研究提示词和策略。
    • S3CoT 多步推理 MCP Server执行多步链式推理CoT
  4. 外部基础设施:代表系统使用的外部资源。

    • DB:外部学术数据库,如 PubMedarXivGoogle Scholar
    • Web:网页资源,包括 PDFHTML 文件,用于网页抓取。
    • PKM:本地知识管理工具,如 ObsidianLogseq
    • Templates:用于提示词的模板库,如 5W3HSCQASWOT

5.2 拓扑协同数据流转闭环

下图基展示了在一次递归研究工作流中数据如何在用户、客户端、三个Server以及外部资源之间流转。该图详细描绘了“意图解析 -> 并发检索 -> 增量合成 -> 递归深挖 -> 最终落盘”的完整闭环。

sequenceDiagram
    autonumber
    actor User as 用户
    participant LLM as 大模型 / 客户端
    participant S2 as S2: 提示词策略 Server<br/>(军师/角色引擎)
    participant S1 as S1: 文献查询 Server<br/>(执行者/数据管家)
    participant S3 as S3: CoT多步推理 Server<br/>(分析师/质检员)
    participant Vault as 本地知识库<br/>(Obsidian/Logseq)

    User->>LLM: 输入研究主题<br/>(例: "LLM在医疗的瓶颈", Depth=2, Breadth=3)

    rect rgb(240, 248, 255)
    Note over LLM, S2: 阶段 1意图发散 (Breadth)
    LLM->>S2: 调用 `generate_serp_queries` 工具
    S2-->>LLM: 赋予"检索专家"角色,返回 3 个高精度初始 Query
    end

    loop 递归深挖阶段 (直至 Depth 达到设定值)
        rect rgb(245, 255, 250)
        Note over LLM, S1: 阶段 2物理抓取与语义切块
        LLM->>S1: 传递 Query调用 `search` 与 `fetch_and_split`
        S1-->>LLM: 返回包含文献元数据与长文本语义切块 (Chunks) 的 JSON
        end

        Note over LLM: 大模型切换至"洞察提取员"角色<br/>阅读数据切块,提取本轮的“已知洞察 (Learnings)”

        rect rgb(255, 250, 240)
        Note over LLM, S2: 阶段 3深度递归评估 (Depth Decision)
        LLM->>S2: 调用 `evaluate_research_depth`<br/>(传递当前 Learnings 与 Depth 状态)

        alt 尚未达到目标深度 (Depth > 0)
            S2-->>LLM: 结合当前 Learnings生成更刁钻的深层 Query<br/>(进入下一轮循环)
        else 已达到目标深度 (Depth = 0)
            S2-->>LLM: 发出指令:停止检索,准备报告合成
        end
        end
    end

    rect rgb(253, 245, 230)
    Note over LLM, S3: 阶段 4报告合成与质量校验
    LLM->>S3: 请求加载 `cot_literature_synthesis` (如 SCQA 框架)
    S3-->>LLM: 返回分析模板与质检规则 (引用密度、时效性检查)

    Note over LLM: 结合思维框架与历次提取的 Learnings<br/>执行 Chain of Thought 深度推理,撰写专业报告
    end

    rect rgb(245, 245, 245)
    Note over LLM, Vault: 阶段 5双轨制落盘与网络构建
    LLM->>S1: 调用 `save_to_local_vault`<br/>(传递报告 JSON 及相关文献数据)
    S1->>Vault: 转换为带 YAML Frontmatter 的 Markdown 写入本地
    Vault-->>S1: 文件写入成功
    S1-->>LLM: 落盘确认,返回本地双链地址
    end

    LLM-->>User: 呈现最终结构化研究报告及本地卡片链接
  1. 第 4-7 步Loop 循环体) 系统不再是“查一次就写报告”而是带着上一次查到的结论Learnings再去问更深的问题。
  2. 角色动态切换:大模型在同一个任务流中,通过 S2 军师的调度,完成了从“检索专家” -> “阅读提取员” -> “架构分析师”的华丽转身。
  3. 闭环落盘(第 13-16 步):强调了所有的分析并不是在聊天框里转瞬即逝,而是扎扎实实地沉淀到了 Obsidian 等本地知识库中,且附带了完美的 YAML 元数据。

5.3 个人知识管理 (PKM) 生态集成

本系统不仅仅是一个在线的研究工具,更致力于帮用户沉淀数据资产,构建属于自己的学术智库。通过 Markdown + YAML 的本地存储架构设计,系统实现了与主流 PKM 工具的深度集成:

  1. 无缝接入本地软件:生成的本地文件可以完美接入 Obsidian、Logseq、Zotero(结合特定插件)等主流个人知识管理软件。

  2. Obsidian 专属能力赋能:在广泛使用的 Obsidian 中,用户可以彻底盘活这些由系统生成的学术资产:

    • 索引与检索:利用 Obsidian 强大的全局搜索和标签功能,瞬间定位海量文献与历史分析报告。
    • 双向链接 (Bi-directional Linking):在文献与分析报告之间建立双向链接,发现跨学科、跨主题文献的隐藏关联。
  3. 知识图谱构建:通过不断积累检索文献与大模型生成的深度综述,逐步在本地构建出极具个人色彩且数据主权完全归属自己的学术知识图谱

6. 数据格式与标准

系统在数据流转与存储上采用“双轨制”数据标准,以分别满足系统级 API 交互与用户级本地存储索引的需求。JSON 适合系统底层的 API 交互、模型处理和结构化数据传输;而为本地文献建立 YAML Frontmatter 结合 Markdown 的格式,则是目前本地知识管理(如 Obsidian PKM 工具)的最佳实践,能够提升用户本地检索和二次编辑的体验。

6.1 JSON 数据标准

所有文献内容、检索参数和模型输出将统一采用SON 格式进行存储和传输,以保证数据的可扩展性和可解析性。以下是文献数据的 JSON 格式示例:

{  
	"title": "文献标题",  
    "authors": ["作者1", "作者2"],  
    "abstract": "文献摘要内容",  
    "link": "文献链接",  
    "publication_year": 2023,  
    "citation_count": 200,  
    "keywords": ["关键词1", "关键词2"],  
    "classification": "文献分类",  
    "language": "中文/英文/德语等",  
    "full_text_info": {  
	    "experiment_methods": "实验方法",  
        "results": "实验结果",  
        "charts_data": "图表数据"  
    },  
    "annotations": ["用户笔记1", "用户笔记2"], // 用户对文献的标注与笔记内容  
    "references": ["参考文献1", "参考文献2"]  // 相关参考文献  
}

6.2 YAML Frontmatter

为了在本地保存文献索引并进行便捷管理,文献将采用 YAML Frontmatter 格式进行存储。该格式将包含文献的基本信息、索引信息及附加元数据,便于本地管理和检索。当用户将文献导出、下载或同步至本地设备时,系统自动生成带有 YAML Frontmatter 的 Markdown.md)文件。

以下是文献的 YAML Frontmatter 示例:

---  
title: "文献标题"  
authors:  
	- "作者1"  
    - "作者2"  
abstract: "文献摘要内容"  
publication_year: 2023  
citation_count: 200  
keywords:  
    - "关键词1"  
    - "关键词2"  
classification: "文献分类"  
language: "中文/英文"  
document_id: "文献唯一标识符"  
version: "1.0"  
tags:  
    - "tag1"  
    - "tag2"  
references:  
    - "参考文献1"  
    - "参考文献2"  
annotations:  
    - "用户笔记1"  
    - "用户笔记2"  
links:  
    - url: "文献链接"  
    type: "PDF"  
    - url: "其他链接"  
    type: "DOI"  
---

` 这种格式作为本地文件系统的"静态元数据索引",不仅便于离线情况下的全局搜索(如使用 grep 或 Everything还能无缝接入 Obsidian、Logseq、Zotero结合插件等主流个人知识管理软件构建用户的本地学术文献知识库。

6.3 Obsidian 集成

Obsidian 是一个广泛使用的本地知识管理工具,它支持基于 Markdown 文件 的文档管理、索引和检索。在 Obsidian 中,您可以:

  • 索引与搜索:通过 Obsidian 的全局搜索和标签功能,快速查找文献和分析报告。
  • 双向链接:在 Obsidian 中可以创建文献之间的双向链接,便于用户发现相关文献和研究。
  • 知识网络:通过在文献中添加相关的链接和注释,逐步构建个人的学术知识图谱。

此数据存储架构设计为用户提供了一个完整的文献检索、分析、生成报告并存储到本地知识库(如 Obsidian的流程。通过将文献数据与分析结果以 Markdown 文件 的形式保存,确保了数据的灵活性、易于检索与可编辑性,同时结合 YAML Frontmatter 元数据使得文献管理更加高效。

7. 总结

本文档系统性地规划了一个面向未来的下一代学术研究辅助工具。系统打破了传统检索工具“单次提问-被动返回”的浅层模式,创新性地结合了 MCP (Model Context Protocol) 协议与多智能体协作理念,构建了职责分明的“三体微服务”(执行者、军师、分析师)解耦架构。帮助研究人员在海量信息中高效地提取洞察,并通过自动化的流程将研究成果转化为高质量的报告与本地知识资产,有助于提升研究效率和深度。


许可声明

本文档采用 知识共享署名--相同方式共享 4.0 国际许可协议 (CC BY--SA 4.0) 进行许可,© 2025-2026 Gitconomy Research.