一篇文章如何入库的

发布时间：2026/6/25 14:07:04

从文章里抽实体人、公司、地点、产品、时间…抽实体之间的关系A 工作于 B、C 位于 D、E 认识 F…生成节点关系Node Relationship批量写入 Neo4jCREATE / MERGE最终在 Neo4j 里形成一张知识图谱RAG 检索时就可以沿着关系查上下文。我们用一段超短新闻做演示张三在2023年加入了字节跳动担任算法工程师。李四是张三的同事他们都在北京工作。以上的超短新闻要想配合入图数据库首先是需要抽象出以下信息。实体Nodes张三 (Person)李四 (Person)字节跳动 (Company)北京 (Location)关系Relationships张三 ——WORKS_AT—— 字节跳动张三 ——COLLEAGUE_OF—— 李四张三 ——WORKS_IN—— 北京李四 ——WORKS_IN—— 北京属性张三ageNone, job算法工程师, join_year2023实体关系属性信息都确认了之后就可以通过以下语句入库了。// 创建节点 MERGE (p1:Person {name:张三}) SET p1.job算法工程师, p1.join_year2023 MERGE (p2:Person {name:李四}) MERGE (c:Company {name:字节跳动}) MERGE (l:Location {name:北京}) // 创建关系 MERGE (p1)-[:WORKS_AT]-(c) MERGE (p1)-[:COLLEAGUE_OF]-(p2) MERGE (p1)-[:WORKS_IN]-(l) MERGE (p2)-[:WORKS_IN]-(l)为什么用 MERGE 不用 CREATECREATE重复执行会重复创建节点MERGE不存在则创建存在则更新 →Graph RAG 标准写法那么如何把文章里的信息是如何抽象出的实体和关系呢直接说过程文章不是人工转的是 LLM 自动转的下面是真实工程化流程首先给大模型的提示词你是知识图谱抽取专家。请从文本中抽取 1. 实体类型Person, Company, Location, Organization 2. 关系只能用WORKS_AT, COLLEAGUE_OF, WORKS_IN, FOUNDER_OF 输出格式严格JSON { nodes: [{label:Person, name:张三, attributes:{job:算法工程师}}], relations: [{from:张三, to:字节跳动, type:WORKS_AT}] } 文本张三在2023年加入了字节跳动担任算法工程师。李四是张三的同事他们都在北京工作。以上提示词可以放在任何工具里测试包括龙虾豆包等。实体和关系总结出来了可以看到结果如下{ nodes: [ {label:Person,name:张三,attributes:{job:算法工程师,join_year:2023}}, {label:Person,name:李四,attributes:{}}, {label:Company,name:字节跳动,attributes:{}}, {label:Location,name:北京,attributes:{}} ], relations: [ {from:张三,to:字节跳动,type:WORKS_AT}, {from:张三,to:李四,type:COLLEAGUE_OF}, {from:张三,to:北京,type:WORKS_IN}, {from:李四,to:北京,type:WORKS_IN} ] }注如果模型是在线API那么基本上都能按照要求做出指定的输出如果是本地部署的模型参数量比较低的话输出可能会走样。最后通过python代码自动把 JSON 转成 Cypher 写入 Neo4jfrom neo4j import GraphDatabase # 连接 Neo4j uri bolt://localhost:7687 user neo4j password your-password driver GraphDatabase.driver(uri, auth(user, password)) # 从LLM拿到的知识图谱数据 data { ...上面的JSON... } # 写入节点 for node in data[nodes]: if node[attributes]: attrs , .join([f{k}: {v} for k, v in node[attributes].items()]) cypher fMERGE (n:{node[label]} {{name:{node[name]}, {attrs}}}) else: cypher fMERGE (n:{node[label]} {{name:{node[name]}}}) driver.session().run(cypher) # 写入关系 for rel in data[relations]: cypher f MATCH (a {{name:{rel[from]}}}), (b {{name:{rel[to]}}}) MERGE (a)-[:{rel[type]}]-(b) driver.session().run(cypher)✅运行完一篇文章就变成知识图谱了最终效果Neo4j 里看到的图你会看到张三、李四、字节跳动、北京它们之间用箭头连起来Graph RAG 检索时就能沿着关系推理最后再说一种更简单粗暴的方法跳过大模型生成JSON和python的JSON遍历直接让大模型生成语句。

3分钟快速配置：基于YOLOv5的智能象棋AI辅助系统终极指南

3分钟快速配置：基于YOLOv5的智能象棋AI辅助系统终极指南【免费下载链接】VinXiangQi Xiangqi syncing tool based on Yolov5 / 基于Yolov5的中国象棋连线工具项目地址: https://gitcode.com/gh_mirrors/vi/VinXiangQi 你是否还在为手动输入象棋棋局而烦恼&…

2026/6/25 14:06:43 阅读更多

5步掌握iOS激活锁绕过：applera1n完整实践指南

5步掌握iOS激活锁绕过：applera1n完整实践指南【免费下载链接】applera1n icloud bypass for ios 15-16 项目地址: https://gitcode.com/gh_mirrors/ap/applera1n 对于iOS设备用户而言，激活锁（Activation Lock）是一项重要的…

2026/6/25 14:06:43 阅读更多

先引入一个简单的例子，给定一个 4 个节点 4 条边的有向带权图：

1 2 1 1 3 1 2 4 1 3 4 0设节点 1 为起点，节点 4 为终点。每条边都有对应的转移概率，节点 1 转移至节点 2 与节点 3 的概率均为 0.5，节点 2 与节点 3 转移至终点 4 的概率均为 1。问题要求解从起点 1 到达终点 4 的期望距离。先给出正确的解法…

2026/6/25 14:06:22 阅读更多

GAES大模型评估实战：用量化指标替代主观判断

1. 项目概述：当“看起来没问题”不再是一句免责台词你有没有过这样的经历：把一个精心调教的LLM提示词交给产品经理，对方扫了一眼回复，点点头说“Looks good to me”，然后上线——结果三天后客服后台炸了，…

2026/6/25 18:42:59 阅读更多

从数据手册到代码：MCU 外设驱动开发指南

写驱动的本质是翻译——把芯片数据手册里的时序图和寄存器表，翻译成 C 代码。虽然每颗芯片不一样，但翻译的套路是固定的。下面用这个工程里实际跑过的 SPI/I2C 驱动为例，把框架讲清楚。一、驱动到底长什么样？先看骨架不管什么芯片，一个完整的驱动就六个部分：驱动 = …

2026/6/25 18:42:59 阅读更多

【2013-10-29】Android应用开发笔记：获取天气信息

[历史归档] 本文原发布于 cstriker1407.info 个人博客，内容为历史存档，仅供参考。发布时间： 2013-10-29　｜　标题：Android应用开发笔记：获取天气信息　｜　分类： 编程 / android　&a…

2026/6/25 18:42:39 阅读更多

计算机毕业设计之基于SSM的大学生兴趣组管理系统

系统根据现有的管理模块进行开发和扩展，采用面向对象的开发的思想和结构化的开发方法对大学生兴趣组管理的现状进行系统调查。采用结构化的分析设计，该方法要求结合一定的图表，在模块化的基础上进行系统的开发工作。在设计中采用“自下而上”…

2026/6/25 18:41:57 阅读更多

【原创保姆级】OpenAI Codex 全平台安装配置教程（Windows/Mac）避坑完整版

碳酸狗AI 前言最近很多开发者、编程学习者想要部署 OpenAI Codex 代码智能生成工具，用于代码补全、自动写脚本、程序调试、批量代码生成等场景。网上大部分教程老旧、步骤残缺、报错不解决、平台适配不全。本篇为原创整理最新完整版教程，适配 Windo…

2026/6/25 18:41:36 阅读更多

如何快速打造你的专属虚拟桌面伴侣：Mate Engine免费开源指南

如何快速打造你的专属虚拟桌面伴侣：Mate Engine免费开源指南【免费下载链接】Mate-Engine A free Desktop Mate alternative with a lightweight interface and custom VRM support, though with more features. 项目地址: https://gitcode.com/gh_mirrors/ma/Ma…

2026/6/25 18:41:16 阅读更多

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

上半年跳槽，面了十几家公司。说句实话，不是能力不行，是面试现场太容易崩了。明明准备了一周，面试官换个问法脑子就一片白。面完之后那个懊悔——其实我会的。后来开始试市面上的AI面试辅助工具。前前后后装了5款，踩…

2026/6/25 11:52:18 阅读更多

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

MONKEYCODE 教程系列 MonkeyCode教程及推广系列 MC-037 自定义 Skill 开发：创建你的AI能力模块 >官网链接注册更放心哦https://monkeycode-ai.com/?ic019e0aed-c823-783c-b08a-4f030f891e4e 系列: 不爱土豆唯爱马铃薯 MonkeyCode 教程系列字数: 约 1400 字…

2026/6/25 11:52:18 阅读更多

PEER模型：多模型协作范式的工程化实践指南

1. 项目概述：这不是又一个大模型，而是一次协作范式的重构 “META’s PEER: A Collaborative Language Model”这个标题里藏着一个被多数人忽略的关键词—— Collaborative （协作）。它不是在说“模型更大了”“参数更多了”“训练…

2026/6/25 11:54:48 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/25 1:04:34 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/25 1:04:45 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/25 1:04:41 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/25 12:27:19 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/25 12:27:19 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/25 12:27:19 阅读更多

相关文章

3分钟快速配置：基于YOLOv5的智能象棋AI辅助系统终极指南

5步掌握iOS激活锁绕过：applera1n完整实践指南

先引入一个简单的例子，给定一个 4 个节点 4 条边的有向带权图：

GAES大模型评估实战：用量化指标替代主观判断

从数据手册到代码：MCU 外设驱动开发指南

【2013-10-29】Android应用开发笔记：获取天气信息

计算机毕业设计之基于SSM的大学生兴趣组管理系统

【原创保姆级】OpenAI Codex 全平台安装配置教程（Windows/Mac）避坑完整版

如何快速打造你的专属虚拟桌面伴侣：Mate Engine免费开源指南

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

PEER模型：多模型协作范式的工程化实践指南

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因