elasticsearch学习笔记（十一）——document的核心元数据、操作以及原理

发布时间：2026/7/5 15:30:40

先展示一个document数据结构GET /product/_doc/1 { _index : product, _type : _doc, _id : 1, _version : 1, _seq_no : 0, _primary_term : 1, found : true, _source : { name : gaolujie yagao, desc : gaoxiao meibai, price : 30, producer : gaolujie producer, tags : [ meibai, fangzhu ] } }下面我们就来开始分析了1、document的核心元数据1_index元数据1、_index代表一个document存放在哪个index中2、对于document类似的数据都是放在一个索引里面的非类似的数据放在不同的索引中。例如product_index是包含了所有商品的index,sales_index是包含了所有商品的销售数据的indexinventory_index是包含了所有库存相关的数据。如果想把所有的这些数据都放在一个索引中,比如创建一个company_index是不合适的。3、对于每个索引一般都是包含了很多类似的document类似是什么意思其实指的就是说这些document的fields很大一部分是相同的如果说你放了三个document,但是每个document的fields都完全不一样这就不是类似了就不太适合放到一个index里面去了。4、对于语法要求每个索引名称必须是小写的不能用下划线开头不能包含逗号。2_type元数据1、_type代表这个document属于index中的哪个类别type2、一个索引只能有一个type在后面的ES高版本中可能会废弃掉3、对于type的语法它可以是大写或是小写但是同时不能用下划线开头不能包含逗号3_id元数据1、_id代表document的唯一标识与index和type一起可以唯一标识和定位一个document2、我们可以手动指定document的id也可以不指定那ES就会自动为我们创建一个id下面附上中华石衫老师的手工图说明一下为什么不同类型的数据不用一个索引存放归纳一下就是如果把多个不同类型的数据放在一个索引中存储当用户查询某一类的数据的时候比如商品数据大量的请求过来发现此时后台数据分析系统对这个索引下的另一类数据在做聚合分析比如销售数据此时这些shard正在执行非常耗时耗费资源的大型的聚合分析操作。就会导致document get请求大量的性能不好甚至超时。让用户感觉上来说网速好慢影响用户体验。2、document id的生成1手动指定document id1、手动指定document id时需要看下是否满足前提条件一般来说是从某些其他的系统中导入一些数据到es时会采取这种方式就是使用系统中已有数据的唯一标识作为es中的document id。举个例子假如我们现在在开发一个电商网站做搜索功能或者是OA系统做员工的检索功能。这个时候数据首先会在网站系统或者IT系统内部的数据库中会先有一份此时肯定就会有一个数据库的primary id(自增长UUID或者是业务编号)如果将数据导入到ES中此时就比较适合采用数据在数据库中的已有primary key。2、格式PUT /{index}/{type}/{id}2自动生成document id在什么情况下使用自动的document id。对于日志的搜集使用自动的document id是比较适合的。还有就是比如我们是在做一个系统这个系统主要的数据存储就是es一种也就是说数据产生出来以后可能就没有id直接就放ES存储那么这个时候可能就不太适合说手动指定document id的形式了。格式POST /{index}/{type}注自动生成的id长度为20个字符URL安全base64编码GUID,分布式系统并行生成时不可能会发生冲突3、_source元数据以及定制返回结果1_source元数据先用一个例子引出一个document的_source以及它的结构GET /product/_doc/1 { _index : product, _type : _doc, _id : 1, _version : 1, _seq_no : 0, _primary_term : 1, found : true, _source : { name : gaolujie yagao, desc : gaoxiao meibai, price : 30, producer : gaolujie producer, tags : [ meibai, fangzhu ] } }可以看出_source元数据就是说我们在创建一个document的时候使用的那个放在request body请求体中的json串。2定制返回结果指定_source参数返回哪些field即可GET /product/_doc/1?_sourcename,desc,tags { _index : product, _type : _doc, _id : 1, _version : 1, _seq_no : 0, _primary_term : 1, found : true, _source : { name : gaolujie yagao, desc : gaoxiao meibai, tags : [ meibai, fangzhu ] } }4、document的全量替换、强制创建以及lazy delete机制1document的全量替换1、全量替换的语法和创建文档是一样的如果document id不存在那么就是创建如果document id已经存在那么就是全量替换操作替换document的json串内容2、document是不可变的如果要修改document的内容第一种方式就是全量替换直接对document重新建立索引替换里面所有的内容3、ES会将老的document标记为deleted然后新增我们给定的一个document当我们创建越来越多的document的时候es会在适当的时机在后台自动删除标记为deleted的document2document强制创建创建文档和全量替换的语法是一样的但是有时我们想新建文档不想替换文档格式PUT /{index}/{type}/{id}?op_typecreate3document的删除格式DELETE /{index}/{type}/{id}注意删除并不是物理删除只是会将文档标记为deleted当数据越来越多的时候会在后台自动删除

题解：洛谷 B4499 [GESP202603 三级] 二进制回文串

【题目来源】洛谷：B4499 [GESP202603 三级] 二进制回文串 - 洛谷【题目描述】对于一个正整数 n n n，我们将其转换为不含前导零的二进制表示，如果这个二进制序列从左向右读与从右向左读完全相同，则称该数为二进制回文数。例如， 9 9 9 的二进制表示为 ( 1001 ) 2 (

2026/7/5 15:30:40 阅读更多

【Java从入门到入土】46：设计模式：写出优雅代码的套路

【Java从入门到入土】46：设计模式：写出优雅代码的套路写代码写到一定阶段，你会发现有些问题总是反复出现。比如需要保证一个类只有一个实例、需要根据条件创建不同对象、需要在不修改原有代码的情况下扩展功能……这些问题的解决方案&#x…

2026/7/5 15:30:20 阅读更多

elasticsearch学习笔记（十三）——Elasticsearch乐观锁并发控制实战

1、elasticsearch基于_version（新版本更新为if_seq_no和if_primary_term）进行乐观锁的并发控制 （1）先构造一条数据 PUT /test_index/_doc/1 {"test_field":"test test" } （2）模拟两…

2026/7/5 15:30:20 阅读更多

从0到1开发：使用Material Dashboard Lite构建企业级仪表盘

从0到1开发：使用Material Dashboard Lite构建企业级仪表盘【免费下载链接】material-dashboard-lite A free dashboard template with material design lite 项目地址: https://gitcode.com/gh_mirrors/ma/material-dashboard-lite 想要快速构建专业的企业级…

2026/7/5 16:51:16 阅读更多

Runno实战：构建在线代码评测系统的完整教程

Runno实战：构建在线代码评测系统的完整教程【免费下载链接】runno Sandboxed runtime for programming languages and WASI binaries. Works in the browser, on your server, or via MCP. 项目地址: https://gitcode.com/gh_mirrors/ru/runno Runno是一个强…

2026/7/5 16:51:16 阅读更多

GDash核心功能解析：从YAML配置到自定义图表，打造专属监控系统

GDash核心功能解析：从YAML配置到自定义图表，打造专属监控系统【免费下载链接】gdash A dashboard for Graphite 项目地址: https://gitcode.com/gh_mirrors/gd/gdash Graphite作为企业级监控系统中的重要组件，如何高效地展示其数据一…

2026/7/5 16:51:16 阅读更多

Perlite高级配置：自定义主题与样式完全指南

Perlite高级配置：自定义主题与样式完全指南【免费下载链接】Perlite A web-based markdown viewer optimized for Obsidian 项目地址: https://gitcode.com/GitHub_Trending/pe/Perlite Perlite是一个基于Web的Markdown查看器，专为Obsidian笔记优…

2026/7/5 16:50:56 阅读更多

Cargo-script 的未来发展：Rust 脚本生态系统的前景展望

Cargo-script 的未来发展：Rust 脚本生态系统的前景展望【免费下载链接】cargo-script Cargo script subcommand 项目地址: https://gitcode.com/gh_mirrors/ca/cargo-script cargo-script 作为一款让开发者快速运行 Rust 脚本的 Cargo 子命令，正…

2026/7/5 16:50:56 阅读更多

GetQzonehistory：三步快速导出QQ空间完整历史记录的免费工具

GetQzonehistory：三步快速导出QQ空间完整历史记录的免费工具【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否还记得那些年在QQ空间留下的青春印记？从第一条…

2026/7/5 16:50:36 阅读更多

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾为Windows右键菜单中那些…

2026/7/5 0:00:07 阅读更多

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述：从GitHub Trending看安全实战最近在GitHub Trending上看到一个项目，叫 skills4/skills ，它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景：一个旨在展示或教授某种技能的仓库，本身却成了安…

2026/7/5 0:01:07 阅读更多

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示：因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战：从“黑箱预测”到“可信推理”2026年6月，第7届机器学习与趋势国际会议（MLT 2026）将在悉尼召开。会议议程中，“因果与可解释机器学习…

2026/7/5 0:01:08 阅读更多

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

2026/7/5 0:00:07 阅读更多

从GitHub安全案例解析常见漏洞与防护实践

2026/7/5 0:01:07 阅读更多

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

2026/7/5 0:01:08 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/5 0:18:44 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/5 0:22:11 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/5 0:22:19 阅读更多

相关文章

题解：洛谷 B4499 [GESP202603 三级] 二进制回文串

【Java从入门到入土】46：设计模式：写出优雅代码的套路

elasticsearch学习笔记（十三）——Elasticsearch乐观锁并发控制实战

从0到1开发：使用Material Dashboard Lite构建企业级仪表盘

Runno实战：构建在线代码评测系统的完整教程

GDash核心功能解析：从YAML配置到自定义图表，打造专属监控系统

Perlite高级配置：自定义主题与样式完全指南

Cargo-script 的未来发展：Rust 脚本生态系统的前景展望

GetQzonehistory：三步快速导出QQ空间完整历史记录的免费工具

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

FAE放射组学分析工具：医学影像特征探索的完整解决方案

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南