作者:Léa Pétralie,CyberCité 内容营销中心 Black Pepper 负责人。
看来大脑要么是“文学的”,要么是“数学的”。但在 SEO 中,要想做得很好,你必须介于两者之间,完美混合。是的,但是你看,我有文学头脑。 8×7 仍然给我带来创伤。于是,我练习了 内容营销 遵循一个信念:要在网络上执行,语义优先。在语义学中,重要的不是出现的次数,而是其背后的含义。词语、符号、语言的含义。 意思是服务意图。 这对我来说很有意义。
当 GEO 介入讨论,然后将其强加于我们的专业领域时,我们被告知了分块(chunking),向量嵌入 和重叠。突然间,各机构向客户收取“GEO 友好”内容的两倍费用。我回避滥用商业行为,但最重要的是回避我不相信的概念。
但我错了。
为了让您的品牌出现在对话式搜索引擎中,您现在必须考虑“分块策略”。一位作家解释了原因。
分块,分解内容的艺术。
啊,营销及其英语!确实,从纸面上看,“chunk”听起来比“piece”好得多。更有趣、更专业、更神秘。然而,在营销中,分块只是一个事实 将内容划分为自治块。 “就在发明段落的边缘。”这是我一度对自己说的话,永远的怀疑论者。
但在 数码城,你不可能错太久。当您每天与 130 名搜索专家和创意提示工程师一起工作时,这就是优势。我观察、交流、测试、聆听我们的会议(你也应该这样做),不可思议的事情发生了:我开始改变主意。
如果内容分块背后有意义怎么办?
因此,分块包括将内容分解成片段,即著名的“块”。的 自给自足的部分,即使与文本的其余部分隔离,也可以完全理解。这就是内容的表现变得非常有趣的地方。
帮助法学硕士恢复您的内容。
事实上,我们并没有等到生成式人工智能的到来才谈论“分块”。该术语已被用于认知心理学,用来描述人脑在面对信息超载时的机制。这 心理简化策略 包括将几条信息翻译成智力上可用的格式(编码),以促进记忆。
如果告诉你“1939-1945”,你的大脑已经在这两个日期背后浓缩了整个第二次世界大战的历史。这个心理捷径是一大块。
这就是法学硕士(例如 ChatGPT、Gemini & co.)从网络提取数据时的工作方式。在响应查询时,大多数人工智能模型不会检索整个页面,而是检索语义上最接近用户提示的片段。
法学硕士对文本进行矢量化(它们自己的编码形式):它们将单词转换为一系列数字,以便更轻松地存储 信息单位 (“ 嵌入 ”)并计算每个之间的语义和上下文接近度。
我告诉过你,要优秀 搜索引擎优化,你必须擅长数学和字母。但我们稍后会再讨论这个问题。
一个好的块的理想大小是多少?
“你不和我谈论单词的长度。”我一直拒绝将特定的口径与内容联系起来;你的附加值不是用字符的数量来衡量的。内容必须包含它所涵盖的主题应有的单词数量。
但对于分块来说,大小很重要。
为了避免信息过载并且不进行多重上下文分析,法学硕士倾向于 简短而结构化的片段。他们使用滑动窗口注意力(AFG);他们仅对一组单词进行上下文分析,然后再进行下一组单词,以节省时间和效率。因此,今天对您来说重要的不是内容的长度,而是内容的长度 块 组成它。
推荐尺寸 块 有效字数在 150 到 300 字之间 (或 200 到 400 之间 代币 对于人工智能原生者)。
如何调整您的内容营销策略以适应分块?
有多种方法可以执行分块策略,并且它们并不是不兼容的。今天实施以下两个简单的方法以最大化 潜在的可引用性 您的内容的潜力 – CyberCité 帮助您监控的潜力。
- 这 基于大小的分块 :该策略包括将内容分为几个部分 受控尺寸单位 在同一页面内。常见问题解答、项目符号列表、“要记住”段落甚至 TL;博士(太长了,没看完),简短定义:您的页面模板是 符合 GEO 标准,内容的结构突出了不同的部分,使法学硕士可以轻松检索它们。
- 这 页级分块 :这次策略在您的网站级别运行。一个页面可以被视为一个单独的块。例如,术语表中心页面可以根据定义链接到页面。这种技术是主题集群的延续,主题茧在当今的 SEO 中效果很好。
语义优化:如果我们削减,我们会变得更穷吗?
你必须问这个恼人的问题。如果您分解现有内容来制作它 GEO 就绪,你不会失去在传统搜索引擎中定位所必需的语义相关性吗?
答案是否定的,只要工作做得好。
必须理解的是, 变形金刚 LLM(GPT 中著名的 T)确实有一个 对文本的语义理解。通过将单词转换为数字向量,他们能够分析每个单词之间的相互关系,从而分析句子和段落的含义。
考虑以下矢量化示例:
- “猫”:(0.2,-0.5,0.8,0.1,…)
- “狗”:(0.3,-0.4,0.7,0.2,…)
- 这两个词之间的语义距离很小:它们属于同一个宇宙。
优化您的内容 在分块的逻辑中,不包括删除而是重塑。段落的划分是主题的核心:返回行不再仅由您的常识或编辑的文学敏感性驱动,而是由算法逻辑驱动。这 语义组块 依赖于主题突破:由于主题的滑动或语义重叠而检测到想法的变化 代币,正如法学硕士所认为的。
你不会让你的内容变得贫乏;你丰富了他们的语义层次结构。
从语义场到真理块。
我错了。分块不仅仅是数字营销术语中的另一个流行词。它甚至引发了我们之前对内容的处理方式的改变。虽然注意力集中在页面内语义场的淡化上,但我们还是回到了本质:信息整理 在自主、可靠、可验证和明确的片段中。真相块:您的专业知识、您的市场和您的品牌的真相。谷歌没有警告我们吗?好的内容首先是有用的内容,能够清晰准确地回应用户真正关心的问题。