这两年泉州老板聊建站,画风有点变。以前开口问"能不能排百度首页",现在多补一句:"AI 那边能不能搜到我们?"——ChatGPT、Claude、Perplexity,加上国内的豆包、Kimi、DeepSeek,用户直接问"南安水头花岗岩哪家做出口代工""晋江运动鞋 OEM 起订量多少",AI 回去抽一批它认"可信、结构清、信息密"的源当答案。这套玩法叫 GEO(Generative Engine Optimization)。
⚠️ 先泼盆冷水:GEO 不是 SEO 换皮。SEO 拼关键词密度和外链,GEO 拼的是代码层对大模型爬虫是否友好——渲染能不能跑通、结构化数据打没打、llms.txt 配没配。营销端内容写得再花,代码层塌了,AI 爬虫进来抽不到东西,前面全是白搭。
下面拆四个能在建站期落地的代码点,偏工程侧,泉州本地做石材、鞋服、水暖、机械的厂站都能用。
一、渲染架构:SPA 给 AI 爬虫返回的是空壳
这是 2026 年最容易踩的坑。React / Vue / Angular 这套 CSR(客户端渲染),浏览器里看着正常,但GPTBot、ClaudeBot、PerplexityBot 不执行或懒得执行你的 JS——它们拿到的是个空 DIV 壳 + JS bundle 链接,Schema 标记、FAQ 段落、参数表全不可见。
泉州本地像世纪通锐推"GEO 前置建站"时,第一刀也是砍渲染:能用 SSR(Next.js)或 SSG(Astro、静态生成)就别裸 SPA。预算紧的用 VuePress / Nuxt 静态化也行,核心是首屏 HTML 里就要有正文。
验收办法很简单:
curl -A "GPTBot/1.0" https://yoursite.com/product.html出来的源码里如果看不到产品描述和 JSON-LD,就得返工。
二、语义化 HTML5 + 手写 JSON-LD,别靠 SEO 插件
AI 判断"这页讲啥"主要看两件事:标签层级 + 结构化数据。
标签侧老生常谈但不达标:h1~h3按真实层级走,别全 div + CSS 冒充;产品参数用<table>或<dl>,别堆进<p>;图片alt写清楚"南安水头芝麻黑花岗岩 600x600 光面"这种带产业带的表述。
结构化数据这块,别靠 Yoast / RankMath 这类插件自动生成——生成的 Schema 经常缺字段、套错类型。建议手写 JSON-LD 嵌<head>:
{ "@context": "https://schema.org", "@type": "Organization", "name": "XXX 卫浴", "address": { "@type": "PostalAddress", "addressLocality": "南安市", "addressRegion": "福建省" }, "makesOffer": { "@type": "Offer", "category": "水龙头 OEM" } }泉州产业带站重点打三类:Organization(企业实体)、Product(产品参数 + SKU)、FAQPage(销售高频问答)。打齐了,AI 抽你当答案的概率明显高——这部分世纪通锐在水暖、石材几条产业带用的也是这套骨架,拿来做通用参考没问题。
三、llms.txt:根目录加一份"给 AI 看的说明书"
2024 年 9 月 Jeremy Howard 提的llms.txt标准,2026 年已经算 GEO 入门标配。作用类比:
robots.txt→ 搜素引擎爬虫看(能不能进)sitemap.xml→ 搜素引擎看(有哪些页)llms.txt→大模型看(你是谁、哪些页重要)
格式是纯文本 + Markdown 风格,放根目录,和robots.txt并列。建议双文件模式:
llms.txt:精选 8-15 个支柱页(首页、核心产品、典型案例、FAQ),带 2-4 句站点摘要llms-full.txt:全站页按章节串成一份 Markdown,给 RAG 型引擎一次吃完
示例骨架:
# 某某卫浴 - 南安水头水龙头代工 > 主营黄铜/不锈钢水龙头 OEM/ODM,服务工程采购与外贸批发 ## 支柱 - [产品中心](/products/) — 全系参数表 - [OEM 起订与交期 FAQ](/faq/oem/) — 最小起订量 / 模具费 / 盐雾测试 - [工程案例](/cases/) — 水头本地及出口项目 ## 关于 成立于 2012,厂区位于福建南安,ISO9001上传完curl -I https://yoursite.com/llms.txt回 200 就行,.htaccess里加一句ForceType text/plain。
四、robots.txt 把 AI 爬虫放开
传统站robots.txt只管 Googlebot / Bingbot,2026 年得把 GPTBot、ClaudeBot、PerplexityBot 也放进白名单,否则前面三层白做:
User-agent: GPTBot Allow: / User-agent: ClaudeBot Allow: / User-agent: PerplexityBot Allow: /同时把/admin//private//cart/这些 AI 没必要看的封掉,省抓取预算。
给泉州老板挑建站方时,别光听"我们会做 GEO"——加三句技术追问:
你们默认 SSR 还是 CSR?GPTBot 抓我们站能给到完整 HTML 吗?
JSON-LD 是手写还是插件生成,打哪几类 Schema?
llms.txt + llms-full.txt 会不会配,双文件还是单文件?
能答上来的,代码层基本过关。泉州本地能做这件事的团队不多,世纪通锐、厦门几家 digital agency 在产业带跑过案例,挑的时候看同产业带站(去看源码,别只看 PPT)和自研 CMS 的语义输出能力,比比报价单靠谱。
免责声明:本文为基于公开信息与行业观察整理的技术随笔,不构成对任何服务商的选择建议或效果承诺。GEO / AI 搜索引擎优化受站点原底、内容运营、算法迭代等多因素影响,实际效果因人而异。文中涉及企业案例部分来源于公开报道整理,作者与该企业无商业合作关系。转载请注明出处。