最近一个项目中碰到个比较棘手的需求,单独分享一下。
我有一个老网站使用 ACF 上传了非常多的产品内容,其中不少内容有关键词出词且关键词的排名还不低。
现在出于网站升级的考量,想对这个老网站做一下全方位的升级,涉及到网站的技术栈替换更新、建站标准统一,以及整个网站内部链接布局。
其实这些需求点中,唯一有点棘手的就是这些产品内容的迁移。
因为过去使用的是 ACF 配合古腾堡编辑器,现在新的技术方案要求使用页面方式去布局,且使用高级版版本的 Elementor 编辑器。
另外过去那个网站的页面标准非常不统一,不是缺这个就是缺那个,所以就真的没办法用类似「模板导出」这样的方式去做了。
也是在本地实验了不少内容迁移方案之后,就觉得有点实在没办法了。
于是今天干脆用最笨的办法去重新做了,大体分为三个步骤,先是将老网站上的产品内容一个一个抓取下来,然后将这部分数据做成 Elementor 模板,最后上传这些内容模板并将内容恢复出来。
抓取这个步骤其实不难,可以直接让 AI 分析页面结构,并告诉 AI 我们想要哪些内容,最终便可以顺利将这部分内容全部抓取下来并保存到数据表格中。
这一步做完之后,原始数据便到手了,基本就成功一半了,剩下需要的是将这些数据渲染成新的页面了。
过程中我尝试使用了 WP All Importor 这个插件,但可能是我没有付费版本的缘故吧,做出来的效果依旧不是很好,所以最终还是继续使用代码的方案。
先设计出一个完善版的产品详情页面,然后将页面保存成模板并导出为 json 格式数据。
那有了这份模板数据之后,便可以使用脚本读取这份模板数据,然后将我们上一步抓取下来的产品数据,一一渲染进去并生成一个新的 json 模板。
那后续我们只需要上传这些 json 模板,导入一下便可以将产品内容恢复出来了。
但是这几天我在实操的过程中也碰到了一些基础问题,最麻烦的就是脏数据。
起初我的想法是人工审核,但是数据实在是太多了真的核不过来,于是便想着用 AI 去协助我处理这部分内容。
逻辑非常简单,直接将源数据喂给 AI,然后给 AI 模型一个数据处理的标准与内容输出的标准,让其严格按照我们要求的结构输出便可以了。
这个部分的处理,就涉及到我前几天分享的那个 AI 模型的结构化输出了,参考官方文档去做就好了。






