导读:Google于 2011 年宣布,自2001年首次开始为 PDF 文件编制索引,已索引了数亿个PDF 文件。截止目前PDF文件不仅可以被谷歌抓取、索引,还可以参与排名,并因其很好的兼容性和一致性,被广泛应用于政府、学术界及商业环境。本篇文章我们将研究PDF谷歌SEO相关知识并如何使PDF更加SEO友好。
目录:
一、PDF可以参与谷歌排名吗?
目前PDF文件谷歌可以抓取、索引和排名,他们在搜索引擎结果中带有自己标签(PDF),以提醒用户结果是基于PDF的。
一些PDF甚至可以获得了谷歌精选摘要Featured Snippets,排名谷歌自然排名第一位。
二、谷歌如何看待PDF
一)谷歌可以索引任何PDF文件吗
通常谷歌可以从使用各种字符编码的 PDF 文件中索引文本内容(以任何语言编写),前提是它们没有密码保护或加密。如果文本嵌入为图像,谷歌可以使用OCR算法处理图像以提取文本,PDF中的图像也会被收录在谷歌图片搜索结果中。
官方表示,一般的经验法则是,如果您可以将 PDF 文档中的文本复制并粘贴到标准文本文档中,谷歌应该能够索引该文本。
二)如何看待PDF SEO
尽管 Google 索引并会对 PDF 进行排名,但该格式与网页相比会存在一些缺点:
正因为如此,正常我们新增网站内容时一般建议是页面形式而不是PDF文档。
三、什么时候适用PDF?
尽管说PDF会存在一些缺陷,但是以下情况使用PDF会更加的友好
电子书通常有插图、信息图表和指南。
2. 离线内容
如果您的内容可以从离线选项中受益,那么 PDF 是首选途径。这也适用于信息量大的博客文章。但需要注意,避免网站存在相同内容的文章,以避免因内容重复而受到处罚。
3. 规范文件
PDF 通常格式繁重,并带有大量图像和插图,是规范文档的理想格式。
鉴于规范文档的打印频率,PDF可确保每个人都以相同的方式查看您的文档。
4. 白皮书
PDF通常比大多数在线内容要长,适合制作白皮书。考虑到人们在白皮书上做笔记的频率,最好提供可打印的选项。
友情提醒:
1)您要确保您的 PDF 包含指向您网站其余部分的链接。否则,没有链接交互的PDF将影响您的点击率 (CTR),这可能会影响您的排名,因为算法会考虑用户在您的网站上花费了多少时间以及浏览了多少。
2) 下载 PDF 的选项也是获取访问者联系信息的绝佳机会。只需提供 PDF 下载以换取他们的姓名、电子邮件等
四、如何使您的PDF对SEO友好
PDF SEO规范与HTML SEO规则基本相同,大部分HTML的on-page SEO同样适用于PDF。而且一些时候PDF文档效果会更佳,所以我们需要针对PDF做出SEO优化,以使其更加的谷歌友好,以便获取收录和排名。相关建议如下:
一)创造精彩的内容
不论页面格式如何,谷歌都偏向于良好的内容质量,这也就是为什么技术文档、白皮书等内容丰富的PDF经常会出现在谷歌SERP首页。
二)使用关键词丰富的文件名
我们很多时候会忽略PDF文件名,须不知有时谷歌会直接拿文件名作为PDF搜索结果的展示Title。所以我们需要认真对待PDF文件名.
三)添加优化标题Title
就像网页有标题标签一样,PDF 也有标题。请注意,许多搜索引擎使用标题来描述其搜索结果中的文档。如果 PDF 没有标题,则文件名会出现在SERP中 。针对PDF Title优化,具体建议如下:
请注意,每个 PDF 中使用唯一的标题标签,避免PDF标题重复
四)添加优化描述Description
PDF的描述和页面的描述一样,会出现在SERP中的描述部分。针对PDF Description请参照以下建议:·
五)添加Heading标签
PDF 同样可以添加H1,H2,H3等标签,并且作用相同。所以如果可以建议每个PDF文档中使用H标签。
以下是PDF Heading标签的优化建议:
六)内部链接
和任何页面一样,内部和外部链接也会影响排名,链接之间可以传递权重。所以通过给您的 PDF文档增加链接和您的PDF文档中包含指向其他页面的链接(PDF或html),会使得整个网站链接都在相互传递权重,而不是一个个孤岛。实际上很多PDF获得了很好的引用和链接指向,但如果PDF没有指向其他的页面链接,这时就会很浪费。
PDF链接指向时建议使用锚文本,以提供相关的语境,您的锚文本应该是:
七)让您的 PDF 适合移动设备
越来越多的人使用移动设备,所以针对PDF请注重移动设备的优化。因此,请按照以下步骤操作:
八)其他PDF SEO友好建议
1. 使用更少的字体和较少的字体样式
2. 优化 PDF 图像
如果您希望自己的 PDF 被索引,请确保它的文本多于图像
3. 图片alt属性
爬虫无法识别图片内容,另同时避免图片未加载时的无法理解,请使用alt标签优化图片。其中alt标签建议如下:
五、如何跟踪 PDF效果
前面说过PDF很难进行追踪,所以很多企业会设置下载选项或者表单提交的形式下载PDF,以此获取潜在客户。但是,我们还是会有一些可追踪您PDF情况的方法,包括:
1,下载链接&事件追踪
您可以查看PDF链接点击、下载及表单提交时的数据,以便了解用户点击PDF、文件下载和表单提交时的次数。
追踪方式:GTM事件追踪或GA中的Event Measurement
2,服务器日志
任何文件都会存储在服务器上,PDF文档也不例外,因此您可以通过服务器LOG日志去了解PDF的文档访问情况
3,第三方工具
在数据分析工具中PDF数据很少能被追踪和统计,但借助于第三方工具可以查看PDF文档的流量数据情况,及分析出网站中Top的PDF文档。一般可追踪的工具有:Google search console,SEMRUSH和Ahref。
下面是Semrush查询google内容中PDF文档相关数据截图:
结束语: 通常情况,我们更加建议您使用网页而非PDF,以获得更加友好的用户体验。但针对PDF效果较佳的情况,如白皮书、产品操作手册,请遵循以上建议,以在谷歌搜索结果中获得更佳索引、收录和排名效果。
参考资料:
https://support.google.com/analytics/answer/1012044
https://developers.google.com/search/blog/2011/09/pdfs-in-google-search-results
https://support.google.com/analytics/answer/1012044?hl=en#zippy=%2Cin-this-article
https://ahrefs.com/blog/seo-for-pdfs/
https://www.youtube.com/watch?v=oDzq-94lcWQ
https://www.searchenginejournal.com/pdf-seo-best-practices/59975/
https://support.google.com/tagmanager/answer/6106716?visit_id=637920633475403151-4181147519&rd=1&hl=en