搜索引擎是什么:
所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。
搜索引擎主要特点是什么:
1、信息抓取迅速。在大数据时代,网络产生的信息浩如烟海,令人无所适从,难以得到自己需要的信息资源。在搜索引擎技术的帮助下,利用关键词、高级语法等检索方式就可以快速捕捉到相关度极高的匹配信息。
2、深入开展信息挖掘。搜索引擎在捕获用户需求的信息的同时,还能对检索的信息加以一定维度的分析,以引导其对信息的使用与认识。例如,用户可以根据检索到的信息条目判断检索对象的热度,还可以根据检索到的信息分布给出高相关性的同类对象,还可以利用检索到的信息智能化给出用户解决方案,等等。
3、检索内容的多样化和广泛性。随着搜索引擎技术的日益成熟,当代搜索引擎技术几乎可以支持各种数据类型的检索,例如自然语言、智能语言、机器语言等各种语言。目前,不仅视频、音频、图像可以被检索,而且人类面部特征、指纹、特定动作等也可以被检索到。可以想象,在未来几乎一切数据类型都可能成为搜索引擎的检索对象。
Google搜索引擎的工作原理:
1.你写博客、或在Twitter上推微博、更新站点等诸如此类往Web上添加内容的操作
2.Google bots程序(一种作为搜索引擎构件的智能代理程序)抓取你网页的title和description、keyword等内容
(1)Google爬虫沿着链接路径周游万维网,如果没有超文本路径到你的站点,你的站点将不会被索引
(2)如果你在robots.txt中设置不许索引,Google爬虫程序将不会抓取你的网页
(3)如果链接到你站点的超文本链接上有nofollow标签,Google爬虫将不会从这些链接路径周游到你的站点。
(4)Google也能通过blog软件或xml站点地图找到你的网站
(5)从PageRank越高的网站链接到你的网站的链接越多,你的网站的PageRank就越高。
(6)Google爬虫将周游所有未标注为nofollow的链接
3.一旦被Google爬虫访问到,网页几秒内就被索引了
(1)网页内容被存储在一个倒排索引中
① 网页标题和链接数据被保存在一个索引中,用于广度优先搜索
② 网页内容保存在另一个索引中,以用于检索频率不高的长尾、个性化、深度优先搜索
4.Google基于链接评估域名和网页的总体PageRank值。
5.检查网页以防止作弊行为
(1) Google的搜索质量和反垃圾信息审查和优化算法
(2) 1万多远程测试用户评价搜索结果的质量
(3) Google征请用户对有PageRank讹诈嫌疑的垃圾信息进行举报
(4) Google接到 (美国)数字千年版权法案的通知,要求Google从搜索结果中剔除涉嫌盗版的内容
6.在对页面做了损害分析后,现在每个页面都有很多用于辅助用户搜索的数据片(比如检索关键词)反向引用着它
7.用户发出搜索请求
8.Google会用同义词匹配与你的搜索关键词语义相近的查询结果
9.生成初步的查询结果
10.对查询结果集按权威性和PageRank进行排序,重复的查询结果被剔除。
11.对查询结果进行过滤处理
12. 最终返回给浏览器端的用户一个人性化的、布局良好的、查询结果和广告泾渭分明的有机查询结果页面。
SEO优化流程:
搜索引擎认为最有价值的(按先后顺序):
内容
社会化
用户体验
链接建设
SEO
5大SEO最应该花精力的地方:
可爬行性
网站结构
内容层级结构
页面元素/内容创作
链接建设
应该优化什么:质量:内容,链接,外观 信任:权威度,有用,资源
受欢迎程度:流量,回访,访问,链接 及时性:当前,最新,相关
文章为作者独立观点,不代表DLZ123立场。如有侵权,请联系我们。( 版权为作者所有,如需转载,请联系作者 )
网站运营至今,离不开小伙伴们的支持。 为了给小伙伴们提供一个互相交流的平台和资源的对接,特地开通了独立站交流群。
群里有不少运营大神,不时会分享一些运营技巧,更有一些资源收藏爱好者不时分享一些优质的学习资料。
现在可以扫码进群,备注【加群】。 ( 群完全免费,不广告不卖课!)
发表评论 取消回复