搜索引擎是什么:


     所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。


搜索引擎主要特点是什么:

    

 1、信息抓取迅速。在大数据时代,网络产生的信息浩如烟海,令人无所适从,难以得到自己需要的信息资源。在搜索引擎技术的帮助下,利用关键词、高级语法等检索方式就可以快速捕捉到相关度极高的匹配信息。

2、深入开展信息挖掘。搜索引擎在捕获用户需求的信息的同时,还能对检索的信息加以一定维度的分析,以引导其对信息的使用与认识。例如,用户可以根据检索到的信息条目判断检索对象的热度,还可以根据检索到的信息分布给出高相关性的同类对象,还可以利用检索到的信息智能化给出用户解决方案,等等。

3、检索内容的多样化和广泛性。随着搜索引擎技术的日益成熟,当代搜索引擎技术几乎可以支持各种数据类型的检索,例如自然语言、智能语言、机器语言等各种语言。目前,不仅视频、音频、图像可以被检索,而且人类面部特征、指纹、特定动作等也可以被检索到。可以想象,在未来几乎一切数据类型都可能成为搜索引擎的检索对象。


Google搜索引擎的工作原理:


1.你写博客、或在Twitter上推微博、更新站点等诸如此类往Web上添加内容的操作 

2.Google bots程序(一种作为搜索引擎构件的智能代理程序)抓取你网页的title和description、keyword等内容 

(1)Google爬虫沿着链接路径周游万维网,如果没有超文本路径到你的站点,你的站点将不会被索引 

(2)如果你在robots.txt中设置不许索引,Google爬虫程序将不会抓取你的网页 

(3)如果链接到你站点的超文本链接上有nofollow标签,Google爬虫将不会从这些链接路径周游到你的站点。 

(4)Google也能通过blog软件或xml站点地图找到你的网站 

(5)从PageRank越高的网站链接到你的网站的链接越多,你的网站的PageRank就越高。 

(6)Google爬虫将周游所有未标注为nofollow的链接

3.一旦被Google爬虫访问到,网页几秒内就被索引了

(1)网页内容被存储在一个倒排索引中 

① 网页标题和链接数据被保存在一个索引中,用于广度优先搜索 

② 网页内容保存在另一个索引中,以用于检索频率不高的长尾、个性化、深度优先搜索

4.Google基于链接评估域名和网页的总体PageRank值。

5.检查网页以防止作弊行为

(1) Google的搜索质量和反垃圾信息审查和优化算法

(2) 1万多远程测试用户评价搜索结果的质量

(3) Google征请用户对有PageRank讹诈嫌疑的垃圾信息进行举报

(4) Google接到 (美国)数字千年版权法案的通知,要求Google从搜索结果中剔除涉嫌盗版的内容

6.在对页面做了损害分析后,现在每个页面都有很多用于辅助用户搜索的数据片(比如检索关键词)反向引用着它

7.用户发出搜索请求

8.Google会用同义词匹配与你的搜索关键词语义相近的查询结果 

9.生成初步的查询结果

10.对查询结果集按权威性和PageRank进行排序,重复的查询结果被剔除。

11.对查询结果进行过滤处理

12. 最终返回给浏览器端的用户一个人性化的、布局良好的、查询结果和广告泾渭分明的有机查询结果页面。

SEO优化流程:

搜索引擎认为最有价值的(按先后顺序):

内容

社会化

用户体验

链接建设

SEO

5大SEO最应该花精力的地方:

可爬行性

网站结构

内容层级结构

页面元素/内容创作

链接建设

应该优化什么:质量:内容,链接,外观 信任:权威度,有用,资源 

受欢迎程度:流量,回访,访问,链接 及时性:当前,最新,相关


点赞(1) 打赏

评论列表 共有 0 条评论

暂无评论

服务号

订阅号

备注【拉群】

商务洽谈

微信联系站长

发表
评论
立即
投稿
返回
顶部