我们搭建程序化 SEO 站点的时候,非常重要的一点就是找到合适的数据源。那今天这篇文章简单梳理一下,找数据源的几种方式,以及几个我觉得还不错的数据资源网站。

其实找网站数据资源的方法有好多,但是我自己主要用到方式就只有三种。

方法一,就是自己的写相应的爬虫程序去目标站点上抓取。比如现在比较流行的几个目录站点,我们完全可以使用一些程序方式,将数据整理下来用到自己的网站上。

方法二,遇到的在公网上获取不到的数据,不妨试试去专门的数据交易网站上购买相应的资源。而这类数据交易平台比较鱼龙混杂,好像并没有一家特别强大的平台,那这里不做专门的交易平台推荐了。

方法三,去专门的数据分享平台上获取开源的数据,而这类平台就比较多了,这里推荐几个我比较常用到的

我自己比较喜欢的就是 Kaggle 这家网站平台,属于是全球非常受欢迎的数据科学平台,提供大量的免费数据集。大到垂直行业的开源数据,小到某部电影的评测数据,在这个平台上都能很容易找到。

上面这个数据网站是美国政府的开放数据平台,在上面能发现非常多的公共数据集。现在有不少网站就是专门做这类数据的加工,提供专业的公共数据分析服务。

所以如果你的网站跟这些数据相关的话,不妨去这个网站上看看有没有自己能用得上的数据。

上面这个网站则是联合国的统计数据网站,上面提供不少国家或者地区的多维度统计数据。

其实除了这个网站外,联合国还有一个专门的数据网站做得挺不错,就是提供全球各个国家或者地区、全部商品的贸易往来数据,这些数据用于产品调研还挺不错的。

另外,有兴趣的话可以去专门搜集一下这些国际组织的数据服务网站,像联合国、世界银行、国际货币基金组织,等等组织都有提供专门的数据分享平台。

那除了专门的数据分享平台网站外,互联网上还有不少数据搜索引擎。比如上图这个网站,便是亚马逊平台提供的开放数据平台,在这个平台上就有不少规模比较大的数据集。

你可以把自己的项目(或者产品)的主关键词,放到这个平台上进行搜索,看看能不能发现属于自己的数据集。

其实除了亚马逊提供这样的数据搜索服务外,谷歌在这方面也不甘落后。比如上图便是谷歌提供的专门用于数据集搜索的搜索引擎。

只需要在搜索框中简单键入几个关键词,该搜索引擎便能将开源互联网上的公开数据集呈现在我们面前。比如上图中,我输入“yoga pants”关键词进行搜索,可以看到搜索引擎给我呈现了 100 多个数据集结果。

其中不仅有行业分析报告、市场调研报告,甚至还有某些电商平台的产品交易数据与相应的分析报告,可以说只有你想不到的,没有它找不到的。

除了上面提及的这些找数据的平台外,还有一些比较小众的平台也值得我们留意,比如垂直的行业论坛、代码分享平台,等等。


点赞(9) 打赏

评论列表 共有 0 条评论

暂无评论

服务号

订阅号

备注【拉群】

商务洽谈

微信联系站长

发表
评论
立即
投稿
返回
顶部