曲子龙:挺好的,百度终于取消了新闻源数据库。

运营 作者:尖刀制造 2017-03-21 06:05:08
因百度对时效性内容识别技术升级,原独立新闻源数据库的形式已不再适合使用,故取消新闻源数据库。
一群站长在QQ群里炸窝,探讨关于百度取消新闻源数据库的事儿,做为一个老站长,跟着新闻源十多年了,深知拿了新闻源就等于往手里送流量一般,自然这个声音出来后,很多人都会开始叫苦。 丁道师在文章里说:“曾几何时,网站或者媒体成为百度新闻源,远比在北京买一套房子价值大。” 我想说:“挺好的,毕竟从今天开始新闻领域可以出现公平的竞争”。 不公平的竞争格局 新闻源时代,其实本是一个不公平的竞争格局,虽然以优质内容为标准,但是对个人站长来讲,其实获取优质新闻源的门槛是特别高的,要坚定不移的保持原创,但是界定原创的标准其实很模糊,假设A站点是一个未获得新闻源的站点,B站点获取了新闻源,当A站点进行原创,而B站点持续转载A站点的原创文章时,那么B站点就可以获取海量流量,而像B这样的站点转载内容源的变多,那么A申请新闻源就不一定成功。 那些年,WEB2.0时代,说实话我们被地方性的新闻站点没少欺负。 新闻源没了怎么玩? 自新媒体时代来临,今日头条、百度百家、搜狐自媒体、一点资讯、北京时间、微信公众号等内容平台的衍生,流量已经分散了,百度新闻源的内容其实并没有原本那么重了,既然目标是更好的获取流量,所以不如去好好的想想,自己的站点入口到底在哪,要更好些。 我很庆幸,能遇到阿喵她们这样专业的算法团队,因为在一年前,为了提升我们的新闻源我们的内容运营团队,制定了一系列机制,来保证站点的收录率,结果现在到正好是更好的运营的契机。 不卖关子,围绕我们爱尖刀科技媒体运营团队,去年开始建立的这些机制给大家一点思路。 蜘蛛池 蜘蛛是一群管不住的孩子,一直都是基于URL在互联网上面漫无目的的奔走,站群跨了以后很多人开始考虑如何通过N个站点去养一个站点的玩法,于是就出现了蜘蛛池,蜘蛛池原理是很粗暴,从站群方式衍生,大量采集数据建立站点,前台用动态模式来欺骗蜘蛛,当蜘蛛每次进入站点一个页面的时候,网站程序会自动随机页面给它抓取,从而让蜘蛛不停的在网站内抓取新类容。 繁殖池 还是依靠站群的模式,通过大量网站将蜘蛛引导到一个集成的池,通过程序控制自动繁殖外链地址给蜘蛛,不管蜘蛛从哪个子站走进来,最终都引导到一个目标站点,如果你有很多站,你也可以为这些大量的蜘蛛定制任务,分发到N个站。 蜘蛛识别系统 不同的蜘蛛,他们的使命是不同的,比如新闻源、网页、图片这些蜘蛛的属性都是不同的,挂好钩子识别这些蜘蛛是干嘛的,为每个蜘蛛建立一个档案库,与繁殖池进行联动,精准分发让他去干他该干的事儿。 技术驱动新格局 外面一堆关于大数据、区块链、AI的声音,但是看了很多产品确实LOW的一笔,在鱼龙混杂的互联网行业,TO VC、TO G的企业大有人在,抱怨的同时未尝不是一个好的机会。 新的竞争格局不在是基于资源,而是基于技术,这会是公平的竞争,因为在这个时代,一定是数据和结果说话的。 不要在谈什么SEO,在站长领域里已经是个最基础的配置,SEO层面很多事情都没有什么竞争优势了,外链?内连?权重? 自己想想该如何发挥。 顺便show一下爱尖刀科技媒体的爬取频次吧,日爬取量平均差不多在30万左右。 上面的几项技术,并未用于爱尖刀,我们用的是另外一种思路,毕竟技术要向前看嘛。

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接