我们对此也很好奇,以是我们用我们的公共数据集Stacklite进行了标签搜索,用于找出事情日和周末的问题之间的差异。Stacklite数据集是公开的,任何人都可以剖析,你可以利用Kaggle Kernel来查询Stack Overflow中的问题和标签。
为了完成这次剖析,我们利用了超过1万个问题标签。须要解释的是我们利用的是UTC韶光来定义周末,因此考虑到天下各地的时差问题,这份调查是无法完备精确的表示出全天下开拓者的实际情形的。终极,我们网络了事情日的10451274个问题和周末的2132073个问题。数量上的差异紧张是由于开拓者们还是在事情日利用Stack Overflow更多些,这和我们网站的流量表示相同等。
实际上,在正常的事情日里,基本上所有的技能问题标签都挺忙的,以是在这个事情日/周末模式的调查中,我们最感兴趣的是哪些标签所占的份额在周末相对付事情日来说变革最大,因此我们首先收成了这张比拟图:
周末和事情日比拟,哪些问题标签的份额差别最大呢?
为理解释更清楚点,让我们看一些图表中没有表示的数字。在2万多个带标签的问题中,函数编程措辞Haskell在周末占到了0.365%,但在普通事情日只占0.21%,这表明它在周末非常的生动。与之比拟,SharePoint在周末所提出的问题中只占0.0683%,而在事情日则高至0.188%,这解释它险些只在事情日利用。
这个结论让我们很高兴,由于Haskell确实是一个在学者和数学家群体里很受欢迎的措辞,但是还没有在企业环境中盛行起来,看来开拓者们在周末还是很喜好做数学等学科研究的。
让我们再做一些不雅观察:
我们创造一些底层技能在周末依然是非常盛行的,比如C、C++、指针和汇编以及干系的数学标签比如算法、递归等等。
Heroku和Meteor常用于快速搭建运用平台的原型,这该当意味着开拓者们喜好在周末用它们来创建业余兴趣项目。
而很多和微软干系的技能在周末显然没有事情日生动,包括Excel、SQL Server、VBA和T-SQL,其他包括Oracle等企业技能也是这样。
我们还可以通过比较问题的总数和涌现的相对频率将这些关系可视化:
事情日/周末比拟散点图
阐明一下这个散点图,标签越靠右,代表提出的问题数量越多,比如javascript、java、C #和PHP等,这些主流措辞无论在平日还是周末都会有大量的问题提出,反之标签靠左表示问题总量少。赤色虚线则是事情日与周末的分隔线,标签越靠上,表示周末比较普通事情日的生动程度越高。
我们可以再次看到,大多数和微软干系的技能,纵然是C #、ASP.NET、SQL Server和Excel这些热门技能,在周末的生动度都明显低于事情日,而C和C++在周末提出的问题比率却比平日的问题要高很多,这让我们有些没想到,各种新措辞比如Swift和Node.js的周末生动度也明显高于平日,这很随意马虎理解,由于许多人须要利用周末进行学习。
我们还可以利用这个数据集来进行趋势剖析,看看开拓者们在周末所关注的技能随着韶光的推移发生了若何的变革。为此我们建立了模型,用来找到各种技能标签在周末被问到的比率变革情形,这2万多个带着标签的问题带给了我们下面这样的答案:
我们创造像Ruby on Rails和Scala这些几年前在周末涌现频率极高的问题标签,现在的情形已经发生了改变。缘故原由该当是这些几年前的新兴技能现在已经被企业广泛采取,因而进入了开拓者的日常事情范围。这几年来在周末利用版本掌握系统SVN的人也大量减少了,最可能的缘故原由是2008年GitHub的推出,导致了越来越少的人利用SVN管理个人项目代码。
而如果不雅观察那些与几年前比较在周末增长最多的技能标签,我们会看到游戏引擎Unity3D和许多用于构建移动运用的技能与框架。看起来,比较前几年,开拓者们现在更喜好在周末设计游戏和移动运用,这确实是度过周末的好方法!