Stack Overflow : , , ( ). , Stack Overflow, , , . , , ?
, — - . , . , ? . , . - Stack Overflow. , , . : , , .
, , . , , , , , .
, . . ? , - , , . , - .
- , :
- .
- .
- .
- .
- (, , ).
- open source.
- .
- .
. . , , , , ( ). . , .
, , , (bias term, ), ANOVA. :
- .
- .
, . — , . ? R2, , (, ). , .
R2 | R2adj | |
---|---|---|
0,4008 | 0,3892 | |
0,3938 | 0,3892 |
, 40 % . R2 , . R2adj , , . R2adj , 0,0068. , , . - .
, . — , - , . , .
? - , . ? , - ( 10 ), , , .
, :
- .
- open source.
- PHP.
, . , , open source ( , PHP). — , , . opensource.
opensource , , . , ? .
open source
opensource ? , opensource- . , opensource, .
opensource «» , . - 9,1981718×10−24. , opensource .
, . — IDE, . , -. , . , opensource- , , .
. , opensource , (, Python Ruby). , .
, , open source : ?
: opensource , ? opensource , , , .
, , opensource, , «». opensource, 15 , , «». , 15 , opensource . , opensource , . , .
- , : «» , , . -, ?
, , «» , . ( 150, ). : «» , «», ?
. 5 , . $65 000—70 000. , , .
, «» ( ). , , , . ? . χ2, , «» .
高給カテゴリのプログラマーの数が少なかったため、私は多くの潜在的な候補者を得ました。 私は、高給のグループとそれ以外で値が大きく異なる変数の1つがバージョン管理されていることに驚きました 。 米国のジュニアがよく使用するバージョン管理システムを除外しました(各調査で少なくとも20人のユーザー)。
高給 | 以下の給与 | |
---|---|---|
Git | 168 | 660 |
別のシステム | 17 | 30 |
転覆 | 4 | 47 |
チーム基盤サーバー | 6 | 92 |
バージョン管理システムの使用は、使用するインデントの種類に依存することがわかります。これは、米国のジュニア(p-value 1.5336476 x 10 -44 )だけでなく、世界中の開発者にも当てはまります。 これは、タブ、スペース、およびバージョン管理システムの間に強いつながりがあることを意味します。
この事実を分析しましょう。 アメリカの開発者の間で最も人気のある2つのシステム(データセットあたり少なくとも200ユーザー)は、GitとTeam Foundation Server(TFS)です。 彼らは給与にどのように影響しますか?
Gitユーザーは、経験に関係なくより多くの収入を得ます。 これまでのオープンソース参加者の研究に関連する興味深い結論。 しかし、もっと興味深いのは、すべてがどのように結び付けられているかです:バージョン管理、スペースと給与の集計?
バージョン管理システムは、高給が常にスペースに関連付けられているというパターンを破ります。 Gitを使用する企業は、少なくとも10年の経験を持つ開発者には、インデントの種類に関係なく、より多くのお金を支払います! Gitとタブを使用すると、経験に関係なく、TFSを使用してより多くの空白を獲得できます。 Gitユーザーグループでは、ホワイトスペースの給与は依然として高くなっています。 ただし、TFSグループでは状況が異なります。空白が最も少なくなります。
他の国では、状況はわずかに異なりますが、スペースとTFSを使用した15年以上の経験を持つプログラマになりたいとは思わないでしょう。
また、Subversionシステムのユーザーを分析しました。世界では、TFSよりもやや人気があります。 また、Subversionは、一般に空白スペースが多くなるという主張をサポートしていません。 Git +タブユーザーは、Subversion +スペースおよびGit +スペースとタブとほぼ同じくらいの収入を得ます。
要約1:なぜバージョン管理が重要なのですか?
要約すると、「オープンソースへの参加」と「バージョン管理システムの使用」という要因の組み合わせは、タブユーザーとスペースの給与の差に少なくとも部分的に影響します。 これは、Gitの使用を開始し、オープンソースに貢献してより多くの報酬を得る必要があるという意味ではありません(とにかくこれは大歓迎です!)。
これら2つの要因は、環境と企業のタイプの違い、従来のアプローチをどの程度遵守しているか、最新のテクノロジーを使用していることを示している可能性が高いと思います。 Gitとオープンソースコードを使用しない、より保守的な古い学校の企業は、一般的に低賃金です。 環境のタイプを研究の結果から直接評価することは難しいため、これらの要因は両方とも間接的にそのような考えを示唆しているだけです。
これで話は終わりではありません。スペースやタブを使用して状況を明らかにする変数は他にもあるはずです。 また、私の結論は一般的に米国の開発者からのデータに基づいていますが、ここで最も効果が顕著です。 以下に、他の国の給与分析で問題があった理由を説明します。
なぜアメリカ人だけを分析したのですか?
他の要因を考慮に入れて給与の分布を評価したとき、一つのことが私には理解できませんでした。 私が一緒に仕事をしたデータは、専任の専任開発者向けのものでした。 しかし、3,000ドル未満の非常に低い年収を持つ人々の大規模なグループもあります。 残念ながら、世界のさまざまな国の収入は大きく異なるため、これ自体は驚くことではありません。 しかし、国がまさにそのような低い給料を得るのは奇妙でした。
低賃金の回答者のほとんどはインド出身であり、この文脈で理解できます。 インドの平均給与は、他のOECD諸国よりもはるかに低いです。 しかし、その後、ポーランド、ロシア、さらにはドイツが登場します。 巨額の給与はないかもしれませんが、フルタイムの開発者にとっては年間3,000ドル未満です。
私自身はチェコ共和国から来たので、この地域の特徴について知っていて、なぜデータでこのような奇妙な状況になったのかという推測があります。 したがって、私は中央および東ヨーロッパのいくつかの国で給与の分布を確認し、世界の他の国の分布と比較しました。
英国、フランス、さらにはインドなどの国では、賃金分布にはピークが1つあります。 そして、中央および東ヨーロッパのすべての国-2つのピーク。 最初の給与は非常に低い給与に対応し、2番目の給与は対応する年間収入よりもはるかに大きい給与に対応します。 これはドイツではあまり発音されず、ポーランドではもっと発音され、ロシアではもっと発音されます。 この傾向が存在するチェコ共和国やウクライナなど、さらにいくつかの国を分析しました。 この地域のすべての国で、給与の二峰性分布。 そこで何が起こっていますか?
私の経験では、チェコ人は常に年収ではなく月収の観点から給与について話し合っています。 チェコ人から彼らが年収について話したと聞いたことはありません。 私のポーランド人の友人はこのバージョンを確認しました-誰もが月収でのみ動作します。 多くの回答者は、研究の質問を単に不注意に読んで、毎年の収入ではなく、毎月の収入に名前を付けているようです。
データを修正する方法はありますか? たとえば、混合モデルを作成し、低給与グループに12を掛けると、左側が切り捨てられますが、元の分布と比較して国の実際の賃金がより正確に反映されます。 ポーランドの例を次に示します。
要約#2:データトラップ
主な結論は、データは常に慎重に扱われるべきだということです。 調査結果には多くの歪みがあり、その一部は非常に予想外です。 私がメンタリティの特性に精通していなかったら、多くの国で実際に研修生のレベルで低賃金の職がたくさんあることを示唆したでしょう。 回答者が年収ではなく月給をどの国から命名したかわからないため、分析をアメリカのサンプルに限定しました。 このデータが最も一貫していることを願っています。
残念ながら、人々は常に研究の質問に正しく答えるとは限らず、検出することは非常に困難です。 おそらくこれは、スペースとタブのある状況に影響を与えたでしょう。 ソーシャルメディアでの反応を考えると、編集者によってタブが暗黙的にスペースに変換されていても、誰かがTabキーを押すためにタブの使用を示しました。
総数3
「空白」とタブを使用するユーザーのトピックとの間の収入の差は、主に会社のタイプと作業環境に関連していると確信しています。 Gitを使用してオープンソースに貢献している環境は、より高い給与とスペースに関連付けられています。 私は他の要因があると確信しています。 ただし、注意してください。データを完全に信頼することはできません。
結論として、 彼が提供したコードを提供してくれたDavidと、調査からのデータを公開してくれたStack Overflow に感謝します。 この分析に使用したコードをダウンロードできます 。