免費試用
banner
大數據平臺>大數據報告>數據分析證明越努力越幸運

越努力越幸運,這個道理可以用數據分析證明

作者: afenxi來源: afenxi時間:2017-02-06 10:27:000

摘要:對于候選人來說,「10 人錄取 1 人」和「100 人錄取 10 人」兩種規則難度一樣嗎?

摘要:對于候選人來說,「10 人錄取 1 人」和「100 人錄取 10 人」兩種規則難度一樣嗎?該理解為同樣10%的錄取率,還是理解為“打敗9人”比“打敗“90人”容易?

概率論數理統計學上有這樣的規律:總體樣本越大,概率越接近真實值(實力);總體樣本越小,隨機性影響越高。高票建模的回答(請參看 @ssynhtn Huang) 體現的就是這個思想,即實力越強,總體樣本越大越對自己有利;實力越弱,總體樣本越小越對自己有利。(建模結果請參看 @王赟 Maigo )

其實題主的這個問題就是高等數學概率論與數理統計課程中的大數定律。什么是大數定律?

大數定律(law of large numbers),是一種描述當試驗次數很大時所呈現的概率性質的定律。但是注意到,大數定律并不是經驗規律,而是在一些附加條件上經嚴格證明了的定理,它是一種自然規律因而通常不叫定理而是大數“定律”。而我們說的大數定理通常是經數學家證明并以數學家名字命名的大數定理,如伯努利大數定理。

在隨機事件的大量重復出現中,往往呈現幾乎必然的規律,這個規律就是大數定律。通俗地說,這個定理就是,在試驗不變的條件下,重復試驗多次,隨機事件的頻率近似于它的概率。比如,我們向上拋一枚硬幣,硬幣落下后哪一面朝上本來是偶然的,但當我們上拋硬幣的次數足夠多后,達到上萬次甚至幾十萬幾百萬次以后,我們就會發現,硬幣每一面向上的次數約占總次數的二分之一。偶然中包含著某種必然。(以上內容來自百度百科)

所以題主為什么覺得 10/100 比 1/10 困難?就是因為 1/10 偶然性、隨機性較大,實力不足者更能利用這種隨機性和偶然性(其實就是運氣)獲得成功,也就是對實力強者很有不利;而 10/100 卻更能體現出自身實力來,隨機性和偶然性影響相對較小,實力不足者自我實現更難,而對實力強者有利。當然,這個解釋的前提是人群的能力表現是按照正態曲線來分布的,并且這個分布也是符合自然規律的。

總結:題主關于“該理解為同樣 10% 的錄取率,還是理解為“打敗 9 人”比“打敗 90 人”容易?”這個理解我個人認為是片面的。假如把 100 人分為 10 組,每組選出勝出的 1 人,雖然最終計算概率是 10/100,但是實際勝出的人只需要打敗同組 9 人即可。所以,討論 10/100 難還是 1/10 容易的問題,還必須設定前提條件:實力問題和分配原則(或者說方式,前面說的選出 10/100,是按照 100 人同時比賽方式還是按照分 10 組每組選 1 人的方式),脫離了這兩個條件的討論是沒有意義的。

后記:這里所說的隨機性和偶然性,我認為就是日常生活中說的運氣,幸運。總結起來,獲得成功的因素有兩個:實力和運氣。

詳細地解釋一下這個答案,是這樣的:

總說明:

以下補充未在額外說明的情況下均默認人群能力是在符合正態分布模型的前提下討論,即認為人群能力分布中間者居多,能力較強和較弱者分布較少的中間大,兩邊小的分布。 在用數學模型討論時,所有數據均用客觀性評價,即僅從數學的角度討論,不討論其他因素(例如家庭關系、人脈等等)的樣本結果的影響。

1. 為了直觀說明 1/10 和 10/100 的錄取難度,現建立這樣一個模型:

人群能力均勻分布在(0,1)之內并且相互獨立,以 0.01 的長度計算,即能力在 0.00, 0.01, 0.02……0.98, 0.99, 1.00(用 x 表示)的 100 種情況下在每種情況下被成功錄取的概率,并繪制出曲線。

對于 1/10 招錄比例來說,成功錄取要打敗其他 9 個人,而每次成功概率為 x,那么成功概率為:P=越努力越幸運,這個道理可以用數據分析證明-數據分析網

對于 10/100 來說,成功錄取要至少打敗其他 90 個人,即錄取可能性為打敗 90 人,91 人,92 人,93 人……98 人,99 人,求和即可得到。而每次成功概率為 x,那么成功概率為:P= 越努力越幸運,這個道理可以用數據分析證明-數據分析網

繪制出兩種情況的概率分布曲線為:

越努力越幸運,這個道理可以用數據分析證明-數據分析網

由曲線可以看出,在相同的概率下,1/10 對能力弱者和中等能力有利,10/100 對能力超強者有利。

2. 為了更直觀的說明大數定理,用 MATLAB 做了一個圖。

越努力越幸運,這個道理可以用數據分析證明-數據分析網

從圖像上看:同一個樣本容量分布,取不同數量的樣本數量研究得到結論是不同的,取 10 個樣本時,隨機性的影響特別大,幾乎是亂序的,而取 100 個樣本時,雖然與隨機性影響,但是樣本分布基本滿足正態分布中間大,兩邊小的特點,因此,取無窮個樣本時,樣本分布完全滿足正態分布形態。這里說一下中心極限定理,被認為是(非正式地)概率論中的首席定理,設從均值為 μ、方差為 σ2;(有限)的任意一個總體中抽取樣本量為 n 的樣本,當 n 充分大時,樣本均值的抽樣分布近似服從均值為 μ、方差為 σ2/n 的正態分布。

3. 對人群能力分布建模

取兩組數據,兩組數據能力最弱者為 0,能力最強者為 1,樣本均值均為 0.5

第一組樣本分布在(0,1)之間 10 個樣本,相鄰樣本為 0.1 個長度即樣本為

0.0, 0.1, 0.2……0.9, 1.0

MATLAB 計算標準差 σ = 0.3317,

按照正態分布表示為 N(0.5, 0.33172) 在區間(0,1)分布

第二組樣本分布在(0,1)之間 100 個樣本,相鄰樣本為 0.01 個長度,即樣本為

0.00, 0.01, 0.02……0.99, 1.00

MATLAB 計算標準差 σ = 0.2930

按照正態分布表示為 N(0.5, 0.29302) 在區間(0,1)分布

用 MATLAB 繪制 N(0.5, 0.33172) 和 N(0.5, 0.29302) 在區間(0,1)的正態分布圖像為下圖所示:

越努力越幸運,這個道理可以用數據分析證明-數據分析網

概率密度函數為正態分布的期望值 μ 決定了其位置,其標準差 σ 決定了分布的幅度。從圖像和計算數據可知,10 個樣本數據分布更加矮胖,即更加離散,隨機性的影響相對于 100 個數據樣本更大。這里說的隨機性影響更大的說從無窮樣本庫:能力最弱者為 0,能力最強者為 1,樣本均值均為 0.5 的區間(0,1)之內無窮個數據取出 10 個數據樣本隨機性大于取出 100 個樣本的隨機性,取出 10 個數據相鄰數據間隔長度更大,不均勻可能性更大。舉例一項考試,招錄比例為 1/10 和 10/100,那么 1/10 更有可能取到 1 個能力超強,其他 9 人能力超弱的組合。

4. 隨機性的影響有三層含義。

a. 從樣本總體容量大小的角度看。

結合 1 和 2 以及大數定理,樣本容量越小,獲取的樣本表現標準差越大,隨機性越大。反之樣本容量越大,樣本數據離散程度越小,隨機性越被弱化,樣本越服從樣本的總體規律表現,這里的隨機性可以理解為樣本之間偏差大小,無序性和無規律性的程度。

b. 從樣本個體之間能力表現的角度看。

樣本個體之間的能力越接近或者說偏離程度和間隔長度越小,隨機性的個體的成影響越大,而這種影響往往是致命的。為了更好的說明,我舉個例子:

乒乓球是中國國球,在我國長盛不衰,大多冠軍被中國拿走,乒聯于是做了一系列改革,像 11 分制,小球換大球,無遮擋發球等。以前是 22 分制,改革后為 11 分制 ,局數減少,增加了比賽的偶然性和隨機性,其實這些改變都是針對中國選手,增加了比賽懸念,提高了比賽觀賞度。但這主要是想減少中國對乒乓球的壟斷。同樣情況的還有針對中國的羽毛球聯賽規則改革。

c. 從樣本個體本身能力表現的角度看。

當樣本個體能力確定時,建模時常常忽略個體能力的表現,并不是個體的能力表現好,個體的結果表現就一定符合能力值,比如高考超長發揮,正常發揮,失常發揮,這也是隨機性的一種表現形式這里的隨機性就是幸運值,建模很難體現出來。比如有不少高考狀元坦言,自己平時模擬考不都是年級第一,具體例子可以百度:浙江高考理科狀元李樂平時班里排十幾名,2014 年四川高考理科狀元封凡從未拿過年級第一等等。

5. 總結分析:

a. 從現實實際情況來看,1/10 和 10/100 這個比例常常是達不到規定招錄比率的。例如以國考為例中新網北京 11 月 30 日電 29 日下午 17 時,2016 年國考公共科目筆試正式落幕。據統計,本次考試共有 139.5 萬人通過招錄機關資格審查,近 93 萬人實際參加考試,超 46 萬人“棄考”。所以實際比例是趨向改變的。

b. 建議能利用其它因素(例如家庭關系、人脈等等)的參賽者選擇參賽人數少的考試。比如 10/100 情況下,你考 20 名,刷去 10 人難度大于而 1/10 時,你考第 5,刷去 4 人的操作難度。

c. 建議我們大多數人參加錄取人數多的比賽。對于我們大多數人來說,參加 10/100 的比賽,自己可以控制的空間比 1/10 大,也就是公平性越大。

d. 對于隨機性的影響,隨機性的具體表現可以理解為幸運值。但是隨機性這種事,掌握在上帝手中,對于幸運值的來說,我想:

越努力,越幸運;

而以我們大多數人努力的程度,根本還沒到拼智商的地步;

同樣的以我們大多數人努力的程度,遠遠沒有到拼幸運的地步。

來源:知乎  作者:王平民ing

鏈接:https://www.zhihu.com/question/24701052

banner
看過還想看
可能還想看
熱點推薦
Yonghong的價值觀:以卓越的數據技術為客戶創造價值,實現客戶成功。