當前位置:首頁 » 分析預測 » 本福特定律股票分析
擴展閱讀
張國榮同性戀的原因 2024-11-17 23:12:10
西安自駕游 2024-11-17 23:04:27
山東俊富公司股票 2024-11-17 22:38:43

本福特定律股票分析

發布時間: 2021-05-31 19:49:40

1. 如何證明本福特定律

1938年,本福特發現了統計報表中的這樣一個規律:

一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成,接近期望值1/9的3倍。推廣來說,越大的數,以它為首幾位的數出現的機率就越低。它可用於檢查各種數據是否有造假。

在十進制首位數字的出現機率(%,小數點後一個位):

1 30.1%
2 17.6%
3 12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%

證明如下:假設我們有一個很大的樣本空間,有隨機變數x₁,x₂,...,x_{n},這里n足夠大。x₁,x₂,...,x_{n}的演化規律可以用上邊所講的指數方程來模擬。

如果我們對於指數定律的解兩邊取以10為底的對數,我們就會得到lg x(t)正比於時間t的結論。

如果我們問變數x介於80-90的概率有多大,我們只需要求出x(t=80)時t的解t₁,和x(t=90)時t的解t₂. 那麼占總時間T的比率(t₂-t₁)/T即為x介於80-90的概率。

那麼如果我們問首位數字是8的概率呢?多虧了anx和zhuww的想法,我們只需要關心lg x的小數部分介於lg 8和lg 9之間的長度為多少即可。

這是由於關於10的對數lg x的整數部分決定著x是幾位數(整數部分是1,說明是兩為數;整數部分是2,說明是3位數……)。而lg x的小數部分則決定著x的每位數字是什麼。

如果畫一個lg x的小數部分關於時間t的圖像,實際上就相當於把lg x的圖像折疊到[lg 0,lg 10]區間。這樣,我們就不需要關心時間T有多大,因為時間軸也被折疊了。那麼首位數字為D的概率即為 [lg(D+1)-lg(D)]/(lg 10-lg 1)=lg(D+1)-lg(D)。

以上結果即為本福特發現的規律

2. 如何用EXCEL函數製作本福特定律的數值分析

第一次聽說這個定律,了解了一下,不知對不對:

  1. A列放入所有數據

  2. B列為輔助列,公式為:=LEFT(A1,1)

  3. C列為1到9的數字

  4. D列為結果,公式為:=COUNTIF(B:B,C1)/COUNT(A:A)

3. 本福特定律的解釋

1881年,天文學家西蒙·紐康伯發現對數表包含以1起首的數那首幾頁較其他頁破爛。可是,亦可以以任何書起首數頁也會較破爛這個觀點解釋。這個故事可能是虛構的。
1938年,物理學家法蘭克·本福特重新發現這個現象,還通過了檢查許多數據來證實這點。
2009年,西班牙數學家在素數中發現了一種新模式,並且驚訝於為何那時才為人發現。雖然素數一般被認為是隨機分布的,但西班牙數學家發現素數數列中每個素數的首位數字有明顯的分布規律,它可以被描述了素數的本福德法則。這項新發現除了提供對素數屬性的新洞見之外,還能應用於欺騙檢測和股票市場分析等領域。
數字統計的一種內在規律,指所有自然隨機變數,只要樣本空間足夠大,每一樣本首位數字為1至9各數字的概率在一定范圍內具有穩定性。見右圖。即以1開首的樣本占樣本空間的0.3,以2開首的樣本占樣本空間0.17-0.19,而以9或8開首的樣本始終只佔0.05左右。
世界上千千萬萬的數據的開頭數字是1到9中的任何一個數字,而且每個數字打頭的概率本應該差不多,但如果你統計的數據足夠多,就會驚訝地發現,打頭數字是1的數據最多。
1935年,美國的一位叫做本福特的物理學家在圖書館翻閱對數表時發現,對數表的頭幾頁比後面的頁更臟一些,這說明頭幾頁在平時被更多的人翻閱。
本福特再進一步研究後發現,只要數據的樣本足夠多,數據中以1為開頭的數字出現的頻率並不是1/9,而是30.1%。而以2為首的數字出現的頻率是17.6%,往後出現頻率依次減少,9的出現頻率最低,只有4.6%。
本福特開始對其它數字進行調查,發現各種完全不相同的數據,比如人口、物理和化學常數、棒球統計表以及斐波納契數列數字中,均有這個定律的身影。
1961年,一位美國科學家提出,本福特定律其實是數字累加造成的現象,即使沒有單位的數字。比如,假設股票市場上的指數一開始是1000點,並以每年10%的程度上升,那麼要用7年多時間,這個指數才能從1000點上升到2000點的水平;而由2000點上升到3000點只需要4年多時間;但是,如果要讓指數從10000點上升到20000點,還需要等7年多的時間。因此我們看到,以1為開頭的指數數據比以其他數字打頭的指數數據要高很多。
2001年,美國最大的能源交易商安然公司宣布破產,當時傳出了該公司高層管理人員涉嫌做假賬的傳聞。事後人們發現,安然公司在2001年到2002年所公布的每股盈利數字就不符合本福特定律,這證明了安然的高層領導確實改動過這些數據。

4. 本福特定律的介紹

本福特定律,也稱為本福德法則,說明一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成,接近期望值1/9的3倍。

5. 什麼是本福特定律

http://ke..com/view/1405011.html?wtp=tt

6. 如何解釋本福特定律

本福特定律,也稱為本福德法則,說明一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成,接近期望值1/9的3倍。

7. 什麼是畢福德定律

應該是本福特定律!!!
本福特定律
數字統計的一種內在規律,指所有自然隨機變數,只要樣本空間足夠大,每一樣本首位數字為1至9各數字的概率在一定范圍內具有穩定性。見右圖。即以1開首的樣本占樣本空間的0.3,以2開首的樣本占樣本空間0.17-0.19,而以9或8開首的樣本始終只佔0.05左右。
世界上千千萬萬的數據的開頭數字是1到9中的任何一個數字,而且每個數字打頭的概率本應該差不多,但如果你統計的數據足夠多,就會驚訝地發現,打頭數字是1的數據最多。
1935年,美國的一位叫做本福特的物理學家在圖書館翻閱對數表時發現,對數表的頭幾頁比後面的頁更臟一些,這說明頭幾頁在平時被更多的人翻閱。
本福特再進一步研究後發現,只要數據的樣本足夠多,數據中以1為開頭的數字出現的頻率並不是1/9,而是30.1%。而以2為首的數字出現的頻率是17.6%,往後出現頻率依次減少,9的出現頻率最低,只有4.6%。
本福特開始對其它數字進行調查,發現各種完全不相同的數據,比如人口、物理和化學常數、棒球統計表以及斐波納契數列數字中,均有這個定律的身影。
1961年,一位美國科學家提出,本福特定律其實是數字累加造成的現象,即使沒有單位的數字。比如,假設股票市場上的指數一開始是1000點,並以每年10%的程度上升,那麼要用7年多時間,這個指數才能從1000點上升到2000點的水平;而由2000點上升到3000點只需要4年多時間;但是,如果要讓指數從10000點上升到20000點,還需要等7年多的時間。因此我們看到,以1為開頭的指數數據比以其他數字打頭的指數數據要高很多。
2001年,美國最大的能源交易商安然公司宣布破產,當時傳出了該公司高層管理人員涉嫌做假賬的傳聞。事後人們發現,安然公司在2001年到2002年所公布的每股盈利數字就不符合本福特定律,這證明了安然的高層領導確實改動過這些數據。
第一數字定律描述的是自然數1到9的使用頻率,公式為F(d) = log[1 + (1/d)](d為自然數),其中1使用最多接近三分之一,2為17.6%,3為12.5%,依次遞減,9的頻率是4.6%。科學家們仔細研究第一數字定律後,無法對這種現象做出合理解釋。定律的主要奠基人Frank Benford對人口出生率、死亡率、物理和化學常數、素數數字等各種現象進行統計分析後發現,由度量單位制獲得的數據都符合第一數字定律。當然彩票上隨機數據並不符合。第一數字定律在許多方面都得到了應用,但對於這種數字奇異現象人們依舊是迷惑不解。
上圖表中的幾個數據範例來自於西班牙國家統計局,數據是按照本福特對數定律統計的。然而,按照彩票獲得的數據是隨機的和統一的。
您住宅地址號碼是以a 1開始的嗎?根據一個奇特的數學定律統計,約三分之一的住宅號碼是以1作為其首個數字的。其它許多幾乎沒有任何共通性的地區也有相同的情況:比如道瓊斯指數的歷史數據、個人電腦中文件儲存的大小排列順序、世界主要河流的長度、報紙頭版頭條的數字及其它許多事情。
該定律根據其第二位奠基人弗蘭克.本福特的名字被命名為本福特定律。通用電氣公司物理學家本福特於1935年發現了這一定律。該定律告訴人們在各種各樣不同資料庫中每個數字(從1到9)作為首個重要阿拉伯數字的頻率。
除數字1始終占據約三分之一的出現頻率外,數字2的出現頻率為17.6%,3出現的頻率為12.5%,依次遞減,9的出現頻率是4.6%。在數學術語中,這一對數定律的公式為F(d) = log[1 + (1/d)],此公式中F代表頻率,D代表待求證數字。
這一現象讓人覺得很奇怪,來自科爾多瓦大學的科學家傑赫斯.托里斯、桑索利斯.費爾羅德滋、安東尼奧.迦米洛和安東尼奧.索拉同樣也如此認為。科學家們在《歐洲物理雜志》上發表了一篇題為「數字如何開始?(第一數字定律)」的文章,該文章對這一定律進行了簡要的歷史回顧。他們的論文同時還對第一數字定律的有效應用進行了闡述,並對為何沒有人能夠對這一數字出現頻率現象做出合理解釋的原因進行了闡述。
等離子體物理學專家托里斯說,「自從我了解本福特定律以來,它一直是我很感興趣的問題之一。在統計物理學課堂上,我一直將此定律作為一個令人驚奇的範例來激發學生們的好奇心。」托里斯解釋道,在本福特之前,有一位深受尊敬的天文學家名為西蒙.紐庫姆,他在1881年發現了這一定律。紐庫姆同時代的科學家們並沒有對他的科學發現引起足夠重視。本福特和紐庫姆兩位科學家均對這一定律感到困惑:當瀏覽對數表書籍時,他們注意到書的開始部分要比結束部分臟得多。這就是說他們的同事到圖書館後,選擇各種各樣學科書籍時首選第一頁開始閱讀。
本福特對此疑問的觀察要比紐庫姆更深入一些。他開始對其它數字進行調查,發現各個完全不相同的數據,比如人口、死亡率、物理和化學常數、棒球統計表、半衰期放射性同位數、物理書中的答案、素數數字和斐波納契數列數字中均有「第一數字定律」現象的出現。換句話說就是只要是由度量單位制獲得的數據都符合這一定律。
另一方面,任意獲得的和受限數據通常都不符合本福特定律。比如,彩票數字、電話號碼、汽油價格、日期和一組人的體重或者身高數據是比較隨意的,或者是任意指定的,並不是由度量單位制獲得的。
正如托里斯和他的同事所解釋的,數十年來科學家緊隨本福特對這一數字現象進行研究,但是除了發現更多的例子外,他們幾乎沒有發現有關比第一數字定律本身更多的東西。然而科學家們還是發現一些奇特現象。比如當對資料庫中的第二重要數字進行調查時,該定律仍然發揮著作用,但是第二重要數字的重要性卻降低。同樣,第三和第四重要數字所展現出來的特徵就開始變得相同起來,第五重要數字的頻率為10%,剛好是平均數。第二個奇特現象引發了更多的科學興趣:
科學家們在他們所發表的文章中寫到,「1961年,皮克漢姆發現了首個常規相關結論,該結論顯示本福特定律是一個尺度不變原理,同時也是唯一一個提出數字尺度不變原理的定律。那就是說,由於是以公里來表示世界河流的長度,因此它滿足本福特定律,同樣以英里、光年、微米或者其它長度單位數字都會滿足這一定律。」
托里斯同時還解釋到,在二十世紀晚期,一些重要的預測理論(基數恆定性及唯一性等)被特德.希爾和其它數學家證實。雖然一些範例(比如住宅地址號幾乎總是以數字1開頭,低位數總是出現在高位數之前)得到了解釋,但是目前仍然沒有找到任何能解釋各種範例的能用判斷標准。科學家們同時還解釋到,沒有任何優先標准能夠告訴我們什麼時候應當或者不應當遵守這一定律設置數字。托里斯說,「現在對該定律的研究取得了許多理論成果,但是一些理論成果仍然是前途未明。為什麼一些數字設置,比如通用物理學恆量會如此完美地符合這一定律?我們不僅要了解這一定律的數學原因,還要掌握這一套實驗數據的特徵。比如他們的連接點是什麼?他們來自哪裡?很顯然,他們是相當獨立的。我希望將來能夠找到這一定律的總體必然性和充分條件。很多人都對這一定律感興趣,特別是經濟學家。但是我也知道這一定律也許有可能是永遠都不可能的事。」
然而,科學家們已經使用該定律進行了許多實踐應用。比如,一個公司的年度賬目數據應當是滿足這一定律,經濟學家可以根據這一定律查找出偽造數據。因為偽造數據很難滿足這一定律。(非常有趣的是,科學家發現數字5和6,而不是1是最流行的數字,這表明偽造者試圖在賬目中間「隱藏」數據。)
本福特定律最近還用於選舉投票欺詐發現。科學家依據這一定律發現了2004年美國總統選舉中佛羅里達州的投票欺詐行為,2004年委內瑞拉的投票欺詐和2006年墨西哥投票欺詐。
托里斯說,「有關第一數字定律是通過臟書頁發現的故事是完全不可信的。本福特定律不可否認已經得到應用。當這一定律被發現是其能夠帶來的好處並不明朗。對我而言,它彷彿僅僅只是一個數字奇異現象。這就是簡單中可能蘊涵有意想不到神奇之處的典型範例。」
benford定律在審計方面的應用:
一、本福德定律
對於抽樣審計,我們已經進行了詳細講解。抽樣審計的方法主要包括隨機抽樣和重點抽樣。隨機抽樣是採用數理統計與概率論的原理從總體中抽取樣本並進行檢查;重點抽樣是審計人員根據經驗和職業判斷有針對性的抽取樣本並進行檢查。我們回顧這兩種抽樣形式,會發現如下缺點和不足:
(1)隨機抽樣如果要達到一定精確度,樣本必須很大。這對於強調效率、效果和時效性的審計來說,有時可能存在成本高、在預定時間內無法完成任務的情況。審計人員為了在既定時間內完成任務,必然存在大量開飛機(沒有執行的審計程序在審計底稿中記錄已經執行了)的現象,反而大大影響審計效果。
(2)重點抽樣強調審計人員的經驗和判斷。在審計實務中,一般是根據金額大小、性質嚴重程度並結合隨機抽樣方法進行抽樣的。這種抽樣方法對於總體中樣本金額差異大、個體數量少的情況下比較適用,但是對於總體中個體數量多、個體間金額比較均勻的情況則顯得很吃力。
那麼是否有更好的方法可以禰補這些不足呢?這就是本節要講的方法,這種方法是隨機抽樣、重點抽樣審計方法的有益補充,該方法就是富蘭克•本福德(FrankBenford)定律(Benford's Law)。
本福德早年在通用電器公司(GE)實驗室工作,是一名物理學家,二十世紀二十年代發現了一個令人震驚的數學規律,即在任何一組同質隨機發生的數據中,排在數據第一或第二位的數字是存有一個可預測到的概率。例如,在一組數據中1排在第一位的概率約為31%,而9排在第一位的概率僅有5%。本福德測試了多種來源的數據組發現存在這樣的概率。
本福德定律的含義如下:
一組隨機發生的數字,各個數字的首位存在一定規律,越小的數字出現的比率越高,既0出現的概率是100%(實際上首位不可能是0,因此我們可以認為其出現的概率是100%),1出現的概率是31%,2出現的概率是18%,依次類推,9出現的概率只有不到5%。
其實,本福德定律也服從大數法則和中心極限定理,但是其證明比較復雜,這里不贅述。下圖是美國物理學家 T. P. Hill 於1998年7-8月試驗本福德定律的概率圖:
本福德定律的應用條件是:
(1)數據不能是規律排序的,比如發票編號、身份證號碼等;
(2)數據不能經過人為修飾。
二、本福德定律在審計中的應用
我們知道,本福德定律的適用條件是數據不能經過人為修飾。如果數據來自舞弊所得到的結果,則這些數據將不再服從本福德定律。注冊會計師可以利用本福德定律來發現被審計單位舞弊,提高審計效果。

8. 本福特定律

1938年,本福特發現了統計報表中的這樣一個規律: 一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成,接近期望值1/9的3倍.推廣來說,越大的數,以它為首幾位的數出現的機率就越低.它可用於檢查各種數據是否有造假. 在十進制首位數字的出現機率(%,小數點後一個位): 1 30.1% 2 17.6% 3 12.5% 4 9.7% 5 7.9% 6 6.7% 7 5.8% 8 5.1% 9 4.6% 證明如下:假設我們有一個很大的樣本空間,有隨機變數x?,x?,...,x_{n},這里n足夠大.x?,x?,...,x_{n}的演化規律可以用上邊所講的指數方程來模擬. 如果我們對於指數定律的解兩邊取以10為底的對數,我們就會得到lg x(t)正比於時間t的結論. 如果我們問變數x介於80-90的概率有多大,我們只需要求出x(t=80)時t的解t?,和x(t=90)時t的解t?. 那麼占總時間T的比率(t?-t?)/T即為x介於80-90的概率. 那麼如果我們問首位數字是8的概率呢?多虧了anx和zhuww的想法,我們只需要關心lg x的小數部分介於lg 8和lg 9之間的長度為多少即可. 這是由於關於10的對數lg x的整數部分決定著x是幾位數(整數部分是1,說明是兩為數;整數部分是2,說明是3位數……).而lg x的小數部分則決定著x的每位數字是什麼. 如果畫一個lg x的小數部分關於時間t的圖像,實際上就相當於把lg x的圖像折疊到[lg 0,lg 10]區間.這樣,我們就不需要關心時間T有多大,因為時間軸也被折疊了.那麼首位數字為D的概率即為 [lg(D+1)-lg(D)]/(lg 10-lg 1)=lg(D+1)-lg(D). 以上結果即為本福特發現的規律