轉(zhuǎn)帖|行業(yè)資訊|編輯:我只采一朵|2017-06-30 14:16:31.000|閱讀 353 次
概述:百家姓大數(shù)據(jù),挺有意思的!
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
作者:周寧奕、團(tuán)支書
最近不知道哪個朋友(是的我的確不知道)搞到了一組脫敏后的天朝公民個人數(shù)據(jù),覆蓋1000多萬人,大概占全國人口的1%,信息包括姓氏、年齡、籍貫城市、現(xiàn)居城市等。朋友讓我用這組數(shù)據(jù)隨便做點啥。
這組數(shù)據(jù)如此牛逼,可以做的東西太多啦。但是,吸取了前兩次文章被下架的教訓(xùn),我決定做一個不那么敏感的話題。就做 “東半球第二有趣的中國姓氏排行榜”吧!
既然是“數(shù)據(jù)團(tuán)”出品的姓氏排行榜,必然不能數(shù)數(shù)人頭就敷衍了事。事實上,我為這個排行榜設(shè)計了豐富的內(nèi)容:普遍指數(shù)、抱團(tuán)指數(shù)、奔波指數(shù)、裝逼指數(shù)、風(fēng)雅指數(shù)等。
下面就開始對這個排行榜進(jìn)行闡釋吧!(具體排名見文章末尾)
普遍指數(shù)=姓氏人口數(shù)量
毫無懸念,“王”姓以占據(jù)中國人口8.1%的比例、接近1億的人口總數(shù),奪得了中國第一大姓、地球第一大姓、宇宙第一大姓的桂冠。
恭喜隔壁老王!
那么,老王們都在哪里呢?
看起來,隔壁老王雖然說不上無處不在,但也是蔚為壯觀啊!
除了老王,老張、老李也表現(xiàn)不俗,分獲宇宙第二、第三大姓的榮譽。這三大姓加起來,占據(jù)中國總?cè)丝诘?2%(由于我們掌握的數(shù)據(jù)不是完全的隨機(jī)抽樣,各個姓氏的排名與比例可能與其它統(tǒng)計結(jié)果略有不同)。
總的來說,“王張李劉陳楊趙周吳徐”10大姓占據(jù)了中國總?cè)丝诘?3%;20大姓占據(jù)56%,而前100的大姓占據(jù)了88%!
但是,別看這些大姓多么牛逼,其實都發(fā)源于極少數(shù)的幾個姓:姬、嬴、姜、媯等。其中,最為古老的可能就是“姬”了——“姬”傳說是黃帝之姓、周朝國姓,并且是10大姓中7個姓的起源。千年過去,姬姓后嗣多已改為他姓,開枝散葉。而還保留著這個古老姓氏的人口,也仍然棲息在古老中華文明的發(fā)源地——河南。
從姬姓的例子中我們看到,一些較小的姓氏在空間上的分布是高度集中的。這可能是因為較小姓氏的發(fā)源地相對單一吧。
為了探究姓氏的空間集聚問題,我們又設(shè)計了第二個指數(shù):
抱團(tuán)指數(shù)=各姓氏在各省分布的基尼系數(shù)。
研究結(jié)果表明,抱團(tuán)指數(shù)最高、也就是空間集聚度最高的三個姓氏分別為:覃、麥、樸,三姓的基尼系數(shù)都在0.82以上,而且三個姓都是相對較小的姓。
先來看覃(qin,第二聲):“覃”的本意為有蓋的酒壇,最早的“覃”人以釀酒和制作酒具形成氏族。先秦時期,覃姓主要在河南活動,后來主力遷入南方,吸收了南方的眾多外來血緣,并分化出譚、潭、鐔(tan)、瞫(shen,第三聲)等多個姓。現(xiàn)今,覃姓主要分布在廣西、廣東、湖南、湖北。
麥姓,起源于春秋時期的麥丘(今山東商河西北),由齊恒公賜姓。麥姓南遷以后,出現(xiàn)在傈傈族、回族、布依族、瑤族、黎族等少數(shù)民族中。80%的麥姓人口都分布在廣東。
但是,如果我們仔細(xì)看的話,會發(fā)現(xiàn)除了廣東,麥姓在北京和上海也有兩片相對集中的區(qū)域,其他區(qū)域則是一片漆黑。這個專注北上廣的麥姓真是傲嬌啊。
樸的本意為樹皮,也是一個小姓,但大多數(shù)讀者都能正確地讀出piao(第二聲)而不是pu,這應(yīng)該歸功于“宇宙第一大國”的韓國吧。事實上,從空間分布來看,樸也是典型的北方姓氏,也主要分布在宇宙第一大國的輻射地:東北三省。
如果說小姓比較容易呈現(xiàn)出明顯的聚集趨勢,那么人數(shù)眾多的大姓是否都是雨露均沾、均勻分布的呢?
在top20的大姓中,絕大多數(shù)姓氏的基尼系數(shù)都在0.35-0.45范圍內(nèi),但有一個姓很特殊,其基尼系數(shù)高達(dá)0.63—— “林”。
我們來看一下林姓的空間分布:沿著福建、廣東沿海,形成了一條非常明顯的狹窄帶狀區(qū)域。
盡管福威鏢局在接班人問題上出現(xiàn)了一些技術(shù)障礙,但總體來說,林姓族人仍然堅守故土,并且在海峽兩岸繁衍出了一系列娛樂圈明星,比如:林志玲、林心如、林志穎、林徽因……
然而,并不是每個氏族都像“姬”“林”那樣安土重遷,可能也有一些特別愿意奔波、愿意去遠(yuǎn)處尋找夢想的。于是,我們又設(shè)計了第三個指數(shù):
奔波指數(shù)=姓氏人均遷徙距離。遷徙距離為戶籍地所在地級市與現(xiàn)居住地所在地級市的距離。
在喜歡奔波的姓氏中,首屈一指的就是——樸,人均遷徙距離達(dá)到900km。嗯,怎么又是樸?
總的來說,作為北方民族的樸姓非常喜歡南遷。對樸姓而言,最受歡迎的目的地有兩個:山東和廣東。這兩個目的地,一個是北部地區(qū)的最南端,一個是天朝的最南端。
奔波指數(shù)第二高的是“廉”姓,人均遷徙距離為600km。
廉姓主要分布于河南、山東、陜西等省,對外遷徙的目的地并沒有明顯偏好。但如果我們把廉姓的遷徙路徑與其它姓氏做比較,相較于其它姓氏向經(jīng)濟(jì)發(fā)達(dá)地區(qū)聚集的趨勢,廉姓似乎對新疆、云南、廣西等西部地區(qū)等興趣要更強(qiáng)一些。
在20大姓中,奔波指數(shù)最高的是“何”,人均遷徙距離在400km左右。
何姓主要分布在四川、廣東兩省。但從遷徙圖上來看,大概是四川太過“安逸”,何姓族人較少從四川遷出;而廣東和長三角地區(qū)的何姓則活躍得多。
以上涉及到的姓氏,廉、樸、覃、麥等,都是一些自帶逼格的小姓。似乎在各種排行中,大姓的特點都并不突出。這也難怪,大姓人多,形形色色的人都有,總體來看就比較平均了。
但是,如果已經(jīng)進(jìn)入到大姓行列,有沒有辦法提高自己或者是子女名字的逼格呢?當(dāng)然姓是不能隨便改的,我們就只能在名字上動腦筋了。于是,我們設(shè)計了第四個指數(shù):
裝逼指數(shù)=名字長度在4字或以上的人口數(shù)量占該姓氏人口數(shù)量的比例。
嚴(yán)格來說,裝逼指數(shù)最高的其實是“歐陽”和“諸葛”。但考慮到復(fù)姓和少數(shù)民族姓氏的逼格并不是裝出來的,我們只好排除掉這些本來就很有逼格的姓氏,只看單字大姓TOP20的裝逼情況:
顯然,“馬”姓的裝逼指數(shù)甩第二名的“高”和“周”一大截,這大概歸功于馬姓有天然的裝逼優(yōu)勢。舉個栗子:如果某國產(chǎn)神劇女主角名字改為“高爾泰•若曦”或者“周爾泰•若曦”,那么男主角還演得下去嗎?
然而,名字長雖然增加逼格,卻會給實際生活增加一些困擾。你能想象“璃瑩殤•安潔莉娜•櫻雪羽晗靈•血麗魑•魅•J•Q•安塔利亞•傷夢薰魅•海瑟薇•薔薇玫瑰淚•羽靈•邪兒•凡多姆海威恩•夏影•琉璃舞•雅•蕾玥璦雅•曦夢月•玥藍(lán)•嵐櫻”被罰抄名字時的心情嗎?
因此,想要彰顯名字的獨特,還可以采用另一種方式:采用生僻字或不常見的漢字組合。我們姑且將此類名字形容為“風(fēng)雅”。
風(fēng)雅指數(shù)=名字中不包括“取名用字頻率TOP1000”的人數(shù)占該姓氏總?cè)藬?shù)的比例。
風(fēng)雅指數(shù)最高的10個姓為:
的確,“程”姓有不少非常風(fēng)雅的名字:程靈素、程蝶衣。但由于擁有這些名字的主人往往都很難堅持到故事結(jié)尾還不領(lǐng)便當(dāng),因此一念出來,總會帶著淡淡的憂傷。
為了沖淡這種淡淡的憂傷,我們最后來看看能撐到最后一集的普通人都是怎么取名的呢?
“取名常用字TOP100”請看下表:
好了,就這樣吧。請轉(zhuǎn)頭看看你身邊的朋友同學(xué)同事或者經(jīng)常給你送快遞的快遞員。hi,小華、小偉、小文、小明、小軍,你們還好嗎?
附:姓氏排行TOP100
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn