第064章 用科學方法解讀紅樓夢(2 / 2)
……
【從部分高頻詞匯角度分析,前八十回和後四十回詞頻有較顯著的差異性,於是我得出初步結論,前八十回和後四十回,作者並不是同一個人。
完成了高頻詞匯的分析後,下麵,我們對虛字進行分析。
虛字,是指不能單獨成句,意義比較抽象,而具有一定語法意義的字或詞。古典小說中的虛字是構成句子必不可少的成分,其使用不受故事情節的製約,僅與作者的寫作習慣有關。
……
我們對44個虛字作為研究對象, 44個虛字如下:之、其、或、亦、方、於……偏、兒。
在研究之前,首先我對監督學習作簡單介紹,監督學習分為回歸分析與分類分析兩大類別,本文應用了分類分析。所謂分類是通過分析已知數據,構造一個分類函數或者分類模型(即分類器),利用該模型將數據庫中數據映射到某一給定類別中……
接下來,我將運用監督學習中的樸素貝葉斯法和b神經網絡對紅樓夢各回作分類研究,並根據分類準確度分析前八十回和後四十回的差異性!】
富旦大學。
張教授身邊,人越聚越多。
「他說的這是啥啊?」
「我怎麼全程都聽不懂?」
「什麼是樸素貝葉斯法?是數學麼?」
「b神經網絡啥意思?生物學?還是計算機?」
「這確定是,在考證《紅樓夢》後四十回是偽作麼?」
「張教授,你能看懂他說的是啥麼?」
「張教授?」
在場的所有教授都傻了,全都看不懂啊。
什麼樸素貝葉斯法,什麼b神經網絡,又什麼折線圖啊,這些文學方麵的大教授們,哪懂這些?
用數學、計算機技術等,去研究文史問題,他們聞所未聞啊。
雖然這樣的研究在前世已經是常規手段,但是這一世的人們哪見過這個?
對於這一世的所有網友來說,對於這些大教授來說,現在已經不是震不震驚的問題了,也不是吐不吐槽的問題了。而是,完全看不懂的問題!
完全看不懂啊!
想吐槽幾句,想罵幾句,都不知道從何開口!
張教授傻了。
視頻裡講解的內容,他聽不懂,傻了!
江小白就是三無的這個真相,他更接受不了,更傻了!
他一時間怔在原地,他的認知上,從來都沒受到過如此重大的沖擊。
……
「臥槽,他怎麼還列上數學式子了呢?」
眾教授連忙再次望向手機屏幕!
【設有輸入變量 x =,有n個可能取值分類型變量 y ={y?,y?,…,yn},則根據貝葉斯定理有: ( y = y0|x?,x?,…,x= ( x?,x?,…,x…
根據最大後驗概率原則,輸出變量應預測n個後驗概率中最大的概率值對應的類別。
……
首先將前八十回標記為類別1,將後四十回標記為類別2,進行樸素貝葉斯分類估計。
……
由表可知,準確率最小值為076000,而最大準確率達1(對測試集分類百分之百正確),平均準確率為091609。
假定兩種分類方式的準確率總體服從正態分布,因為樣本量為1000,屬於大樣本檢驗,因此采用z檢驗。建立假設並進行檢驗:
h0 :μ1 -μ2 ≤ 0
h1:μ1 -μ2 0
……
其中 ,xˉ1 = 091609 ,xˉ2 = 061587 ,s 2 1 = 000192 , s 2 2 = 000746 ……
既然是極顯著大於2的,那麼就說明前八十回與後四十回的分類方式相比於任意一般的分類方式而言,類別之間的差異性更明顯,即前八十回和後四十回文本特征存在顯著的差異。
也就是說,從虛字角度分析,前八十回和後四十回,也不是同一作者的手筆。
因此,無論是從高頻詞匯分析,還是從虛字分析,通過科學方法研究後,我得出以下結論:《紅樓夢》前80回,和後四十回,並不是出自同一人之手。】
彈幕上終於鬆了一口氣:
「終於完事了,腦袋裡全是漿糊,懵了啊!」
「我剛剛究竟看了個啥?」
「全程懵逼中!」
「我突然想噴幾句話,但發現我完全不知道從何噴起。因為我啥啥都沒聽懂啊!」
「視頻還沒結束麼?喲,才進行了三分之二?」
「還沒結束麼?」
【下麵,為了對我的研究成果進行驗證,我們引入b神經網絡。
所謂b神經網絡是一種利用誤差反向傳播算法的人工神經網絡,可以有效的解決很復雜的有大量互相相關的分類問題……】
彈幕,集體崩潰了。
「我靠,又來!」
「神啊,救救我吧。」
「請直接說結論!!」
「蒼了個天!」
……
【樸素貝葉斯分類器平均準確率為091677,方差為000201;而b神經網絡分類器平均準確率為093513,方差為000175。
因此,我的研究成果是沒有問題的。
綜上所述,從高頻詞匯角度研究,我運用各組高頻詞匯頻數變化折線圖。從虛字角度,用了樸素貝葉斯和b神經網絡分類方法,作了組內與組間對照研究。
結果表明,】
視頻中,三無的語氣加重,嚴肅而肯定:
「《紅樓夢》前八十回與後四十回文本特征存在顯著的差異性,即前八十回和後四十回作者不是同一個人!】
短視頻播放完畢!
富旦大學辦公室內,圍觀的眾教授,一頭霧水!
此時此刻,他們和所有網友一樣,都沒看懂。
這個全程運用了統計學、計算機技術等科學手段進行文史研究的方法,對於這一世的人們來說,太超前了。
雖然在前世司空見慣,但是在這一世,所有人是聞所未聞,見所未見!
「三無關於《後出師表》的研究,我聽得明明白白的。但是這個我完全懵了。」
「我完全理解不了他剛剛的內容,是對是錯,完全不明白啊!」
「咱們先別談這個研究哈,張主任,你竟然認識三無,你也太厲害了吧?」
「張主任人脈是廣啊,竟然連三無都認識!」
「原來你的朋友,竟然是大名鼎鼎的三無,哇,你真的是神通廣大啊。」
「張主任,您乾嘛去?」
「張主任?」
張主任突然轉身離去,一路小跑著奔向樓梯,同事的聲音早已來不及回答。
(s:文中公式是錯的,因為正確的公式,字體識別不出來。)